Thursday, August 26, 2021

Friday, July 20, 2007

รวมการเฉพาะกิจ เพื่อ patch Firefox

We are trying to make patch for Firefox to call native line breaking API on Mac OS X and Windows. If you are interested in this, please join (It is in Thai language).

[Thai] พอ post blog ได้ไม่นาน. ไม่นานจริงๆนะขนาดมา post blog นี้แล้วยัง download xcode ไม่เสร็จเลย. เก่ง.ws ติดต่อเข้ามาว่าอยากจะต่อ Firefox กับ ATSUI เหมือนกัน. เก่ง.ws กับผมเลยร่วมกันสร้างหน้าวิกิขึ้นมา เพื่อใจได้ share ข้อมูลกัน รวมถึงคำถามคำตอบด้วย. เพื่อมีใครสนใจอีกจะได้เข้ามามีส่วนร่วมได้ง่ายๆ ด้วย. หน้านั้นอยู่ที่ นะครับ. ผมหวังว่าการ share น่าจะทำให้เราทำงานเสร็จได้โดยแต่ละคนไม่เหนื่อย และเหงา (มีปัญหาแล้วไม่รู้จะถามใคร ... แล้วก็ถามตัวเองว่ามานั่งทำอะไรอยู่คนเดียว.) จนเกินไป.

Thursday, July 19, 2007

Firefox 3 + ATSUI

[Tinglish] Since I have read Thep's blog, I have hope on Firefox's (accurately) Thai line breaking on Mac OS X. AFAIK from that blog, we can improve Thai line breaking for Firefox on Mac OS X by just connecting ATSUI to Firefox. Anyways, I think can't do this work by myself. Is there anyone working on this? If yes, I can join you. Even if you don't want me to join, please tell me then I can avoid doing this task. My first goal is building Firefox on Mac OS X. So now I'm reading this I will upgrade my Xcode also.

[Thai] อ่าน blog ของป๋าเทพแล้วก็มีความหวังกับการตัดคำภาษาไทยของ Firefox บน Mac OS X ขึ้นมา. เท่าที่อ่านดูต่อ ATSUI เข้ากับ Firefox ก็จะเป็นอันใช้ได้. แต่ผมคงไม่มีปัญญาทำเสร็จหรอก. อาจจะมีใครทำอยู่แล้วอยากให้ผมช่วยก็บอกกว่าหน่อยนะครับ. หรืออยากทำคนเดียวก็บอกได้อีกเหมือนกัน. ผมจะได้ไม่ต้องทำสบายไป. ตอนนี้สิ่งแรกที่ทำคือพยายามจะ build Firefox บน MAC OS X ให้ได้ก่อน. เลยต้องไปอ่าน กะว่าจะลง Xcode ใหม่ด้วย.

Thursday, May 24, 2007

CakePHP: Donation

Yesterday, I donate 5 USD to Cake Software Foundation. 5 USD = 5 meals (for me, in Thailand). So it is much money :-P

Tuesday, April 17, 2007

For GNU/Linux only

I found that I posted a lot articles about human language technology and etc. here. Thus, I create new blog (and homepage) at And I try to post mostly GNU/Linux and free software related stuff here.

Saturday, March 31, 2007

Converting Orchid corpus to XML

Orchid corpus is a Thai part-of-speech annotated corpus, which is used to be freely available on Nectec's website. (I wish it will become available again.) Since, it has quite unique format so it is quite inconvenient to handle. Therefore I just wrote a script to convert it to XML. Then I can just use a XML parser like pulldom to handle it by using a familiar API e.g. (pull)DOM etc. The example for Orchid corpus format. %metadata %metadata #P1 #1 blaa blaa blaa// blaa/NNNN blaa/NNNN blaa/NNNN // The example XML for Orchid corpus format. <corpus> <document author="abcd" ...> <paragraph> <sentence raw_txt="blaa blaa blaa"> <word surface="blaa" pos="NNNN"/> <word surface="blaa" pos="NNNN"/> <word surface="blaa" pos="NNNN"/> <word surface="blaa" pos="NNNN"/> </sentence> </paragraph> </document> ... </corpus> TEI format is probably suit for this job but I am just to lazy to read the specification.

Wednesday, March 28, 2007

Displaying multilingual text in SVG using Firefox

In Khem's tree editor, SVG is used for displaying tree in Firefox. Firefox 2.x on Windows XP can display English text and Thai text in SVG correctly. But when I try to use Firefox 2.x on Mac OS X, Thai, Bengari and Chinese text became a box as shown below. firefox screenshot
(using this following code) <svg xmlns="" xmlns:xlink="" version="1.1" baseProfile="full"> <text x="50" y="50" font-size="16" fill="blue" > Wikipedia 維基百科 วิกิพีเดีย উইকিপিডিয়া </text> </svg>
Thus, I try to assign a font family to the text as the following code:
<svg xmlns="" xmlns:xlink="" version="1.1" baseProfile="full"> <text x="50" y="50" font-family="Garuda" font-size="16" fill="blue" > Wikipedia 維基百科 วิกิพีเดีย উইকিপিডিয়া </text> </svg>
It works. Firefox can display Thai text correctly. However, Firefox still cannot display Bangari text and Chinese text. As shown below. firefox screenshot I try to use other font families, i.e. Times, Sans and Helvetica but only English text can be displayed.
Creative Commons License
This workis licensed under a Creative Commons Attribution-Noncommercial-Share Alike 3.0 License.