Dr. Charlie's Computing Ideas

Dr. Charles Tang is a certified IT professional who has been in the field since 1979. Most of the computing expressions are from his working experience. It is hoped that new comers in the field could get more formal practice from reading his articles.

Sunday, October 22, 2006

中國文字屬優屬劣 (SING_TAO.020 940725)

中國文字的特性直接椄影響中文電腦的開發。無論是中文造字的法則、書寫文字和口語的特色、以及漢字的優、缺點,中文電腦從業員都需考慮。漢字存在了三數千年,當然有其過人之處,可是它的弱亦不少:字彙太廣、筆劃繁多、字型複雜、同音異字比比皆是等等。 雖然上文說過我們只用上一千個最常用字就能看通一般文章九成,事實上漢字字彙多得驚人!且看下列字典字數:中華大字典(1915年)49905字、康熙字典(1716年)四萬九千字、辭海(1979年)14892字、說文解字(公元一百年)9353字、和新華字典(1971年)八千字。其實,有很多字早已死去;剩下來的,台灣政府規定了採用13051個正體字作為中文電腦的字庫;而中國大陸則訂出6763個簡體字。 中文字的筆劃委實太多,很多都超過十筆;除了在一般書寫時費時失事外,在電腦化時用矩陣點出一個字型也大費周章。 從正面來看,漢字為方塊字,直觀容易;不過對非華人來說,同類型的漢字似是而非,且看下列字例:田、甲、由、申、ゑ、を等,真使外國人如丈八金剛,摸不著頭腦。 有些中文電腦專家雄心萬丈,認為單音節的中文字有利於語音輸入,但中文字同音異字太多,令人頭痛:單就辭海(國音)便有270個YI音字;SHISHI一詞,究竟代表:詩史、史詩、師事、失事、失勢、失時、失實、事實、史實、實施、時時、時式、時事、時勢、適時或誓師呢?人就難以分辨了,試問會否難倒電腦呢?

0 Comments:

Post a Comment

<< Home