中國文字屬優屬劣 (SING_TAO.020 940725)
中國文字的特性直接椄影響中文電腦的開發。無論是中文造字的法則、書寫文字和口語的特色、以及漢字的優、缺點,中文電腦從業員都需考慮。漢字存在了三數千年,當然有其過人之處,可是它的弱亦不少:字彙太廣、筆劃繁多、字型複雜、同音異字比比皆是等等。 雖然上文說過我們只用上一千個最常用字就能看通一般文章九成,事實上漢字字彙多得驚人!且看下列字典字數:中華大字典(1915年)49905字、康熙字典(1716年)四萬九千字、辭海(1979年)14892字、說文解字(公元一百年)9353字、和新華字典(1971年)八千字。其實,有很多字早已死去;剩下來的,台灣政府規定了採用13051個正體字作為中文電腦的字庫;而中國大陸則訂出6763個簡體字。 中文字的筆劃委實太多,很多都超過十筆;除了在一般書寫時費時失事外,在電腦化時用矩陣點出一個字型也大費周章。 從正面來看,漢字為方塊字,直觀容易;不過對非華人來說,同類型的漢字似是而非,且看下列字例:田、甲、由、申、ゑ、を等,真使外國人如丈八金剛,摸不著頭腦。 有些中文電腦專家雄心萬丈,認為單音節的中文字有利於語音輸入,但中文字同音異字太多,令人頭痛:單就辭海(國音)便有270個YI音字;SHISHI一詞,究竟代表:詩史、史詩、師事、失事、失勢、失時、失實、事實、史實、實施、時時、時式、時事、時勢、適時或誓師呢?人就難以分辨了,試問會否難倒電腦呢?
0 Comments:
Post a Comment
<< Home