<<  從“暐”这个字說開去 | 首 頁 | Word 2007不顯示圖片解  >>
| 2009-03-23 22:21 | Tags: 語言

這個字在現代漢語詞典裡有兩個解釋,一個是念ě,是“恶心”的“恶”繁體字;另外一個念è,只用在“二噁英”這個詞中。這個詞這幾天因為新聞而備受關注,只不過我關注的點不同罷了。

“噁”是毫無疑問的繁體字,因為按照簡化字的規則,“亞”應該簡化為“亚”,“惡”於是應該簡化為“恶”,這兩個字是簡化字總表第三表裡面都出現的。在按照類推的原則,噁應該是要簡化為[口恶]的,可是很不幸,這個字我又在所有的編碼裡都找不到了。恕我不才。

爲什麽明明是簡化字卻打不出來呢?這得從漢字的編碼說起。

中國大陸有這個幾個常用的編碼:GB2312,共收錄了6763個漢字,這裡面包含了所有常用的簡化字,GBK是GB2312的擴展,包含了21003個漢字(其中CJK 20902個漢字,CJK Ext-A 52個,CJK下文會提到),GB18030包含了27533個漢字(GBK+Ext-A 6582)。除了GB2312,其他編碼裡面的漢字都不一定是標準的中國漢字,很多是日本和韓國特有的,比如日本的“辺”和韓國的“乫”。

臺灣和香港的編碼一般是用BIG5,共收錄了13060個繁體漢字。

後來UNICODE做了個統一的工作,把這麼多地方所使用的漢字統一起來,放在UNICODE裡面,還有個洋氣的名字,“CJK Unified Characters”,編碼的位置是U+4E00-U+9FA6(9FA7之後的幾個不算漢字,只是部首而已)。這些字當然不是漢字的全部,後來來了一個CJK Unified Characters Extention A,裡面收錄了6582個漢字,上面說到的GB18030就是UNICODE這兩個部分的和。後來又來了個CJK Unified Characters Extention B,這個不得了,收錄了42711個漢字,這樣到目前為止,UNICODE共收錄了70195個漢字。

可是在這麼多漢字中,偏偏找不到上一篇博客中提到的“暐”的簡體字和“噁”è的簡體字。這個GB18030是和UNICODE同步的並且是國家強制性標準,於是一方面我們被要求寫簡化字,一方面,我們的電腦打不出簡體字(如果想想這70000多字都按照簡化字的規則去簡化的話,可能又有好幾萬字打不出來)。再仔細看看現代漢語詞典的[口恶],原來他們也是拼起來的,看起來極不協調。

我開始從法的角度懷疑簡體字的合理性了。






  • 我想,传统汉字“噁”和“二⿰口恶英”的“⿰口恶”没什么关系。“噁”早就和“惡”一起合并简化成“恶”了。而“⿰口恶”恐怕是化学界直接在简化字“恶”边加个“口”来当音译用字的,只是这个字没来得及收入字符集。

    好南儿 (http://shanghaian.72pines.com/) 发表于 2009-08-23 20:33:32  [回复]
  •  姓名: 
     邮箱: 
     网址: