1991 年,國際標準化組織 (ISO) 與 Unicode 學術學會決定共同制訂一套適用於多種語文文本的通用編碼標準。此後,該兩個組織一直緊密合作,同步發展
ISO 10646 國際編碼標準及統一碼。國際標準化組織提供 ISO 10646 國際編碼標準內的字符及編碼資料,Unicode
則對這些字符及編碼資料提出應用方法和語義資料作為補充。
ISO 10646 跟統一碼有何關係?
ISO 10646 國際編碼標準與相應版本的統一碼所包含的字符及使用的編碼是相同的,統一碼可視為 ISO 10646 國際編碼標準的實踐版。因此,支援統一碼的產品,亦即支援 ISO 10646 國際編碼標準。
什麼是 ISO 10646 表意文字?
表意文字是指字形與字義具有關係的文字,例如中文字。 ISO 10646 國際編碼標準把所有中文字符及其他語言中近似中文的字符
(例如日語的 Kanzi 和韓語的 Hanja) 統稱為漢字。
ISO 10646 內的漢字歸入三個主要編碼區,即中日韓表意文字區、擴展區 A 及擴展區 B。中日韓表意文字區和擴展區
A 收納於 ISO 10646 國際編碼標準 2000 年版本內,而擴展區 B 則收納於 2001 年版本中。
採用 ISO 10646 擴展區 B 有何好處?
採用 ISO 10646 擴展區 B,能更有效和準確地使用更多通用的中文字符進行日常電子通訊,因為擴展區 B 不但具備擴展區
A 內的中日韓表意文字,更吸納了從各界收集得來的通用中文字符,令表意文字總數增至逾 70,000 個,其中包含了所有收錄在《康熙字典》、《漢語大字典》和《漢語大詞典》內的漢字。
擴展區 B 的位元碼位有何特點?
在結構上,中日韓表意文字區和擴展區 A 的表意文字可用 16 位元碼位組成 (例如:16 進制數值4E00);但擴展區
B 的表意文字則須用 32 位元碼位組成 (例如:16 進制數值 00020000,通常簡化為20000)。
什麼是 IICORE (國際表意文字子集)?
ISO 10646 國際編碼標準現包含的表意文字超過 70,000 個。為這些表意文字制訂子集 (濃縮版),可方便用戶在使用流動裝置等資源有限的設備時,也能應付日常中文電子通訊的需要。
國際標準化組織內的表意文字小組,專責發展 ISO 10646 內的表意文字。該小組已於 2005 年 11 月在「ISO/IEC 10646:2003 第一修訂版」中,公布制訂名為 IICORE (International Ideographs Core) 的國際表意文字子集,內含字符共 9,810 個,適用於記憶體容量、輸入/輸出能力有限的設備,或不便使用整套 ISO 10646 表意文字字集的應用系統。有關 IICORE 的開發資料(只有英文版),可到以下網站查閱:http://www.cse.cuhk.edu.hk/~irg/irg/IICore/IICore.htm。