1991 年,国际标准化组织 (ISO) 与 Unicode 学术学会决定共同制订一套适用於多种语文文本的通用编码标准。此後,该两个组织一直紧密合作,同步发展
ISO 10646 国际编码标准及统一码。国际标准化组织提供 ISO 10646 国际编码标准内的字符及编码资料,Unicode
则对这些字符及编码资料提出应用方法和语义资料作为补充。
ISO 10646 跟统一码有何关系?
ISO 10646 国际编码标准与相应版本的统一码所包含的字符及使用的编码是相同的,统一码可视为 ISO 10646 国际编码标准的实践版。因此,支援统一码的产品,亦即支援 ISO 10646 国际编码标准。
什么是 ISO 10646 表意文字?
表意文字是指字形与字义具有关系的文字,例如中文字。 ISO 10646 国际编码标准把所有中文字符及其他语言中近似中文的字符
(例如日语的 Kanzi 和韩语的 Hanja) 统称为汉字。
ISO 10646 内的汉字归入三个主要编码区,即中日韩表意文字区、扩展区 A 及扩展区 B。中日韩表意文字区和扩展区
A 收纳於 ISO 10646 国际编码标准 2000 年版本内,而扩展区 B 则收纳於 2001 年版本中。
采用 ISO 10646 扩展区 B 有何好处?
采用 ISO 10646 扩展区 B,能更有效和准确地使用更多通用的中文字符进行日常电子通讯,因为扩展区 B 不但具备扩展区
A 内的中日韩表意文字,更吸纳了从各界收集得来的通用中文字符,令表意文字总数增至逾 70,000 个,其中包含了所有收录在《康熙字典》、《汉语大字典》和《汉语大词典》内的汉字。
扩展区 B 的位元码位有何特点?
在结构上,中日韩表意文字区和扩展区 A 的表意文字可用 16 位元码位组成 (例如:16 进制数值4E00);但扩展区
B 的表意文字则须用 32 位元码位组成 (例如:16 进制数值 00020000,通常简化为20000)。
什么是 IICORE (国际表意文字子集)?
ISO 10646 国际编码标准现包含的表意文字超过 70,000 个。为这些表意文字制订子集 (浓缩版),可方便用户在使用流动装置等资源有限的设备时,也能应付日常中文电子通讯的需要。
国际标准化组织内的表意文字小组,专责发展 ISO 10646 内的表意文字。该小组已於 2005 年 11 月在「ISO/IEC
10646:2003 第一修订版」中,公布制订名为 IICORE (International Ideographs
Core) 的国际表意文字子集,内含字符共 9,810 个,适用於记忆体容量、输入/输出能力有限的设备,或不便使用整套
ISO 10646 表意文字字集的应用系统。有关 IICORE 的开发资料(只有英文版),可到以下网站查阅:http://www.cse.cuhk.edu.hk/~irg/irg/IICore/IICore.htm。