|
《香港增补字符集》的认知
拾遗补漏 香港特有
咩嘢嚟架?
或许你在使用中文电脑时也曾遇过以下情况:当你想把句子变得口语化而加入粤方言特有的用字时,却无法在字库内找到,例如:「嘢」、「嘅」等;收到同事传送来的一份客户联络名单,但当中部分地方名字变成了古怪符号,例如:深水埗的「埗」字、赤鱲角的「鱲」字等。
在《香港增补字符集》制订並公布之前,本地用户在电脑上使用中文字符所面对的问题之一,是常用的中文电脑编码标准,如大五码及 ISO 10646 国际编码标准,并不包括香港有需要使用的特别中文字符,例如人名、地方名,以及粤方言用字。
虽然用户可在电脑的使用者造字区内,自行编制所需的中文字符,但在一部电脑上编制的使用者造字,未必能在其他电脑上使用,导致在电脑间使用中文进行电子通讯及资料交换时,产生资料失误的问题。
电脑上的香港字
为了彻底解决上述问题,香港特别行政区政府与中文界面谘询委员会於 1999 年公布合作编制的《香港增补字符集》(HKSCS),当中涵盖了
4,702 个在香港通用的特别字符。
市民及政府部门共同使用《香港增补字符集》後,便能在各自的电脑上使用同一套包含香港特别中文字的字符集,从而更有效及准确地进行包含这些字符的电子通讯及资料交换。
《香港增补字符集》其後经过再三增补修订,最新版本为《香港增补字符集-2004》,收字共 4,941 个。
《香港增补字符集》演进大追踪
| 1995 |
香港政府为方便部门之间进行电子通讯,发展了一套包含本地特有而政府部门在电脑上需要使用的中文字字符集,名为《政府通用字库》,以补充大五码字集的不足,初期只供政府内部使用,後来放在政府网站供市民下载,以方便市民阅读政府发布的电子化资料。 |
| 1998 |
鉴於市民需要一套共通的本地特有中文字符,前资讯科技署与前法定语文事务署合作修订《政府通用字库》,向各界收集本地特有的中文字符加入其中。 |
| 1999 |
在香港特别行政区政府与中文界面谘询委员会共同努力下,完成修订《政府通用字库》,易名为《香港增补字符集》,收字共
4,702 个,并於同年 9 月公布。 |
| 2001 |
政府公布《香港增补字符集-2001》,较 1999 年版本新增了
116 个中文字,亦在技术上配合国际标准化组织於 2001 年 11 月公布的「ISO/IEC 10646-2:2001」。 |
| 2005 |
政府公布《香港增补字符集-2004》,增收了 123 个字符,在技术上配合国际标准化组织在 2004
年 4 月公布的「ISO/IEC 10646:2003」。「ISO/IEC 10646:2003」及其修订本收纳了《香港增补字符集-2004》的全部字符。
|
《香港增补字符集》知多一点点
现时流行的手提电话及个人数码助理对於《香港增补字符集》中的香港增补字(例如:埗、鰂)支援情况如何?
为针对本地市场,各大生产商如诺基亚和摩托罗拉一直有留意《香港增补字符集》的发展,并在他们的产品上提供香港增补字的支援。他们以往的做法是收纳大五码(第一及第二标准字集)、国标码及《香港增补字符集》当中最常用的字,以及与字库供应商洽谈建造自己专用的字库。生产商会在设计产品时因应产品的特性以及记忆体多寡而决定专用中文字库的大小。但是常用的增补字如埗、鰂,一般都已包括在内。
资料由香港无线发展中心提供
《香港增补字符集》收字小统计
《香港增补字符集-2004》收字共 4,941 个,详情如下:
| 各类符号: |
441 个,包括汉字笔形、汉语拼音字母、国际音标符号、汉字元件、画表符号、日本平假名及片假名等。 |
| 汉字字符: |
4,500 个,其中 3,353 个可在大型字典 (包括《康熙字典》、《汉语大字典》、《汉语大词典》及《中华字海》)
内找到。 |
在 1,147 个大型字典没有收录的字符中,各类字符统计如下:
| 粤方言用字: |
109 个 (主要由司法机构、香港警务处、律政司、香港理工大学、香港语言学学会提供,部分可在粤方言字典或学术着作中找到。) |
| 部首及附形: |
30 个 |
| 科学名词: |
13 个 |
| 专有名称: |
892 个,包括人名、公司名、地方名 (来自入境事务处、公司注册处、税务局和地政总署的资料库,并已确定真正用於现今的人名、公司名和地方名。) |
| 其他: |
103个 (这些字符可在香港较通用的字形产品中找到。) |
|