|
《香港增補字符集》的認知
拾遺補漏 香港特有
咩嘢嚟架?
或許你在使用中文電腦時也曾遇過以下情況:當你想把句子變得口語化而加入粵方言特有的用字時,卻無法在字庫內找到,例如:「嘢」、「嘅」等;收到同事傳送來的一份客戶聯絡名單,但當中部分地方名字變成了古怪符號,例如:深水埗的「埗」字、赤鱲角的「鱲」字等。
在《香港增補字符集》制訂並公布之前,本地用戶在電腦上使用中文字符所面對的問題之一,是常用的中文電腦編碼標準,如大五碼及 ISO 10646 國際編碼標準,並不包括香港有需要使用的特別中文字符,例如人名、地方名,以及粵方言用字。
雖然用戶可在電腦的使用者造字區內,自行編製所需的中文字符,但在一部電腦上編製的使用者造字,未必能在其他電腦上使用,導致在電腦間使用中文進行電子通訊及資料交換時,產生資料失誤的問題。
電腦上的香港字
為了徹底解決上述問題,香港特別行政區政府與中文界面諮詢委員會於 1999 年公布合作編製的《香港增補字符集》(HKSCS),當中涵蓋了
4,702 個在香港通用的特別字符。
市民及政府部門共同使用《香港增補字符集》後,便能在各自的電腦上使用同一套包含香港特別中文字的字符集,從而更有效及準確地進行包含這些字符的電子通訊及資料交換。
《香港增補字符集》其後經過再三增補修訂,最新版本為《香港增補字符集-2004》,收字共 4,941 個。
《香港增補字符集》演進大追蹤
| 1995 |
香港政府為方便部門之間進行電子通訊,發展了一套包含本地特有而政府部門在電腦上需要使用的中文字字符集,名為《政府通用字庫》,以補充大五碼字集的不足,初期只供政府內部使用,後來放在政府網站供市民下載,以方便市民閱讀政府發布的電子化資料。 |
| 1998 |
鑑於市民需要一套共通的本地特有中文字符,前資訊科技署與前法定語文事務署合作修訂《政府通用字庫》,向各界收集本地特有的中文字符加入其中。 |
| 1999 |
在香港特別行政區政府與中文界面諮詢委員會共同努力下,完成修訂《政府通用字庫》,易名為《香港增補字符集》,收字共
4,702 個,並於同年 9 月公布。 |
| 2001 |
政府公布《香港增補字符集-2001》,較 1999 年版本新增了
116 個中文字,亦在技術上配合國際標準化組織於 2001 年 11 月公布的「ISO/IEC 10646-2:2001」。 |
| 2005 |
政府公布《香港增補字符集-2004》,增收了 123 個字符,在技術上配合國際標準化組織在 2004
年 4 月公布的「ISO/IEC 10646:2003」。「ISO/IEC 10646:2003」及其修訂本收納了《香港增補字符集-2004》的全部字符。
|
《香港增補字符集》知多一點點
現時流行的手提電話及個人數碼助理對於《香港增補字符集》中的香港增補字(例如:埗、鰂)支援情況如何?
為針對本地市場,各大生產商如諾基亞和摩托羅拉一直有留意《香港增補字符集》的發展,並在他們的產品上提供香港增補字的支援。他們以往的做法是收納大五碼(第一及第二標準字集)、國標碼及《香港增補字符集》當中最常用的字,以及與字庫供應商洽談建造自己專用的字庫。生產商會在設計產品時因應產品的特性以及記憶體多寡而決定專用中文字庫的大小。但是常用的增補字如埗、鰂,一般都已包括在內。
資料由香港無線發展中心提供
《香港增補字符集》收字小統計
《香港增補字符集-2004》收字共 4,941 個,詳情如下:
| 各類符號: |
441 個,包括漢字筆形、漢語拼音字母、國際音標符號、漢字元件、畫表符號、日本平假名及片假名等。 |
| 漢字字符: |
4,500 個,其中 3,353 個可在大型字典 (包括《康熙字典》、《漢語大字典》、《漢語大詞典》及《中華字海》)
內找到。 |
在 1,147 個大型字典沒有收錄的字符中,各類字符統計如下:
| 粵方言用字: |
109 個 (主要由司法機構、香港警務處、律政司、香港理工大學、香港語言學學會提供,部分可在粵方言字典或學術著作中找到。) |
| 部首及附形: |
30 個 |
| 科學名詞: |
13 個 |
| 專有名稱: |
892 個,包括人名、公司名、地方名 (來自入境事務處、公司註冊處、稅務局和地政總署的資料庫,並已確定真正用於現今的人名、公司名和地方名。) |
| 其他: |
103個 (這些字符可在香港較通用的字形產品中找到。) |
|