香港特別行政區政府
共通中文界面網站


[圖像版本] [简体版] [English version] [網頁指南]


《香港增補字符集》的認知

拾遺補漏圖香港特有

咩嘢嚟架?

或許你在使用中文電腦時也曾遇過以下情況:當你想把句子變得口語化而加入粵方言特有的用字時,卻無法在字庫內找到,例如: 「嘢」、「嘅」等;收到同事傳送來的一份客戶聯絡名單,但當中部分地方名字變成了古怪符號,例如:深水埗的「埗」字、赤鱲角的「鱲」字等。

在《香港增補字符集》制訂並公布之前,本地用戶在電腦上使用中文字符所面對的問題之一,是常用的中文電腦編碼標準,如大五碼及 ISO 10646 國際編碼標準,並不包括香港有需要使用的特別中文字符,例如人名、地方名,以及粵方言用字。

雖然用戶可在電腦的使用者造字區內,自行編製所需的中文字符,但在一部電腦上編製的使用者造字,未必能在其他電腦上使用, 導致在電腦間使用中文進行電子通訊及資料交換時,產生資料失誤的問題。

電腦上的香港字

為了徹底解決上述問題,香港特別行政區政府與中文界面諮詢委員會於 1999 年公布合作編製的《香港增補字符集》(HKSCS),當中涵蓋了 4,702 個在香港通用的特別字符。

市民及政府部門共同使用《香港增補字符集》後,便能在各自的電腦上使用同一套包含香港特別中文字的字符集,從而更有效及準確地進行包含這些字符的電子通訊及資料交換。

《香港增補字符集》其後經過再三增補修訂,最新版本為《香港增補字符集-2008》,收字共 5,009 個。

《香港增補字符集》演進大追蹤

1995 香港政府為方便部門之間進行電子通訊,發展了一套包含本地特有而政府部門在電腦上需要使用的中文字字符集,名為《政府通用字庫》,以補充大五碼字集的不足,初期只供政府內部使用,後來放在政府網站供市民下載,以方便市民閱讀政府發布的電子化資料。
1998 鑑於市民需要一套共通的本地特有中文字符,前資訊科技署與前法定語文事務署合作修訂《政府通用字庫》,向各界收集本地特有的中文字符加入其中。
1999 在香港特別行政區政府與中文界面諮詢委員會共同努力下,完成修訂《政府通用字庫》,易名為《香港增補字符集》,收字共 4,702 個,並於同年 9 月公布。
2001 政府公布《香港增補字符集-2001》,較 1999 年版本新增了 116 個中文字,亦在技術上配合國際標準化組織於 2001 年 11 月公布的「ISO/IEC 10646-2:2001」。
2005

政府公布《香港增補字符集-2004》,增收了 123 個字符,在技術上配合國際標準化組織在 2004 年 4 月公布的「ISO/IEC 10646:2003」。「ISO/IEC 10646:2003」及其修訂版收納了《香港增補字符集-2004》的全部字符。

2009

政府公布《香港增補字符集-2008》,增收了 68 個字符,在技術上配合國際標準化組織在二零零五年十一月和二零零九年十月公布的「ISO/IEC 10646:2003」第一及第六修訂版 。「ISO/IEC 10646:2003」及其第一至第六修訂版收納了《香港增補字符集-2008》全部的字符。

《香港增補字符集》知多一點點

現時流行的手提電話及個人數碼助理對於《香港增補字符集》中的香港增補字(例如:埗、鰂)支援情況如何?

為針對本地市場,各大生產商如諾基亞和摩托羅拉一直有留意《香港增補字符集》的發展,並在他們的產品上提供香港增補字的支援。他們以往的做法是收納大五碼(第一及第二標準字集)、國標碼及《香港增補字符集》當中最常用的字,以及與字庫供應商洽談建造自己專用的字庫。生產商會在設計產品時因應產品的特性以及記憶體多寡而決定專用中文字庫的大小。但是常用的增補字如埗、鰂,一般都已包括在內。

資料由香港無線發展中心提供

《香港增補字符集》字符的分類

《香港增補字符集-2008》共收錄 5,009 個字符,當中絕大部分為中文字符(共 4,568 個,佔總數91%)。這些字符大多可在大型字典(包括《康熙字典》、《漢語大字典》、《漢語大詞典》、《中華字海》)找到。由於每個中文字符都可作不同用途,因此《香港增補字符集-2008》沒有為每個字符作詳細分類。不過,這四千五百多個字符大體上可歸入以下類別︰

    專有名詞用字,如人名、地名、公司名稱

    粵方言用字

    科學名詞用字

    部首或部件

這些字符主要由政府部門(如律政司、稅務局、司法機構、地政總署、香港警務處、入境事務處、公司註冊處)、學術組織、教育機構,以及一般市民建議收錄。

至於餘下的 441 個字符,則屬各類符號,包括漢字部件、漢語拼音字母、國際音標符號、日本平假名和片假名等。

 
上一頁 返回頁首

[主頁]


免責聲明