|
混合的统一码码位
“混合的统一码码位”的意思,是指在一个文本文件或数据文件内,同时出现了标准码位和兼容码位的情况。虽然档案是以统一码编码,但相同的字符如同时使用了 Unicode 3.0 私人使用区内的码位(兼容码位)和 Unicode 4.1 非私人使用区内的码位(标准码位),便会令搜索和排序的功能无法达到预期的效果。
下图说明了一个混合的统一码码位的例子:
1. 你在 Windows XP 建立了一份文件,内有“”这个字,编码是 F59B (兼容码位)。
2. 之后,你用 Windows Vista 或 Windows 7 开启该文件,并在文件的其他部分使用仓颉输入法输入相同的“”字,该字的编码会是 29947 (标准码位)。虽然两个字的码位不同,但仍然可以看到两个相同的“”字,因为 Windows Vista 和 Windows 7 内置的细明体字型同时支持“”字的标准码位和兼容码位。
3. 不过,当你尝试在 Windows Vista 或 Windows 7 输入和搜索“”字时,只会找到使用标准码位的“”字。

为了避免出现“混合的统一码码位”问题,你应该把使用了兼容码位的字符,转换为使用标准码位。如欲了解更多有关码位转换的资料,请阅览以下网站:
微软字符代码转换例程
|