Unicode汉字编码表 |
您所在的位置:网站首页 › 三只小熊不挑食绘本ppt › Unicode汉字编码表 |
Unicode 汉字编码表
1 unicode 编码表
Unicode 目前普遍采用的是 UCS-2, 它用两个字节来编码一 个字符 , 比如汉字 " 经 " 的编码是 0x7ECF, 注意字符编码一般 用十六进制来
表示 , 为了与十进制区分 , 十六进制以 0x 开 头 ,0x7ECF 转换成十进制就是 32463,UCS-2 用两个字节来编 码字符 , 两个字节就是 16 位二进制 , 2 的 16 次方等于 65536, 所以 UCS-2 最多能编码 65536 个字符。
编码从 0 到 127 的字符与 ASCII 编码的字符一样 , 比如字母 "a" 的 Unicode 编码是 0x0061, 十进制是 97, 而 "a" 的 ASCII 编 码是 0x61, 十进制也是 97, 对于汉字的编码 , 事实上 Unicode 对汉字支持不怎么好 , 这也是没办法的 , 简体和繁体总共有六 七万个汉字 , 而 UCS-2 最多能表示 65536 个 , 才六万多个 , 所以 Unicode 只能排除一些几乎不用的汉字 , 好在常用的简体汉字 也不过七千多个 , 为了能表示所有汉字 ,Unicode 也有 UCS-4 规范 , 就是用 4 个字节来编码字符 , 不过现在普遍采用的还是 UCS-2 ,只用两个字节来编码 , 看一下 Unicode 对汉字的编 码 : ------------------------------------------------------------------------
2 汉字编码表
U+ 0 1 2 3 4 5 6 7 8 9 A B C D E F ----------------------------------------------------- 4e00 一
丁
丂
七
丄
丅
丆
万
丈
三
上
下
丌
不
与
丏
4e10 丐
丑
丒
专
且
丕
世
丗
丘
丙
业
丛
东
丝
丞
丟
4e20 丠
両
丢
丣
两
严
並
丧
丨
丩
个
丫
丬
中
丮
丯
|
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |