设为首页收藏本站

开启辅助访问

Unicode汉字编码表

您所在的位置：网站首页 › 三只小熊不挑食绘本ppt › Unicode汉字编码表

Unicode汉字编码表

#Unicode汉字编码表| 来源: 网络整理| 查看: 265

Unicode

汉字编码表

1 unicode

编码表

Unicode

目前普遍采用的是

UCS-2,

它用两个字节来编码一

个字符

,

比如汉字

"

经

"

的编码是

0x7ECF,

注意字符编码一般

用十六进制来

表示

,

为了与十进制区分

,

十六进制以

0x

开

头

,0x7ECF

转换成十进制就是

32463,UCS-2

用两个字节来编

码字符

,

两个字节就是

16

位二进制

, 2

的

16

次方等于

65536,

所以

UCS-2

最多能编码

65536

个字符。

编码从

0

到

127

的字符与

ASCII

编码的字符一样

,

比如字母

"a"

的

Unicode

编码是

0x0061,

十进制是

97,

而

"a"

的

ASCII

编

码是

0x61,

十进制也是

97,

对于汉字的编码

,

事实上

Unicode

对汉字支持不怎么好

,

这也是没办法的

,

简体和繁体总共有六

七万个汉字

,

而

UCS-2

最多能表示

65536

个

,

才六万多个

,

所以

Unicode

只能排除一些几乎不用的汉字

,

好在常用的简体汉字

也不过七千多个

,

为了能表示所有汉字

,Unicode

也有

UCS-4

规范

,

就是用

4

个字节来编码字符

,

不过现在普遍采用的还是

UCS-2

，只用两个字节来编码

,

看一下

Unicode

对汉字的编

码

:

------------------------------------------------------------------------

2

汉字编码表

U+ 0 1 2 3 4 5 6 7 8 9 A B C D E F

-----------------------------------------------------

4e00

一

丁

丂

七

丄

丅

丆

万

丈

三

上

下

丌

不

与

丏

4e10

丐

丑

丒

专

且

丕

世

丗

丘

丙

业

丛

东

丝

丞

丟

4e20

丠

両

丢

丣

两

严

並

丧

丨

丩

个

丫

丬

中

丮

丯

【本文地址】

今日新闻

推荐新闻

CopyRight 2018-2019 办公设备维修网版权所有豫ICP备15022753号-3