字符集、字符编码编码总结:ANSI、UNICODE、MBCS、ASCII等等 |
您所在的位置:网站首页 › ascii字符集有多少 › 字符集、字符编码编码总结:ANSI、UNICODE、MBCS、ASCII等等 |
目录 一、字符集与字符编码 二、字符集的发展 1. 单字节字符集(SBCS) 2. 多字节字符集(MBCS) 3. 宽字节字符集(Unicode) 三、UTF - Unicode/UCS Transformation Format 1. UTF-8 2. UTF-16 3. UTF-32 四、代码页(Code Page) 五、Unicode编程 一、字符集与字符编码字符集(英文名:Character set)是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、 GB18030字符集、Unicode字符集等。 计算机要准确的处理各种字符集文字,就需要进行字符编码(英文名:Character encoding),以便计算机能够识别和存储各种文字。字符编码也称字集码,是把字符集中的字符编码为指定集合中某一对象(例如:比特模式、自然数序列、8位组或者电脉冲),以便文本在计算机中存储和通过通信网络的传递。常见的编码方式有:ASCII、GB2312、BIG5、Unicode(UCS-2,UCS-4)、UTF-8和BASE64等等。 简单说: 字符集:为每一个「字符」分配一个唯一的 ID(学名为码位 / 码点 / Code Point) 字符编码:将「码位」转换为字节序列的规则(编码/解码 可以理解为 加密/解密 的过程)例如:Unicode 是「字符集」,UTF-8 是「字符编码」。 在Unicode出现以前,字符集与字符编码是没有区分的。例如ASCII、GB2312、GBK、BIG5等等标准即是字符集,也是字符编码。 二、字符集的发展计算机字符集可归类为三种,单字节字符集(SBCS)、多字节字符集(MBCS)和宽字符集(Unicode字符集)。 1. 单字节字符集(SBCS)单字节字符集,称之为SBCS,它的所有字符都只有一个字节的长度。常见字符集有:ASCII码和扩展ASCII码。SBCS字符串由一个零字节结尾,数据类型是char。 ASCII码 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |