某汉字的机内码(十六进制)怎么算

您所在的位置:网站首页 机内码和国标码的 某汉字的机内码(十六进制)怎么算

某汉字的机内码(十六进制)怎么算

2023-12-16 13:16| 来源: 网络整理| 查看: 265

机内码 国标码:是指我国1981年公布的“中华人民共和国国家标准信息交换汉字编码”,代号为“gb2312-80”。由连续的两个字节组成。

2.机内码:在计算机内表示汉字的代码是汉字机内码,汉字机内码由国标码演化而来,把表示国标码的两个字节的最高位分别加“1”,就变成汉字机内码

3.输入码:汉字输入码是指直接从键盘输入的各种汉字输入方法的编码,属于外码。

4.字型点阵码:用点阵方式来构造汉字字型,然后存储在计算机内,构成汉字字模库。目的是为了能显示和打印汉字。

(1)区位码先转换成十六进制数表示(2)(区位码的十六进制表示)+2020h=国标码;(3)国标码+8080h=机内码

汉字的机内码是指在计算机中表示一个汉字的编码。机内码与区位码稍有区别。汉字区位码的区码和位码的取值均在1~94之间,如直接用区位码作为机内码,就会与基本ascii码混淆。为了避免机内码与基本ascii码的冲突,需要避开基本ascii码中的控制码(00h~1fh),还需与基本ascii码中的字符相区别。为了实现这两点,可以先在区码和位码分别加上20h,在此基础上再加80h(此处“h”表示前两位数字为十六进制数)。经过这些处理,用机内码表示一个汉字需要占两个字节,分别 称为高位字节和低位字节,这两位字节的机内码按如下规则表示: 高位字节=区码+20h+80h(或区码+a0h) 低位字节=位码+20h+80h(或位码+aoh) 由于汉字的区码与位码的取值范围的十六进制数均为01h~5eh(即十进制的01~94),所以汉字的高位字节与低位字节的取值范围则为a1h~feh(即十进制的161~254)。 例如,汉字“啊”的区位码为1601,区码和位码分别用十六进制表示即为1001h,它的机内码的高位字节为b0h,低位字节为a1h,机内码就是b0a1h。

2603 = 1a03h 区位码

+ a0a0h

= baa3h 机内码

汉字的编码知识 信息编码各国有各国不同的编码,国际上统一使用的编码为ascii(美国标准信息交换代码),我国使用的有国标码bg(中文),和big5(中文繁体)两种。

附带要知道:中文字库(字库文件名,大小,扩展名,存放位置) 中文输入方法(语音输入,键盘输入,手写输入,扫描输入等)

1.汉字的编码

(1)国标码:是指我国1980年公布的“信息交换汉字编码字符集”,代号为“gb2312-80”。由连续的两个字节组成。

(2)机内码:在计算机内表示汉字的代码是汉字机内码,汉字机内码由国标码演化而来,把表示国标码的两个字节的最高位分别加“1”,就变成汉字机内码。

(3)输入码:汉字输入码是指直接从键盘输入的各种汉字输入方法的编码,属于外码。

(4)字型点阵码:用点阵方式来构造汉字字型,然后存储在计算机内,构成汉字字模库。目的是为了能显示和打印汉字。

编码的转换举例 汉字 区位码 16进制 国标码 机内码 文 4636 2e24h 4e44h cec4h

“文”的区位码为4636,区码和位码分别用16进制表示即为“2e24h”, 0010 1110 0010 0100转换成国标码“4e44h”,0100 1110 0100 0100机内码为“cec4h”, 1100 1110 1100 0100

2.汉字的输入方法

汉字输入方法目前有两大类四种。

(1)键盘输入法。这是最常用的,利用各种汉字输入方法的编码敲击键盘来输入汉字;

(2)非键盘输入法。目前主要有三种方法。

手写笔输入法:利用汉字识别技术,通过书写笔在感应板上书写汉字把其输入的方法。

语音输入法:利用语音识别技术,通过口说来输入汉字。

扫描识别输入,是将印或写在纸上的汉字通过扫描仪输入计算机,再经相应软件处理后转换成汉字机内码。

3.汉字字符集的概念

有两种汉字字符集。

(1)国标码字符集gb2312-80:该字符集收录了6763个常用汉字,其中一级汉字3755个,二级汉字3008个。另外还收录了各种符号682个,合计7445个。

(2)gbk汉字集:gbk即汉字扩充内码规范,又称大字符集,一共收录了20900个汉字。在windows简体中文版中,又增加了101个补充字,一共有21001个字。它包容了gb2312-80的6763个常用汉字,台湾big5码收录了13000多个汉字,是目前见到的收录汉字最多的汉字系统



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3