c语言中 char* 和 unsigned char* 的区别浅析

您所在的位置:网站首页 char可以输出中文吗 c语言中 char* 和 unsigned char* 的区别浅析

c语言中 char* 和 unsigned char* 的区别浅析

2023-07-24 08:28| 来源: 网络整理| 查看: 265

背景

最近在项目中遇到了一个编译警告,是因为定义的变量为char[],而在使用时作为函数的unsigned char*类型的参数调用。这个警告很容易避免,但是char*和unsigned char*到底有什么区别呢,本文作一个简单的探讨。

char 和 unsigned char 的区别

在C中,默认的基础数据类型均为signed,如定义变量为int,long等,都为有符号的。如果要定义无符号类型,必须显式地在变量类型前加unsigned。

char vs unsigned char 相同点:在内存中都是一个字节,8位(2^8=256),都能表示256个数字 不同点:char的最高位为符号位,因此char能表示的数据范围是-128~127,unsigned char没有符号位,因此能表示的数据范围是0~255

实际使用中,如普通的赋值,读写文件和网络字节流都没有区别,不管最高位是什么,最终的读取结果都一样,在屏幕上面的显示可能不一样。

但是要把一个char类型的变量赋值给int、long等数据类型或进行类似的强制类型转换时时,系统会进行类型扩展,这时区别就大了。对于char类型的变量,系统会认为最高位为符号位,然后对最高位进行扩展,即符号扩展。若最高位为1,则扩展到int时高位都以1填充。对于unsigned char类型的变量,系统会直接进行无符号扩展,即0扩展。扩展的高位都以0填充。所以在进行类似的操作时,如果char和unsigned char最高位都是0,则结果是一样的,若char最高位为1,则结果会大相径庭。

可以使用的下面的小程序验证一下:

#include static void func(unsigned char uc) { char c; int i, j; unsigned int ui, uj; c = uc; i = (int)c; j = (int)uc; ui = (unsigned int)c; uj =(unsigned int)uc; printf("%%c: %c, %c\n", c, uc); printf("%%x: %x, %x\n", c, uc); printf("%%u: %u, %u\n", ui, uj); printf("%%d: %d, %d\n", i, j); } int main(int argc, char *argv[]) { func(0x80); func(0x7f); return 0; }

运行结果如下:

%c: �, � %x: ffffff80, 80 %u: 4294967168, 128 %d: -128, 128 --------------------------- %c:, %x: 7f, 7f %u: 127, 127 %d: 127, 127

对于char来说,0x80用二进制表示为1000 0000,当它作为char赋值给unsigned int或 int 时,系统认为最高位是符号位,会对最高位进行扩展。而0x7F用二进制表示为0111 1111,最高位为0,不会扩展。对于unsigned char来说,不管最高位是0,还是1,都不会做扩展。

char* 和 unsigned char*的区别

char* 和 unsigned char* 也具有类似的区别,如下面测试程序所示:

#include int main(int argc, char *argv[]) { unsigned char k = 0; int i = -1; short a = -12345; char *p; unsigned char *q; printf("sizeof(i) = %d\n",sizeof(i)); printf("sizeof(a) = %d\n",sizeof(a)); printf("-----------------------------\n"); printf("begin p(char):\n"); p = (char*)&a; printf("a = %u | %d\n",a,a); for(k=0;k0u ? "true":"false")); printf("-----------------------------\n"); printf("begin q(unsigned char):\n"); q = (unsigned char*)&a; printf("a = %u | %d\n",a,a); for(k=0;k0u ? "true":"false")); return 0; }

输出结果为:

sizeof(i) = 4 sizeof(a) = 2 ----------------------------- begin p(char): a = 4294954951 | -12345 0xffffffc7 0xffffffcf i = 4294967295 | -1 0xffffffff 0xffffffff 0xffffffff 0xffffffff -1 > 0u: true ----------------------------- begin q(unsigned char): a = 4294954951 | -12345 0xc7 0xcf i = 4294967295 | -1 0xff 0xff 0xff 0xff -1 > 0u: true

char*是有符号的,如果大于127即0x7F的数就是负数了,使用%x格式化输出,系统自动进行了符号扩展,就会产生变化。

所以在涉及到类型提升的上下文中,要注意使用char*和unsinged char*的区别。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3