值得你研究的：有符号数和无符号数的强制类型转换-软件开发-鸡啄米

在C/C++中有符号数转化为无符号数会出现一些问题，先看以下的程序例子：

C++代码

int main()
{
char ch[12] = {0xF0, 0xFF, 0xFF, 0x00, 0xF0, 0xFF, 0xFF, 0x0F, 0x00, 0x00, 0x00, 0x00};
unsigned int result = (ch[7] << 8) + ch[6]; // ch[7]为0x0F, ch[6]为0xFF
printf("result(0x%x), ch[7](0x%x), ch[6](0x%x)\n", result, ch[7], ch[6]);
return 0;
}

原本我以为计算结果为 result=0xFFF，但实际的计算结果是result=0xEFF。以下是程序的输出：

有符号数和无符号数的强制类型转换

原来ch[6]在char转成unsigned int时由0xff转为了0xffffffff。它的符号位（最高位）为1，在转换成无符号数时将其他位（第9位至第32位）全置为1。所以最后的计算result的结果不0xFFF而是0xEFF。我们来看一下反汇编，就更加清楚了。

C++代码

unsigned int result = (ch[7] << 8) + ch[6];
00411C68 movsx eax,byte ptr [ebp-0Dh]
00411C6C shl eax,8
00411C6F movsx ecx,byte ptr [ebp-0Eh]
00411C73 add eax,ecx
00411C75 mov dword ptr [ebp-20h],eax

从上面可以看到使用了movsx指令来进行数据的传输。movsx是带符号扩展传送指令，带符号扩展的意思就是将扩展的那些位都用符号位的值来补全。如8位的数据0xff，转换成32位的数据就是0xffffffff（因为它的符号位为1）。如8位的数据0x3a，转换后的值就是0x3a（因为它的符号位为0）。从反汇编后我们看到转换的过程：

1. 将8位的有符号数扩展成32位的有符号数

2. 对扩展后的32位有符号数进行移位和相加操作

3. 将有符号数以无符号数的形式显示

我们看一下不同字节数的无符号数转换例子：

C++代码

int main()
{
unsigned char ch[12] = {0xF0, 0xFF, 0xFF, 0x00, 0xF0, 0xFF, 0xFF, 0x0F, 0x00, 0x00, 0x00, 0x00};
unsigned int result = (ch[7] << 8) + ch[6];
printf("result(0x%x), ch[7](0x%x), ch[6](0x%x)\n", result, ch[7], ch[6]);
return 0;
}

上面的程序就能输出正确的答案result=0xfff，以下是程序运行的结果：

有符号数和无符号数的强制类型转换

那为什么这里输出的结果又是正确的呢？我们来看一下反汇编的结果：

C++代码

unsigned int result = (ch[7] << 8) + ch[6];
00411C68 movzx eax,byte ptr [ebp-0Dh]
00411C6C shl eax,8
00411C6F movzx ecx,byte ptr [ebp-0Eh]
00411C73 add eax,ecx
00411C75 mov dword ptr [ebp-20h],eax

由8位的无符号数转换成32位无符号数使用了movzx（带0扩展传送指令）。在转换的过程中没有eax的第9至32位置为0，所以最后得到正确的结果。

我们将第一个例子改一下，在计算result值的时候先将char类型的ch[7]和ch[6]强制转换为unsigned char看一下最后得到结果会如何。下面是修改后的代码：

C++代码

int main()
{
char ch[12] = {0xF0, 0xFF, 0xFF, 0x00, 0xF0, 0xFF, 0xFF, 0x0F, 0x00, 0x00, 0x00, 0x00};
unsigned int result = (((unsigned char) ch[7]) << 8) + ((unsigned char)ch[6]);
printf("result(0x%x), ch[7](0x%x), ch[6](0x%x)\n", result, (unsigned char)ch[7], (unsigned char)ch[6]);
return 0;
}

最后的结果就根第二个例子的结果一致，是我们想要的结果。我们再来看一下反汇编后的代码：

C++代码

unsigned int result = (((unsigned char) ch[7]) << 8) + ((unsigned char)ch[6]);
00411C68 movzx eax,byte ptr [ebp-0Dh]
00411C6C shl eax,8
00411C6F movzx ecx,byte ptr [ebp-0Eh]
00411C73 add eax,ecx
00411C75 mov dword ptr [ebp-20h],eax

这段反汇编代码与第二个例子的反汇编码一致。由于先将ch[7]强制转为unsigned char，所以传送指令使用了movzx。

来自：johnson4303的专栏

除非特别注明，鸡啄米文章均为原创

转载请标明本文地址：http://www.jizhuomi.com/software/303.html

2013年2月22日

作者:鸡啄米分类:软件开发浏览: 评论:5

鸡啄米

聚焦互联网、数码、软件开发和编程入门的IT休闲吧

值得你研究的：有符号数和无符号数的强制类型转换

分类标签: C＋＋

订阅鸡啄米

站内搜索

分类标签

完全随机文章

最新评论及回复

最近发表