首页 > 解决方案 > C - 按位连接导致信息丢失

问题描述

我有五个短类型变量,我想将它们连接成 32 位 unsigned int 类型。我需要连接五个短变量。这些变量的名称称为 opcode(5 位)、reg1(4 位)、reg2(4 位)、reg3(4 位)、extension(3 位)和 addr_constant(12 位)。现在我的代码不适用于我不知道为什么的一种情况。我在下面列出了我的代码。

这段代码的目的是将某些值转换为 32 位机器指令,这意味着即使我得到了等价的值,我仍然需要一个 32 位指令。

...
unsigned int *const word;
unsigned short opcode = 1;
unsigned short reg1 = 3; 
unsigned short reg2 = 4;
unsigned short reg3 = 5;
unsigned short extension = 0;
unsigned int addr_constant = 0;

unsigned int machine_word = 0;
machine_word = machine_word | (opcode << 27);
machine_word = machine_word | (reg1 << 23);
machine_word = machine_word | (reg2 << 19);
machine_word = machine_word | (reg3 << 15);

machine_word = machine_word | (extension << 12);
machine_word = machine_word | addr_constant;

*word = machine_word
return 0;
...

二进制形式的输出应该是:

0000 1001 1010 0010 1000 0000 0000 0000.

但现在是:

1001 1010 0010 1000 0000 0000 0000. 

如您所见,它错过了前 4 个零。

在下面的测试中,“word”是:unsigned int *const word。在上面代码的最后,我写了“*word = machine_word”。在测试中,它比较:“word == 0x09a28000” 我没有通过以下测试。

assert(word == 0x09a28000);

标签: cbit-manipulationbitwise-operatorsbit-shiftbitwise-or

解决方案


只需使用位域——它们就是为此而设计的。

struct all_the_things {
  unsigned opcode : 5;
  unsigned reg1 : 4;
  unsigned reg2 : 4;
  unsigned reg3 : 4;
  unsigned extension : 3;
  unsigned addr_constant : 12;
};

一旦你填充了这样一个结构,你可以将它转换为一个 32 位整数,如下所示:

uint32_t num;
memcpy(&num, &things, 4);

(不用担心,优化编译器不会真正调用函数来复制 4 个字节。)


推荐阅读