C语言位运算符

对于更多紧凑的数据，C 程序可以用独立的位或多个组合在一起的位来存储信息。文件访问许可就是一个常见的应用案例。位运算符允许对一个字节或更大的数据单位中独立的位做处理：可以清除、设定，或者倒置任何位或多个位。也可以将一个整数的位模式（bit pattern）向右或向左移动。

整数类型的位模式由一队按位置从右到左编号的位组成，位置编号从 0 开始，这是最低有效位（least significant bit）。例如，考虑字符值'*'，它的 ASCII 编码为 42，相当于二进制的 101010：
位模式　0　0　1　0　1　0　1　0
位位置　7　6　5　4　3　2　1　0

在本例中，值 101010 被表示成一个 8 位的字节内容，因此前面多两个 0。

布尔位运算符

表 1 中列举的运算符可以对操作数的每个位进行布尔运算。这种二元运算符把两个不同操作数内相同位置的位关联起来。被设定的位（也就是值为 1 的位）被解释为 true，被清除的位（也就是值为 0 的位）被解释为 false。

除布尔运算符 AND、OR 和 NOT 以外，也有位异或运算符（exclusive-OR，XOR）。这些都在表 1 进行了列举。

表1 布尔位运算符
运算符	意义	示例	对于每个位位置的结果（1=设定，0=清除）
&	位 AND	x&y	如果 x 和 y 都为 1，则得到 1；如果 x 或 y 任何一个为 0，或都为0，则得到 0
\|	位 OR	x\|y	如果 x 或 y 为 1，或都为 1，则得到 1；如果 x 和 y 都为 0，则得到 0
^	位 XOR	x^y	如果 x 或 y 的值不同，则得到 1；如果两个值相同，则得到 0
~	位 NOT（I的补码）	~x	如果 x 为 0，则得到 1，如果 x 是 1，则得到 0

位运算符的操作数必须是整数类型，并且遵循寻常算术转换（usualarithmetic conversion）。转换后获得的操作数通用类型就是整个计算结果的类型。表 2 展示了这些运算符的效果。

表2 位运算符的效果
表达式（或声明）	位模式
int a=6;	0···00110
int b=11;	0···01011
a&b	0···00010
a\|b	0···01111
a^b	0···01101
~a	1···11001

可以将一个整数 a 的特定位清除，做法是将整数 a 和另一个整数进行位 AND 运算，其中，另一个整数在需要清除的位为 0，其他位则为 1，并位 AND 运算，其中，另一个整数在需要清除的位为 0，其他位则为 1，并将 AND 运算的结果赋值给整数 a。

该另一个整数，即位 AND 运算的第二个操作数，被设定为 1 的位置（称为位掩码），这些位置经过位 AND 运算，不会改变第一个操作数对应位置的值。例如，一个整数与一个位掩码 0xFF 进行位 AND 运算后，将保留最低位置的 8 个位，而会清除其他所有位的值：

a &= OxFF;            // 相当于：a = a & OxFF;

在该示例中，复合赋值运算符 &= 也会执行 & 运算。复合赋值运算符与其他二元位运算符具有类似的执行方式，这里不再赘述。

位运算符也可以用来生成位掩码，以供以后的位运算使用。例如，在位模式 0x20 中，只有位5被设定。因此表达式 ~0x20 会生成一个只有位 5 没有被设定的位掩码：

a &= ~0x20;             // 清除a中的位5

位掩码 ~0x20 比 0xFFFFFFDF 更受欢迎，因为它的可移植性更好：结果不会受到机器字大小的影响（同时也更方便人阅读）。

也可以使用运算符 |（OR）和 ^（XOR）来设定或清除特定位，下面是一个示例：

int mask = OxC;
a |= mask;              // 设定a的位2和位3
a ^= mask;              // 求反a的位2和位3

第二个转换使用相同的位掩码，它会将第一次转换的结果再反转一次。换句话说，b^mask^mask 会得到原来 b 的值。这个操作可以用于交换两个整数的值，而不需要使用第三个临时变量：

a ^= b;                  // 等效于 a = a ^ b;
b ^= a;                 // 将a原来的值赋值给b
a ^= b;                 // 将b原来的值赋值给a

本例中的前两个表达式等同于 b=b^（a^b）或 b=（a^b）^b。其结果等同于 b=a，副作用是 a 的值也被修改了，其修改后的值为 a^b。在这时，第三个表达式具有如下副作用 a=（a^b）^a 或 a=b（使用 a 和 b 的原始值）。

移位运算符

移位运算符将左操作数的位模式移动数个位置，至于移动几个位置，由右操作数指定。它们如表 3 列举。

表3 移位运算符
运算符	意义	示例	结果
<<	向左移位	x<<y	x 的每个位向左移动 y 个位
>>	向右移位	x>>y	x 的每个位向右移动 y 个位

移位运算符的操作数必须是整数。在实际移位操作之前，两个操作数都要进行整数提升（promotion）。右边操作数不可以为负值，并且必须少于左边操作数在整数提升之后的位长。如果不符合这些条件，程序运行结果将无法确定。

移位运算结果的类型等于左操作数在整数提升后的类型。下面示例的移位表达式具有 unsigned long 类型。

unsigned long n = 0xB,     // 位模式： 0 ... 0 0 0 1 0 1 1
         result = 0;
result = n << 2;          //              0 ... 0 1 0 1 1 0 0
result = n >> 2;          //              0 ... 0 0 0 0 0 1 0

在向左移位运算时，右边多出来的位用 0 来填充。移动超出左边边界的位则直接抛弃。向左移动 y 个位置，就等同于将左操作数乘以 2^{y}：如果左操作数 x 是无符号类型，那么表达式 x<<y 的结果等于表达式 x×2^{y} 的值。因此，在前面的例子，n<<2 的值为 n×4，也就是 44。

在向右位移运算时，如果左操作数是无符号类型，或者左操作数是带符号类型但为非负值，则左边多出来的位用 0 来填充。在这种情况下，表达式 x>>y 的结果等效于表达式 x/2^{y} 的值。如果左操作数是负值，那么由编译器决定用于填充至左边多出来的位的内容，可能是 0，也可能是符号位。

// 函数setBit()
// 设定掩码m中p位置的位。
// 使用定义在limits.h中的CHAR_BIT，存储一个字节内的位的数目。
// 返回值： 完成位设定的新掩码，其中p位置已设定好
//              如果p不是有效的位置，则返回原始掩码。

unsigned int setBit( unsigned int mask, unsigned int p )
{
  if ( p >= CHAR_BIT * sizeof(int) )
    return mask;
  else
    return mask | (1<<p);
}

移位运算符的优先级比算术运算符的优先级更低，但相对于比较运算符以及其他的位操作运算符，具有更高的优先级。上例表达式 mask|（1<<p）中的括号必要性不大，主要是让程序代码更容易阅读。

C语言位运算符

布尔位运算符

移位运算符

相关文章