生成前缀位掩码

Generating prefix bitmasks

我正在寻找一种可移植的方式来生成 前缀位掩码 ,其中第一个 n 位设置为 0 <= n <= 32(或 64 位或任意整数输入位宽)。

示例:

prefix_bitmask(0)  = 0b00000000000000000000000000000000u
prefix_bitmask(4)  = 0b00000000000000000000000000001111u
prefix_bitmask(32) = 0b11111111111111111111111111111111u

如果我们忽略案例 n == 0n == 32:

,则有两种方法可以工作
// "constructive": set only the required bits
uint32_t prefix_mask1(int i) { return (uint32_t(1) << i) - 1; }
// "destructive": shift unneeded bits out
uint32_t prefix_mask2(int i) { return ~uint32_t(0) >> (32 - i); } 

prefix_mask1 对 32 失败,prefix_mask2 对 0 失败,这都是因为大于整数类型的移位是未定义的行为(因为 CPU 只允许使用移位大小的最低 5 位).

是否有一种“规范”的方法可以在不使用分支的情况下解决这个问题?

((uint32_t) 1 << i/2 << i-i/2) - 1.

上面的作品 uint32_t 可以替换为任何无符号类型。并且不需要其他更改。需要知道类型中的位数 b 和掩码 m = 2b−1 的其他选项包括:

((uint32_t) 1 << (i & m)) - 1 - (i >> b)(来自supercat

和:

((uint32_t) i >> b) ^ 1) << (i & m)) - 1(源自 Matt Timmermans 的建议)。

我觉得挺便携的

#define PREFIX(type, n) (type)(((sizeof(type) * CHAR_BIT - (n)) == sizeof(type) * CHAR_BIT) ? ((type)0) : (!(sizeof(type) * CHAR_BIT - (n)) ? (~(type)(0)) : ((~(type)(0)) << (sizeof(type) * CHAR_BIT - n))))
#define POSTFIX(type, n) (type)(((sizeof(type) * CHAR_BIT - (n)) == sizeof(type) * CHAR_BIT) ? ((type)0) : (!(sizeof(type) * CHAR_BIT - (n)) ? (~(type)(0)) : ((~(type)(0)) >> (sizeof(type) * CHAR_BIT - n))))

#define TEST_TYPE unsigned long long

void printbin(TEST_TYPE x)
{
    TEST_TYPE mask = (TEST_TYPE)1 << (sizeof(x) * CHAR_BIT - 1);
    while(mask)
    {
        printf("%d", !!(x & mask));
        mask >>= 1;
    }
}


int main()
{
    for(int x = 0; x <= sizeof(TEST_TYPE) * CHAR_BIT; x++)
    {
        printbin(PREFIX(TEST_TYPE, x)); printf("\n");
    }
    printf("\n");
    for(int x = 0; x <= sizeof(TEST_TYPE) * CHAR_BIT; x++)
    {
        printbin(POSTFIX(TEST_TYPE, x)); printf("\n");
    }
}

https://godbolt.org/z/_NadkH

您可以将 uint32_t 转换为具有更多位的东西,移动它,然后再转换回来:

uint32_t prefix_mask(int i) {
  return UINT32_MAX & ((UINT64_C(1) << i) - 1);
}

这可以使用 prefix_mask2 想法和算术移位来准备正确的模式,总共有三个指令(假设 CPU 中的移位计数是模字宽):

// minimal instruction dependency (2 cycles), but requires large constant
// that some architectures have trouble generating
uint32_t prefix_mask2a(int i) {
    return ((int32_t) (i + (0x80000000 - 32))) >> ((i ^ 31) & 31);
}

// 3 cycles
uint32_t prefix_mask2b(int i) {
    return (uint32_t) ((int32_t) -i >> 31) >> (-i & 31);
}