转换成本

Cost of conversion

首先让我解释一下我将概述的问题的动机。我有一个向量 v 的无符号字,其信息存储在位中,还有一个字 w 可能是不同的无符号类型。我想将 v 中的 len 位放入 w,从 w 的第 i 个 LSB 开始。例如,考虑下面的情况,为了便于解释,我将单词表示为位。

T1 w = 10110100;
vector<T2> v = [11, 00, 10, 01];
T1 len = 5;
T1 start = 2;
T1 dst_digits = 8;
T1 src_digits = 2;

10110100 -> 10111100 -> 10001100 -> 11001100 

很明显,我们需要遍历 v 并将位添加到 w,一次一个字。一种方法如下

template<class T>
T _blend(T a, T b, T start, T len) {
    // Replaces len bits of a by the ones of b starting at start
}

auto it = std::begin(v);
while (len > 0) {
    w = _blend(w, 
               (T1) ((T1) *first) << start), 
               start,
               std::min(len, src_digits)
               );
    start += std::min(len, src_digits);
    ++first;
    len -= std::min(len, src_digits);
}

我是C++的新手,上面的代码是简化代码,但主要思想是成立的。我目前也有这个工作。但是,我发现 (T1) ((T1) *first) << start) 很难看。但是,如果我不包括第一个转换,移位操作将被提升为 intlong,然后与其他类型的 _blend 不匹配。如果我不包括第二个演员表,我可能 overshift *first(在 dst_digits > src_digitsstart > src_digits 的情况下)。

现在,我的问题是两次 (T1) 转换的成本是多少?我的猜测并不像其他事情那样昂贵,例如 std::min 调用或循环中的其他语句。我问只是因为来自 Python,看到像 (T1) ((T1) *first) << start) 这样的东西看起来很不自然,我想知道这是否只是 C++ 的结果,几乎没有开销,是否有只是一种更好的方法。

在小端系统上,无符号整数到无符号整数的转换被转换为零或一条指令。

如果 rax 中有 uint64,则转换为 uint32 基本上是空操作。编译器将假设该值在 eax 中(rax 的最低有效一半)。

如果 eax 中有一个 uint32,那么转换为 uint64 只是一个非常快的指令。编译器将零扩展(用零填充最重要的部分)eax 中的值,并使用 movzx 指令将结果放入 rbx

在此操作期间,无符号整数转换是您最不关心的问题。您可能需要考虑使用 std::vector<bool>std::bitset,因为它们会为您完成这些操作。