转换成本

Question

首先让我解释一下我将概述的问题的动机。我有一个向量 v 的无符号字，其信息存储在位中，还有一个字 w 可能是不同的无符号类型。我想将 v 中的 len 位放入 w，从 w 的第 i 个 LSB 开始。例如，考虑下面的情况，为了便于解释，我将单词表示为位。

T1 w = 10110100;
vector<T2> v = [11, 00, 10, 01];
T1 len = 5;
T1 start = 2;
T1 dst_digits = 8;
T1 src_digits = 2;

10110100 -> 10111100 -> 10001100 -> 11001100

很明显，我们需要遍历 v 并将位添加到 w，一次一个字。一种方法如下

template<class T>
T _blend(T a, T b, T start, T len) {
    // Replaces len bits of a by the ones of b starting at start
}

auto it = std::begin(v);
while (len > 0) {
    w = _blend(w, 
               (T1) ((T1) *first) << start), 
               start,
               std::min(len, src_digits)
               );
    start += std::min(len, src_digits);
    ++first;
    len -= std::min(len, src_digits);
}

我是C++的新手，上面的代码是简化代码，但主要思想是成立的。我目前也有这个工作。但是，我发现 (T1) ((T1) *first) << start) 很难看。但是，如果我不包括第一个转换，移位操作将被提升为 int 或 long，然后与其他类型的 _blend 不匹配。如果我不包括第二个演员表，我可能 overshift *first（在 dst_digits > src_digits 和 start > src_digits 的情况下）。

现在，我的问题是两次 (T1) 转换的成本是多少？我的猜测并不像其他事情那样昂贵，例如 std::min 调用或循环中的其他语句。我问只是因为来自 Python，看到像 (T1) ((T1) *first) << start) 这样的东西看起来很不自然，我想知道这是否只是 C++ 的结果，几乎没有开销，是否有只是一种更好的方法。

Answer 1

在小端系统上，无符号整数到无符号整数的转换被转换为零或一条指令。

如果 rax 中有 uint64，则转换为 uint32 基本上是空操作。编译器将假设该值在 eax 中（rax 的最低有效一半）。

如果 eax 中有一个 uint32，那么转换为 uint64 只是一个非常快的指令。编译器将零扩展（用零填充最重要的部分）eax 中的值，并使用 movzx 指令将结果放入 rbx。

在此操作期间，无符号整数转换是您最不关心的问题。您可能需要考虑使用 std::vector<bool> 或 std::bitset，因为它们会为您完成这些操作。

转换成本

Cost of conversion

c++

casting

bit-manipulation

bit-shift

type-conversion