转换成本
Cost of conversion
首先让我解释一下我将概述的问题的动机。我有一个向量 v
的无符号字,其信息存储在位中,还有一个字 w
可能是不同的无符号类型。我想将 v
中的 len
位放入 w
,从 w
的第 i
个 LSB 开始。例如,考虑下面的情况,为了便于解释,我将单词表示为位。
T1 w = 10110100;
vector<T2> v = [11, 00, 10, 01];
T1 len = 5;
T1 start = 2;
T1 dst_digits = 8;
T1 src_digits = 2;
10110100 -> 10111100 -> 10001100 -> 11001100
很明显,我们需要遍历 v
并将位添加到 w
,一次一个字。一种方法如下
template<class T>
T _blend(T a, T b, T start, T len) {
// Replaces len bits of a by the ones of b starting at start
}
auto it = std::begin(v);
while (len > 0) {
w = _blend(w,
(T1) ((T1) *first) << start),
start,
std::min(len, src_digits)
);
start += std::min(len, src_digits);
++first;
len -= std::min(len, src_digits);
}
我是C++的新手,上面的代码是简化代码,但主要思想是成立的。我目前也有这个工作。但是,我发现 (T1) ((T1) *first) << start)
很难看。但是,如果我不包括第一个转换,移位操作将被提升为 int
或 long
,然后与其他类型的 _blend
不匹配。如果我不包括第二个演员表,我可能 overshift *first
(在 dst_digits > src_digits
和 start > src_digits
的情况下)。
现在,我的问题是两次 (T1)
转换的成本是多少?我的猜测并不像其他事情那样昂贵,例如 std::min
调用或循环中的其他语句。我问只是因为来自 Python,看到像 (T1) ((T1) *first) << start)
这样的东西看起来很不自然,我想知道这是否只是 C++ 的结果,几乎没有开销,是否有只是一种更好的方法。
在小端系统上,无符号整数到无符号整数的转换被转换为零或一条指令。
如果 rax
中有 uint64
,则转换为 uint32
基本上是空操作。编译器将假设该值在 eax
中(rax
的最低有效一半)。
如果 eax
中有一个 uint32
,那么转换为 uint64
只是一个非常快的指令。编译器将零扩展(用零填充最重要的部分)eax
中的值,并使用 movzx
指令将结果放入 rbx
。
在此操作期间,无符号整数转换是您最不关心的问题。您可能需要考虑使用 std::vector<bool>
或 std::bitset
,因为它们会为您完成这些操作。
首先让我解释一下我将概述的问题的动机。我有一个向量 v
的无符号字,其信息存储在位中,还有一个字 w
可能是不同的无符号类型。我想将 v
中的 len
位放入 w
,从 w
的第 i
个 LSB 开始。例如,考虑下面的情况,为了便于解释,我将单词表示为位。
T1 w = 10110100;
vector<T2> v = [11, 00, 10, 01];
T1 len = 5;
T1 start = 2;
T1 dst_digits = 8;
T1 src_digits = 2;
10110100 -> 10111100 -> 10001100 -> 11001100
很明显,我们需要遍历 v
并将位添加到 w
,一次一个字。一种方法如下
template<class T>
T _blend(T a, T b, T start, T len) {
// Replaces len bits of a by the ones of b starting at start
}
auto it = std::begin(v);
while (len > 0) {
w = _blend(w,
(T1) ((T1) *first) << start),
start,
std::min(len, src_digits)
);
start += std::min(len, src_digits);
++first;
len -= std::min(len, src_digits);
}
我是C++的新手,上面的代码是简化代码,但主要思想是成立的。我目前也有这个工作。但是,我发现 (T1) ((T1) *first) << start)
很难看。但是,如果我不包括第一个转换,移位操作将被提升为 int
或 long
,然后与其他类型的 _blend
不匹配。如果我不包括第二个演员表,我可能 overshift *first
(在 dst_digits > src_digits
和 start > src_digits
的情况下)。
现在,我的问题是两次 (T1)
转换的成本是多少?我的猜测并不像其他事情那样昂贵,例如 std::min
调用或循环中的其他语句。我问只是因为来自 Python,看到像 (T1) ((T1) *first) << start)
这样的东西看起来很不自然,我想知道这是否只是 C++ 的结果,几乎没有开销,是否有只是一种更好的方法。
在小端系统上,无符号整数到无符号整数的转换被转换为零或一条指令。
如果 rax
中有 uint64
,则转换为 uint32
基本上是空操作。编译器将假设该值在 eax
中(rax
的最低有效一半)。
如果 eax
中有一个 uint32
,那么转换为 uint64
只是一个非常快的指令。编译器将零扩展(用零填充最重要的部分)eax
中的值,并使用 movzx
指令将结果放入 rbx
。
在此操作期间,无符号整数转换是您最不关心的问题。您可能需要考虑使用 std::vector<bool>
或 std::bitset
,因为它们会为您完成这些操作。