将char转换为short时如何避免0xFF前缀？

Question

当我这样做时：

cout << std::hex << (short)('\x3A') << std::endl;
cout << std::hex << (short)('\x8C') << std::endl;

我希望得到以下输出：

3a
8c

但是，我有：

3a
ff8c

我想这是由于 char 的方式——更准确地说是 signed char——在内存中的存储方式：低于 0x80 的所有内容都会不加前缀；另一方面，0x80 及以上的值将以 0xFF 为前缀。

当给定一个 signed char 时，我如何获得其中实际字符的十六进制表示？换句话说，如何获得 \x3A 的 0x3A 和 \x8C 的 0x8C？

我认为条件逻辑不适合这里。虽然我可以在需要时从结果 short 中减去 0xFF00，但它似乎不是很清楚。

Answer 1

一种更直接的方法是将 signed char 转换为 unsigned char。换句话说，这个：

cout << std::hex << (short)(unsigned char)('\x3A') << std::endl;
cout << std::hex << (short)(unsigned char)('\x8C') << std::endl;

产生预期结果：

3a
8c

虽然不确定这是否特别清楚。

Answer 2

如果您以十进制而不是十六进制查看输出，您的输出可能更有意义：

std::cout << std::dec << (short)('\x3A') << std::endl;
std::cout << std::dec << (short)('\x8C') << std::endl;

输出：

58
-116

值被转换为 short，所以我们（最常见的）处理 16 位值。 -116的16位二进制表示是1111 1111 1000 1100，十六进制变成FF8C。因此，根据您的要求，输出是正确的（在 char 是签名类型的系统上）。 与其说是 char 在内存中的存储方式，不如说是位的解释方式。作为无符号值，8 位模式 1000 1100 表示 -116，转换为 short 应该保留此值，而不是保留位

您想要的十六进制输出 8C 对应（对于 short）十进制值 140。要从 8 位中获取此值，必须将该值解释为无符号的 8 位值（因为最大的带符号 8 位值是 127）。因此，在将数据扩展为某种形式的 short 之前，需要将数据解释为 unsigned char。对于示例代码中的字符文字，这将如下所示。

std::cout << std::hex << (unsigned short)(unsigned char)('\x3A') << std::endl;
std::cout << std::hex << (unsigned short)(unsigned char)('\x8C') << std::endl;

最有可能的是，真正的代码会有变量而不是字符文字。如果是这种情况，那么与其强制转换为 unsigned char，不如将变量声明为 unsigned char 类型可能更方便。 这可能是您无论如何都应该使用的类型， 基于您想要查看其十六进制值这一事实。不确定，但这确实表明该值被简单地视为一个数据字节而不是一个数字，这表明无符号类型是合适的。你看过std::byte了吗？

另一个要抛出的绝妙想法：下面还给出了所需的输出，作为使用 unsigned char 变量的合理复制品。

#include <iostream>

unsigned char operator "" _u (char c) { return c; } // Suffix for unsigned char literals

int main()
{
    std::cout << std::hex << (unsigned short)('\x3A'_u) << std::endl;
    std::cout << std::hex << (unsigned short)('\x8C'_u) << std::endl;
}

将char转换为short时如何避免0xFF前缀？

How to avoid 0xFF prefix when converting char to short?

c++

storage

hex