将char转换为short时如何避免0xFF前缀?

How to avoid 0xFF prefix when converting char to short?

当我这样做时:

cout << std::hex << (short)('\x3A') << std::endl;
cout << std::hex << (short)('\x8C') << std::endl;

我希望得到以下输出:

3a
8c

但是,我有:

3a
ff8c

我想这是由于 char 的方式——更准确地说是 signed char——在内存中的存储方式:低于 0x80 的所有内容都会不加前缀;另一方面,0x80 及以上的值将以 0xFF 为前缀。

当给定一个 signed char 时,我如何获得其中实际字符的十六进制表示?换句话说,如何获得 \x3A 的 0x3A 和 \x8C 的 0x8C?

我认为条件逻辑不适合这里。虽然我可以在需要时从结果 short 中减去 0xFF00,但它似乎不是很清楚。

一种更直接的方法是将 signed char 转换为 unsigned char。换句话说,这个:

cout << std::hex << (short)(unsigned char)('\x3A') << std::endl;
cout << std::hex << (short)(unsigned char)('\x8C') << std::endl;

产生预期结果:

3a
8c

虽然不确定这是否特别清楚。

如果您以十进制而不是十六进制查看输出,您的输出可能更有意义:

std::cout << std::dec << (short)('\x3A') << std::endl;
std::cout << std::dec << (short)('\x8C') << std::endl;

输出:

58
-116

值被转换为 short,所以我们(最常见的)处理 16 位值。 -116的16位二进制表示是1111 1111 1000 1100,十六进制变成FF8C。因此,根据您的要求,输出是正确的(在 char 是签名类型的系统上)。 与其说是 char 在内存中的存储方式,不如说是位的解释方式。作为无符号值,8 位模式 1000 1100 表示 -116,转换为 short 应该保留此值,而不是保留位

您想要的十六进制输出 8C 对应(对于 short)十进制值 140。要从 8 位中获取此值,必须将该值解释为无符号的 8 位值(因为最大的带符号 8 位值是 127)。因此,在将数据扩展为某种形式的 short 之前,需要将数据解释为 unsigned char。对于示例代码中的字符文字,这将如下所示。

std::cout << std::hex << (unsigned short)(unsigned char)('\x3A') << std::endl;
std::cout << std::hex << (unsigned short)(unsigned char)('\x8C') << std::endl;

最有可能的是,真正的代码会有变量而不是字符文字。如果是这种情况,那么与其强制转换为 unsigned char,不如将变量声明为 unsigned char 类型可能更方便。 这可能是您无论如何都应该使用的类型, 基于您想要查看其十六进制值这一事实。不确定,但这确实表明该值被简单地视为一个数据字节而不是一个数字,这表明无符号类型是合适的。你看过std::byte了吗?

另一个要抛出的绝妙想法:下面还给出了所需的输出,作为使用 unsigned char 变量的合理复制品。

#include <iostream>

unsigned char operator "" _u (char c) { return c; } // Suffix for unsigned char literals

int main()
{
    std::cout << std::hex << (unsigned short)('\x3A'_u) << std::endl;
    std::cout << std::hex << (unsigned short)('\x8C'_u) << std::endl;
}