使用适当的数据类型是好的做法吗?

Is it good practice to use appropriate data types?

这可能是一个愚蠢的问题,但这里是:

我不确定这是习惯、懒惰还是正确的做法。但是我发现自己使用了一些我根本不需要使用的数据类型,为了保持一致性,并使以后的代码更容易一些(即转换数据类型)。

举个例子:

public int Number1 { get; set; }

Number1 只是一个普通的整数,但想象一下它总是(或者必须是)的情况数字,所以我实际上可以使用 uint 而不是 int。

但是,使用大量不同数据类型的问题之一是必须使用显式转换的风险,所以我会有很多嘈杂的代码。使用 int 等常见数据类型有助于减少噪音,但与转换相比,这会对应用程序的整体性能产生任何影响吗?

int one = 2;
uint two = 1;

one = (int)two;

这种噪音不一定是坏事,但可能令人沮丧。也可能存在 uint 可能高于 int 的最大值的问题。

我发现在很多例子中,int 似乎是一种非常常用的处理整数的数据类型,我很少看到其他数据类型被使用。这是为什么?

使用 'incorrect' 数据类型有什么问题吗,使用 int 比 uint 或 short ect 效率更高吗?

提前致谢。

最佳做法不是简单地根据您要表示的实体的性质使用有符号或无符号数字,而是实际上声明一个全新的数据类型 对于您正在处理的每种不同类型的实体。

因此,例如,温度需要一个带符号的数字,但最佳做法是声明一个新的 "Temperature" 值类型。 (struct Temperature)

C# 的美妙之处在于:

  1. 如果您的 struct Temperature 只包含一个 float,它将占用与 float 一样多的内存,并且与 [=12] 一样高效=]. (整个 struct 将在寄存器中传递,就像 float 一样。)

  2. 您可以重载运算符,包括类型转换运算符,包括隐式类型转换运算符,所以如果您的温度需要与其他类型的运算符自由互换实体,您可以重载适当的运算符并在没有任何类型转换的情况下实现这一点。 (参见 https://msdn.microsoft.com/en-us/library/85w54y0a.aspx

但是,应该注意的是,数据类型之间的自由互换性违背了最初将它们声明为单独数据类型的目的。您应该做的是将尽可能多的操作封装在类型本身中,以尽量减少需要将类型转换为其他类型的情况。

修正

为您处理的每种不同类型的量定义特殊数据类型的做法源自并符合物理学家的做法,即始终遵循方程式的每一项及其单位学期。因此,长度绝不仅仅是一个普通的 5 值,它始终是一个 5 metres 值(在 SI 中),而且加速度也绝不仅仅是一个普通的 9.8 值,它始终是一个 9.8 metres per second squared值。这往往会在犯错误时非常明显,从而将错误发生的可能性降到最低。例如,尝试在期望米的方程中使用以厘米为单位的值,并且(更重要的是)尝试在期望加速度值的方程中使用速度值。有关此的更多信息,例如,请参见:https://physics.stackexchange.com/q/138841

使错误明显也是匈牙利表示法的初衷(参见https://en.wikipedia.org/wiki/Hungarian_notation),尽管当时用 C 语言为每种值定义不同的数据类型并维护是不可能的表现。所以,他们只是摆弄了变量的名称。

使用像 C# 这样的现代语言,我们终于可以声明我们自己的高效类型,这样数据类型替换错误不仅更容易发现,而且实际上不可能犯。

在查看性能之前,请查看您的程序的正确性是否受到此分配的影响:

one = (int)two;

它有可能溢出 int,这比简单地损失几个 CPU 周期要糟糕得多。

如果您知道不会溢出,因为您已经清理了 unsigned 变量的值(在本例中,two 小于或等于 int.MaxValue)那么你不妨使用int。选择无符号数据类型的原因是为了获得额外的位,或者让所有操作都将数字视为 unsigned,而不是为了提高性能或进行隐式验证。

在 .NET Framework 中,即使对于正值或零值,Microsoft 选择使用 int 或 long 代替 uint 或 ulong。原因:因为更容易避免有符号和无符号类型之间的类型转换以及无符号整数可能暗示的减法符号更改的潜在异常。

那么,在 int 上仅使用正值或零值意味着什么:仅使用 32 位中的 31 位。没问题:我们有很多内存。

如果您想存储二进制数据,这可能会成为一个问题,在这种情况下,您通常会使用无符号字节。数据大小对于非常大的数据存储和慢速媒体上的通信也很重要。将编写一些优化算法以最小化内存使用,并且还将使用无符号值。

什么是好的做法:如果您使用 0 到 2 000 000 000 之间的值,请使用 int,如果您想要易于使用,请使用 int 或 long。如果内存使用影响,媒体带宽使用至关重要,数据是二进制性质的(图像位,声音,...)或算法效率需要使用 uint 或 ulong,请使用它们但在减法时要小心:减法大于第一个操作数将抛出 ArithmeticOverflowException。