unsigned int vs. size_t

爷,独闯天下 提交于 2020-01-20 13:35:37

我注意到现代C和C ++代码似乎在任何地方使用size_t而不是int / unsigned int - 从C字符串函数的参数到STL。 我很好奇这个原因及其带来的好处。


#1楼

size_t类型是无符号整数类型,它是sizeof运算符(和offsetof运算符)的结果,因此保证它足够大以包含系统可以处理的最大对象的大小(例如,静态数组8GB)。

size_t类型可能大于,等于或小于unsigned int ,并且您的编译器可能会对其进行假设以进行优化。

您可以在C99标准中找到更准确的信息,第7.17节,其草案可在因特网上以pdf格式或在C11标准第7.19节中获得,也可作为pdf草案获得


#2楼

类型size_t必须足够大,以存储任何可能对象的大小。 Unsigned int不必满足该条件。

例如,在64位系统中int和unsigned int可能是32位宽,但size_t必须足够大以存储大于4G的数字


#3楼

经典C(由Brian Kernighan和Dennis Ritchie在C编程语言中描述的C的早期方言,Prentice-Hall,1978)没有提供size_t 。 C标准委员会引入size_t来消除可移植性问题

在embedded.com上详细解释(有一个很好的例子)


#4楼

size_t类型是sizeof运算符返回的类型。 它是一个无符号整数,能够表示主机上支持的任何内存范围的字节大小。 它(通常)与ptrdiff_t有关,因为ptrdiff_t是有符号整数值,使得sizeof(ptrdiff_t)和sizeof(size_t)相等。

在编写C代码时,每当处理内存范围时,应始终使用size_t。

另一方面,int类型基本上定义为主机可以用来最有效地执行整数运算的(带符号)整数值的大小。 例如,在许多旧的PC类型计算机上,值sizeof(size_t)将是4(字节)但sizeof(int)将是2(字节)。 尽管CPU可以处理高达4 GiB的(逻辑)存储空间,但16位算术比32位算术快。

只有在关心效率时才使用int类型,因为它的实际精度很大程度上取决于编译器选项和机器架构。 特别是C标准指定了以下不变量:sizeof(char)<= sizeof(short)<= sizeof(int)<= sizeof(long)对程序员可用于每个的精度的实际表示没有其他限制这些原始类型。

注意:这与Java中的不同(实际上为每个类型'char','byte','short','int'和'long'指定了位精度)。


#5楼

size_t是指针的大小。

因此,在32位或公共ILP32(整数,长,指针)模型中,size_t是32位。 并且在64位或公共LP64(长,指针)模型中,size_t是64位(整数仍然是32位)。

还有其他模型,但这些是g ++使用的模型(至少默认情况下)


#6楼

在研究该主题时,glibc手册0.02的摘录也可能是相关的:

在版本2.4之前,size_t类型和GCC版本存在潜在问题。 ANSI C要求size_t始终是无符号类型。 为了与现有系统的头文件兼容,GCC将stddef.h' to be whatever type the system's size_t定义stddef.h' to be whatever type the system's sys / types.h定义的stddef.h' to be whatever type the system's 。 大多数在`sys / types.h'中定义size_t的Unix系统将其定义为有符号类型。 库中的某些代码依赖于size_t是无符号类型,如果签名则无法正常工作。

期望size_t无符号的GNU C库代码是正确的。 size_t作为签名类型的定义不正确。 我们计划在版本2.4中,GCC将始终将size_t定义为无符号类型,并且fixincludes' script will massage the system's sys / types.h'以免与此冲突。

与此同时,我们通过在编译GNU C库时明确告诉GCC使用unsigned类型的size_t来解决这个问题。 `configure'将自动检测GCC用于size_t的类型,以便在必要时覆盖它。


#7楼

如果我的编译器设置为32位,则size_t只是unsigned int的typedef。 如果我的编译器设置为64位,则size_t只是unsigned long long的typedef。


#8楼

简而言之, size_t永远不会消极,并且它会最大化性能,因为它的typedef将是无符号整数类型,足够大 - 但不是太大 - 来表示目标平台上最大可能对象的大小。

大小永远不应该是负数,并且size_t确实是无符号类型。 此外,由于size_t是无符号的,因此您可以存储大约是相应签名类型的两倍的数字,因为我们可以使用符号位来表示幅度,就像无符号整数中的所有其他位一样。 当我们再获得一位时,我们将我们可以表示的数字范围乘以大约两倍。

所以,你问,为什么不使用unsigned int ? 它可能无法容纳足够多的数字。 在unsigned int为32位的实现中,它可以表示的最大数字是4294967295 。 某些处理器(如IP16L32)可以复制大于4294967295字节的对象。

所以,你问,为什么不使用unsigned long int ? 它确实在一些平台上造成了性能损失。 标准C要求long占用至少32位。 IP16L32平台将每个32位长实现为一对16位字。 这些平台上的几乎所有32位运算符都需要两条指令(如果不是更多),因为它们与两个16位块中的32位一起使用。 例如,移动32位长通常需要两个机器指令 - 一个用于移动每个16位块。

使用size_t可以避免这种性能损失。 根据这篇精彩文章 ,“Type size_t是一个typedef,它是某些无符号整数类型的别名,通常是unsigned intunsigned long ,但可能甚至是unsigned long long 。每个Standard C实现应该选择足够大的无符号整数 - - 但不比需要大 - 表示目标平台上最大可能对象的大小。“

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!