size_t——为什么支持size_t,何时使用size_t?

Posted riko707

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了size_t——为什么支持size_t,何时使用size_t?相关的知识,希望对你有一定的参考价值。

为什么会有 ”size_t为何要存在” 的疑问?

许多C/C++文件中都会出现类型size_t,比如在bitcoin源码中,有这样的一个函数:

size_t strnlen( const char *start, size_t max_len)

    const char *end = (const char *)memchr(start, '\\0', max_len);
    //memchr函数从start开始寻找第一个出现字符'\\0'的位置并返回
    return end ? (size_t)(end - start) : max_len;
    //const char的长度吧,为啥要这样写,为什么要单独写一个文件啊,NOTE

该函数完成了返回const char*类型start代表的串的长度,返回值被设置为size_t类型。这是size_t经常被使用的一个场景“数组可能的长度

另一个使用场景就是函数memcpy(其实本质上是一样的,都是表示内存中数据的多少)。memcpy的原型void* memcpy(void*to,const void*from,size_t n)。需要复制的字节数被设置为size_t类型,这是数据块的大小

于是,会给人一种感觉,这种工作int也可以完成,如果说需要排除负数,unsigned int也可以完成。为什么要多此一举引入size_t呢?

另外,为何要表示内存中所有的数据呢?为什么不是硬盘?
这就是操作系统范畴的东西了。程序所使用的数据,一定是先由OS把数据搬/swap到内存,再根据内存地址去访问。至于怎么从硬盘中找到,就是另一件事情了,它被叫做”缺页中断“。

为什么需要size_t?

首先声明size_t的功能,它需要保证在程序运行中可以表示所有内存地址。size_t根据具体机器的体系结构,将有不同的值。比如,32位系统,内存最大是$2^32 bytes=4G$。那么size_t就需要至少4个字节(32bits)来表示所有地址。

即使是这样,unsigned int不是也是4个字节吗?
有些系统是。

为了保证在一些有者特殊体系结构的机器上正确运行,使用unsigned int来表示数据块大小可能是一个不好的主意。比如,一个机器支持16bit的unsigned int,但他是一个32位系统,使用unsigned int代替size_t显然并不是一个好主意。假如出现一个特别大的数组,可能无法表示出这个数组所有的元素,显而易见。
那么,是否可以使用unsigned long来代替呢?毕竟,long一定需要至少32bits,那么,对于那些只有16位的平台呢,这些平台往往使用两个16bits的字来对应一个long,在对long进行操作时,一定需要至少两条操作指令。而在这个系统中,并不需要32bits的地址,因为他只有16位。
要为了兼容而舍弃性能吗?显然有更好的解决方案。那就是根据地址总线个数来决定一个类型的大小,既不会无法表示一些数据,又不会使一些机器效率折损。这个类型就是size_t
size_t的存在使得程序有更好的可移植性,显而易见,程序员不需要为了一个新机器而在unsigned intunsigned char等等类型之间改来改去。

size_t的使用

正如上述,size_t可以表示内存中的所有数据,因为它刚好能够表示内存中所有的地址。
根据定义,size_t是关键字sizeof运算得到的结果的类型。因此,使用sizeof得到的结果应该声明为size_t

size_t n=sizeof(int)

另外,就是第一小节所述的,表示数组大小、数据块大小等等(实际上也是数据块的大小)。

使用size_t的时候,记得包括它的定义所在头文件,比如<stddef.h>, <stdio.h>, <stdlib.h>, <string.h>, <time.h>,<wchar.h>中的任意一个。

Reference

为什么size_t重要?
size_t类型

以上是关于size_t——为什么支持size_t,何时使用size_t?的主要内容,如果未能解决你的问题,请参考以下文章

索引数组时我应该总是使用 size_t 吗?

size_t总结

size_t 介绍

无法将参数 5 从 'SIZE_T *' 转换为 'size_t *' -- 为啥?

[c/c++] size_t是什么

size_t 和 unsigned int 之间的区别?