C语言之深度剖析数据在内存中的存储

Posted 飞天小龟

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了C语言之深度剖析数据在内存中的存储相关的知识,希望对你有一定的参考价值。

一. 数据类型的介绍

类型类型名32位64位
char字符数据类型11
int整型44
unsigned int无符号整型44
short短整型22
long长整型48
float单精度浮点数44
double双精度浮点数88

注意!基本整型所占的字节数除了跟操作系统位数有关外,还跟编译器有关,比如说:VC++ int 占据4个四节,但是在 tuborC下则是2个字节。

1.1 类型的基本归类

类型可分为:整型家族、浮点数家族、构造类型和空类型

1.1.1 整型家族

  1. char类型
    unsigned char
    signed char
    char虽然是字符类型,但是其对应的assic码也是一个整型数值,故通常将char类型也归入到整型家族里。
  2. short类型
    unsigned short [int]
    signed short [int]
  3. int类型
    unsigned int 无符号整型
    signed int 有符号整型

int等价为有符号整型,存储范围为-231~ 231-1
无符号整型unsigned int 存储范围为0~232,注意:如果将负数存储到无符号整型的变量中,编译器读取它时,会将它转化为整数,打印时要用"%u"打印,不能使用"%d"打印。

  1. long类型
    unsigned long [int]
    signed long [int]

1.1.2 浮点数家族

float

单精度浮点型

double

双精度浮点型,精度更高

1.1.3 构造类型(自定义类型)

数组类型
结构体类型 struct
枚举类型 enum
联合类型 union

1.1.4 指针类型

int *pi
char *pc
float *pf
void *pv

1.1.5 空类型

void 表示空类型(无类型)
通常应用于函数的返回类型、函数的参数、指针类型。

二. 整形在内存中的存储

变量的创建是要在内存中开辟空间的,空间的大小是根据不同的类型而决定的,那数据在所开辟内存中到底是如何存储的呢?
先了解以下几个概念:

2.1 原码、反码、补码

计算机中的整数有三种表示方法,即原码、反码和补码。
计算机内存中存储的是二进制的补码。
三种表示方法均有符号位和数值位两部分,符号位都是用0表示“正”,用1表示“负”

正整数的原码、反码、补码都相同。
负整数的三种表达方法各不相同:

原码
直接将二进制按照正负数的形式翻译成二进制就可以。
反码
将原码的符号位不变,其他位依次按位取反就可以得到了。
补码
反码+1就得到补码

2.2 大、小端字节序存储模式

什么大端小端:
大端(存储)模式,是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中;
小端(存储)模式,是指数据的低位保存在内存的低地址中,而数据的高位,保存在内存的高地址中。
以VS2019为例:

显然,此例中高位为1,存放在高字节中,低位为4,存放在低字节中,故其存储模式为小端存储。

例题:设计代码来判断当前机器的字节序。

#include <stdio.h>
int check_sys()

	 int i = 1;
 	 return (*(char *)&i);

int main()

	 int ret = check_sys();
	 if(ret == 1)
	 
	 	printf("小端\\n");
	 
	 else
	 
	 	printf("大端\\n");
	 
	 return 0;

三. 浮点型在内存中的存储

根据国际标准IEEE(电气和电子工程协会) 754,任意一个二进制浮点数V可以表示成下面的形式:

(-1)^S * M * 2^E
(-1)^S表示符号位,当S=0,V为正数;当S=1,V为负数。
M表示有效数字,大于等于1,小于2。
2^E表示指数位。

举例说明:
十进制的5.0,写成二进制是 101.0 ,相当于1.01*22,写成以上形式就为(-1)01.0122,其中S=0,M=1.01,E=2;
十进制的-5.0,写成二进制是 -101.0 ,相当于 -1.01×22,写成以上形式为
(-1)11.0122,其中S=1,M=1.01,E=2。

IEEE 754规定:
对于32位的浮点数,最高的1位是符号位s,接着的8位是指数E,剩下的23位为有效数字M。

对于64位的浮点数,最高的1位是符号位S,接着的11位是指数E,剩下的52位为有效数字M。

IEEE 754对有效数字M和指数E,还有一些特别规定。

3.1 有效数字M的规定

据上,1≤M<2 ,也就是说,M可以写成 1.xxxxxx 的形式,其中xxxxxx表示小数部分,因此,IEEE754规定,在计算机内部保存M时,默认这个数的第一位总是1,因此可以被舍去,只保存后面的xxxxxx部分。比如保存1.01的时
候,只保存01,等到读取的时候,再把第一位的1加上去。这样做的目的,是节省1位有效数字。
以32位浮点数为例,留给M只有23位,将第一位的1舍去以后,相当于可以保存24位有效数字。

3.2 指数E的规定

首先,E为一个无符号整数(unsigned int),这意味着,如果E为8位,它的取值范围为0 - 255;如果E为11位,它的取值范围为0~2047。但是,我们
知道,科学计数法中的E是可以出现负数的,所以IEEE 754规定,存入内存时E的真实值必须再加上一个中间数

对于8位的E,这个中间数是127
对于11位的E,这个中间数是1023

比如,2^10的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即10001001。

指数E从内存中取出来又分三种情况:

  1. E不全为0或不全为1

这时,浮点数就采用下面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第一位的1。
比如:
0.5(1/2)的二进制形式为0.1,由于规定正数部分必须为1,即将小数点右移1位,则为
1.0*2^(-1),其阶码为-1+127=126,表示为:01111110,而尾数1.0去掉整数部分为0,补齐0到23位00000000000000000000000,则其二进
制表示形式为:0 01111110 00000000000000000000000

  1. E全为0

内存中E全为0时,则真实的E为-127(或-1023),故M*2-127 ,且M为一个大于等于1小于二的数,则此时的数字为一个无限接近于0的数字。
所以E全为0时是用来表示0和无限接近于0的数字,浮点数的指数E等于1-127(或者1-1023)即为真实值,有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数。

  1. E全为1

这时,如果有效数字M全为0,表示±无穷大(正负取决于符号位s);

举例:

int main()

	 int n = 9;
	 float *pFloat = (float *)&n;
	 printf("n的值为:%d\\n",n);
	 printf("*pFloat的值为:%f\\n",*pFloat);
	 *pFloat = 9.0;
	 printf("num的值为:%d\\n",n);
	 printf("*pFloat的值为:%f\\n",*pFloat);
	 return 0;

各位大佬可以根据前文来讨论讨论此程序的运行结果,我会在评论区公布结果的。
谢谢各位大佬!!!

以上是关于C语言之深度剖析数据在内存中的存储的主要内容,如果未能解决你的问题,请参考以下文章

C语言万字肝爆!建议收藏!深度剖析数据在内存中的存储

C语言 - 深度剖析数据的存储

深度剖析数据在内存中的存储1——数据类型

深度剖析数据在内存中的存储之整形在内存中的存储以及大小端介绍

深度剖析数据在内存中的存储

深度剖析数据在内存中的存储之浮点型在内存中的存储