C语言万字肝爆!建议收藏!深度剖析数据在内存中的存储
Posted 意愿三七
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了C语言万字肝爆!建议收藏!深度剖析数据在内存中的存储相关的知识,希望对你有一定的参考价值。
前言
数据在内存中到底是怎么存储的呢?相信看完这篇文章你的内功又会增加一点。
本文重点:
1. 数据类型详细介绍
2. 整形在内存中的存储:原码、反码、补码
3. 大小端字节序介绍及判断
4. 浮点型在内存中的存储解析
正文开始
我们大家最容易接触的内置类型:
char //字符数据类型
short //短整型
int //整形
long //长整型
long long //更长的整形
float //单精度浮点数
double //双精度浮点数
那么这些类型有什么意义呢?
- 确认这些类型在内存开辟的空间大小,比如 int类型 4字节
- 看待内存的视角,int类型是整形,float类型是浮点型
类型的基本归类
- 整形家族:
char
unsigned char
signed char
short
unsigned short [int]
signed short [int]
int
unsigned int
signed int
long
unsigned long [int]
signed long [int]
为什么char类型放在整形里面?
其实字符类型在底层存储,存的是ASCII码值,ASCII码值也是整数
unsigne(无符号)
未来你要创建一个变量,变量只会存正数,没有可能有负数的情况,那么你可以创建一个unsigne的类型
signed (有符号)
有符号位,也就是有正负之分
- 浮点类型家族:
float
double
- 构造类型家族(自定义类型):
结构体类型 struct
枚举类型 enum
联合类型 union
数组类型
为什么数组类型也是自定义类型?
定义一个数组 int arr [10] ,我们知道数组去掉它的数组名剩下的就是类型了, int [10] <— 这个就是我们自定义的类型
定义int arr [ 5 ],去掉数组名int [5],可以看见他们都是int类型,但是int [10]和int[5] 不一样,所以说数组类型也属于自定义类型
- 指针类型:
float*p
char*p
void*p
int*p
- 空类型:
void 表示空类型(无类型)
通常应用于函数的返回类型、函数的参数、指针类型。
整形在内存中的存储
我们之前讲过一个变量的创建是要在内存中开辟空间的。空间的大小是根据不同的类型而决定的。
那接下来我们谈谈数据在所开辟内存中到底是如何存储的?
int a = -10;
问题一:看了上面的代码我们知道 a 是int类型占4个字节,那在如何存储的呢?
首先我们要来了解下面的概念:
数据在内存中以二进制的形式存储
计算机中的有符号数有三种表示方法,即原码、反码和补码。
三种方法都有符号位和数值位
- 符号位 : 符号位都是用0表示“正”,用1表示“负”
- 数值位 : 数值位三种表示方法各不相同
对于整数来说:
整数的二进制有3种表示形式:原码,反码,补码
正整数: 原码,反码,补码相同
负整数: 原码,反码,补码要进行计算
-
原码:按照数值直接写出来的二进制序列就是原码
-
反码:原码的符号位不变,其他位按位取反,得到的就是反码
-
补码:反码加1,就是补码
好了,知道以上的一些概念,让我们回到问题一看看我们的int a在内存是怎么存储的
-
先编译器取A的地址
输入&a 得到 f6 ff ff ff
为什么是 f6 ff ff ff 呢?让我们来按照上面的步骤来探究一下: -
获取a的原码
-10
原码:10000000 00000000 00000000 00001010
-
获取a反码
反码:11111111 11111111 11111111 11110101
-
获取a的补码
反码: 111111111 111111111 111111111 11110110
上面说到为什么是f6 ff ff ff
对于整形来说:数据存放内存中其实存放的是补码,怎么证明呢?
可以看见把刚刚计算出来的补码放在计算器里面得到的就是一个16进制的FFFFFFF6 ,只是顺序有点倒过来了,不过的确可以证明对于整形来说:数据存放内存中其实存放的是补码
问题二: 为什么要存补码呢?为什么不存原码呢?
在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统一处理; 同
时,加法和减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,不需
要额外的硬件电路。
其实就是说补码补码相加才可以得到一个准确的数值,看不懂上面的?没事
来个代码:1-1 因为CPU只有加法器 , 所以就是1+(-1)
1-1
1+(-1) (CPU只有加法器)
我们试一下 错误的:原码相加会等到正确的值吗?
1 的原反补相同:00000000 000000000 00000000 000000001
-1的原码 : 10000000 000000000 00000000 000000001
二进制原码相加:
00000000 00000000 00000000 00000001
10000000 00000000 00000000 00000001
得到下面这个数:
10000000 00000000 00000000 00000010
认为这个是正确的数,那我们读出来就是 -2 了,1 - 1 = 0,最后是-2肯定是错误的。
我们试一下 正确的:补码相加会等到正确的值吗?
1的原反补相同:00000000 000000000 00000000 000000001
来算一下负1的补码:
-1的原码:10000000 00000000 00000000 00000001
-1的反码:1111 1111 1111 1111 1111 1111 1111 1110
-1的补码:1111 1111 1111 1111 1111 1111 1111 1111
二个数的补码相加:
得到 :10000000 00000000 00000000 000000000
32个0,一个1 ,我们实际上只可以放32个二进制数,那个进1的那位要丢掉,所以最后得到全0,而 1-1 的 正确结果也是 0.
这就是为什么要补码相加,而不是原码,或者反码相加的原因。
补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路
这句话怎么理解呢?看下面的案列:
-1的补码要是想得到原码,可以反过来计算,补码-1,然后按位取反就可以得到。
那其实还有一种方法可以验证我们上面引用的话:
我们把补码当原码,在过一次计算一次依然可以得到我们的原码.
是不是和上面的原码一样了,这就解释了上面所说的话了。
大端小端
为什么要有大端小端:
为什么会有大小端模式之分呢?这是因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一
个字节,一个字节为8bit。但是在C语言中除了8bit的char之外,还有16bit的short型,32bit的long型(要看具
体的编译器),另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字
节,那么必然存在着一个如果将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。
例如一个 16bit 的 short 型 x ,在内存中的地址为 0x0010 , x 的值为 0x1122 ,那么 0x11 为高字节, 0x22
为低字节。对于大端模式,就将 0x11 放在低地址中,即 0x0010 中, 0x22 放在高地址中,即 0x0011 中。小
端模式,刚好相反。我们常用的 X86 结构是小端模式,而 KEIL C51 则为大端模式。很多的ARM,DSP都为小
端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式
啊这,太官方话了。。。。 简单说就是你的数值大于一个字节,就会有字节存储顺序,所以要安排怎么把这些字节按照什么顺序放进去
什么是大端小端:
大端(存储)模式:是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址中;
小端(存储)模式:是指数据的低位保存在内存的低地址中,而数据的高位,,保存在内存的高地址中。
来个代码案列:
定义了一个变量:
来看一下这个a在本机是什么存储模式,是大端存储模式,还是小端存储模式
我们画个图,模拟一下这个变量在内存中是怎么样存储的。
为什么说上面的是大端存储模式,下面是小端存储模式呢?
可以看见0x11223344 最后面的44是低位,然后在大端存储模式下44是放在内存的高地址位,根据上面的概念可以得出,大端模式,低位在内存的高地址存储就是大端模式。
为什么下面是小端存储模式:
0x11223344 44是放在内存的低地址处,根据上面的概念可以得出,小端模式,低位在内存的低地址存储就是小端模式。
那么我们当前的电脑上使用的是什么存储模式呢?来让我们一起看看
诶!!!大家可以看见原来在本机上使用的是小端存储!
还记得这个FFFF FFF6吗,也是小端存储模式,所以说为什么有时候看内存是倒着的,就是因为这个大小端原因。
来做一道百度2015年的笔试题:
请简述大端字节序和小端字节序的概念,设计一个小程序来判断当前机器的字节序。(10分)
答案:简述的概念我们就不讲了,来看一下小程序吧
思路:我们只要判断第一个字节是小端应该出现的字节就是小端,是大端应该出现的字节就是大端,
我们先看一下1在小端内存是怎么表示的:
可以看见第一个字节是01 也就是1 所以我们代码看一下写成这样判断
int main()
{
//写代码判断当前字节序
int a = 1; //在小端应该是这样的存储 01 00 00 00
char* b =(char*) &a; //取出第一个字节的内容
if (*b==1) {
printf("小端");
}
else {
printf("大端");
}
return 0;
}
也可以写成函数的那样:
int check_sys()
{
int a = 1;
return (*(char*)&a); //因为返回的是1 或者0 也是&a的内容 所以可以直接rerunt
}
int main()
{
int ret = check_sys();
if (ret == 1 )
{
printf("小端");
}
else
{
printf("大端");
}
return 0;
}
做题目巩固
第一题:
1.
//输出什么?
#include <stdio.h>
int main()
{
char a= -1;
signed char b=-1;
unsigned char c=-1;
printf("a=%d,b=%d,c=%d",a,b,c);
return 0;
}
答案:-1 , -1 ,255
解析:(a)-1的由来
-1在内存中存的是补码
-1的原码:10000000000000000000000000000001
-1的反码:11111111111111111111111111111110
-1的补码:11111111111111111111111111111111
因为a是char类型只可以放8个bit为所以a里面应该存的是 8个1
再因为输入打印是以%d类型打印的所以要发生整形提升,有符号位发生提升前面全补1
11111111变成11111111111111111111111111111111 —这个是补码
还要变成原码的方式输出出去:
a的补码11111111111111111111111111111
a的反码11111111111111111111111111110
a的原码10000000000000000000000000000001
最后打印的是原码:-1
b其实也是一样的有符号的-1
解析(c)255的由来
因为c是unsigned char类型只可以放8个bit为所以a里面应该存的是 8个1。
再因为输入打印是以%d类型打印的所以要发生整形提升,无符号位发生提升前面全补0。
11111111变成00000000000000000000000011111111 —这个是补码
看符号位是0,判断它是一个正数,所以正数的原反补相同,最后已原码打印出来的是8个1 也就是255
补充:char 到底是signed char 还是unsigned char ?
答:C语言标准并没有规定,取决于编译器
int 是 signed int
第二题:
2.
#include <stdio.h>
int main()
{
char a = -128;
printf("%u\\n",a);
return 0;
}
答案是:4294967168
解析:
a的原码:10000000000000000000000010000000
a的反码:11111111111111111111111101111111
a的补码:11111111111111111111111110000000
因为a是char类型,所以a里面存放的应该是8个bit位: 10000000
以%u形式输出出来,要发生整形提升,看见a是char类型是有符号的,高位补1,得到:11111111111111111111111110000000,最后发现是以%u的类型打印出来,可%u是无符号类型,就意味着,这是个正数,正数的原反补相同,所以是168结尾的大数字
第三题:
#include <stdio.h>
int main()
{
char a = 128;
printf("%u\\n",a);
return 0;
}
答案:4294967168
解析:和上面一样
注意:char a =128, 其实a不可能放一个128,127后就是-128了
补充(char的取值范围)
char取值范围是:-128 ~ 127
为什么?
画图解释一下:
char是8个bit位,所以在内存应该是这样的:
因为01111111已经是最大的正数了,在加1最高位变成1的话,那就变成负数了,01111111 == 127。
如果01111111加1那么就变成了10000000,当然这个数并不是0,而是-128,遇见一个1,七个0都是-128,因为这里的二进制数不可以计算原反补码了,但是其他的就不一样。(负数是要进行原反补的)
补码:11111110通过原反补的计算得到 -2
反码:11111101 补码减1得反码
原码:1000010 == -2 反码取反得原码
第四题:
int i= -20;
unsigned int j = 10;
printf("%d\\n", i+j);
答案:-10
解析:求出-20 和 10的补码相加 然后%d打印认为是有符号,还要计算出原码打印出来。
i的原码:10000000000000000000000000010100
i的反码:11111111111111111111111111101011
i的补码:11111111111111111111111111101100
j的补码:00000000000000000000000000001010
因为%d打印的所以还要取出原码
最终是-10
第五题
unsigned int i;
for(i = 9; i >= 0; i--)
{
printf("%u\\n",i);
}
答案:死循环
解析: 因为i是一个无符号数字,对于一个无符号数字 最小是0,判断条件刚好是大于等于0,所以恒成立“,所以死循环
第六题
int main()
{
char a[1000];
int i;
for(i=0; i<1000; i++)
{
a[i] = -1-i;
}
printf("%d",strlen(a));
return 0;
}
答案 :255
解析:strlen找到 \\0 停止, 从-1 到 127 因为char的范围是-128~127 所以128+127 = 255
第七题
#include <stdio.h>
unsigned char i = 0;
int main()
{
for(i = 0;i<=255;i++)
{
printf("hello world\\n");
}
return 0;
}
答案: 死循环
解析:无符号的char 取值符号是255 没有正反区分,条件刚好是大于等于255 ,所以死循环
本文结束,感谢大家的观看!!!感觉对你有用的话,不妨点个大拇指
以上是关于C语言万字肝爆!建议收藏!深度剖析数据在内存中的存储的主要内容,如果未能解决你的问题,请参考以下文章
一篇博文:带你 gulp入门 0基础必看,万字肝爆,建议收藏~
十几年老Java咳血推荐:MySQL索引原理失效情况,两万字肝爆,建议收藏!
一篇博文:带你TypeScript入门,两万字肝爆,建议收藏!