深度剖析数据在内存中的存储之整形在内存中的存储以及大小端介绍

Posted 小赵小赵福星高照~

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了深度剖析数据在内存中的存储之整形在内存中的存储以及大小端介绍相关的知识,希望对你有一定的参考价值。

深度剖析数据在内存中的存储

数据类型介绍

基本的内置类型

char     //字符数据类型
short    //短整型
int     //整形
long     //长整型
long long  //更长的整形
float    //单精度浮点数
double    //双精度浮点数

类型的意义:

1、使用这个类型开辟内存空间的大小(大小决定了使用范围)

2、看待内存空间的视觉

类型的基本归类

整形家族

char

​ unsigned char

​ signed char

short

​ unsigned short

​ signed short

int

​ unsigned int

​ signed int

long

​ unsigned long

​ signed long

浮点型家族

float

double

构造类型-自定义类型

struct—结构体类型

数组

enum—枚举

union—联合体

指针类型

int *p

char *p

float *p

void *p

空类型

void–用于函数的返回类型

函数参数-- void test(void);

指针-- void *p

整形在内存中的存储

一个变量的创建是需要开辟空间的,空间大小因为类型的不同而不同,那么数据是如何存储的呢?我们先来看一下整数的二进制表示形式:

对于整数来说:

整数的二进制有3种表示形式:原码、反码、补码

正整数:原码、反码、补码相同

负整数:原码、反码、补码要进行计算的

按照数据的数值直接写出的二进制序列就是原码

原码的符号位不变,其他位按位取反,得到反码

反码+1,得到补码

int main()
{
    int a = -10;
    //原码
    //10000000000000000000000000001010
    //11111111111111111111111111110101-反码
    //11111111111111111111111111110110-补码
    //1111 1111 1111 1111 1111 1111 1111 0110
    //F    F    F    F    F    F    F    6
    //FFFFFFF6
    return 0;
}

a的内存存储:

image-20210521192227890

数据在内存中以2进制的形式存储,经过调试查看a的地址内存可以看出整数在内存中存的是补码

正数的原、反、补码都相同

对于整形来说:数据存放的就是补码

为什么存的是补码呢?

在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统一处理; 同时,加法和减法也可以统一处理(CPU只有加法器)此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。

int main()
{
    //1-1
    //1+(-1)  //cpu无减法器,只有加法器,要转化为加法计算
    //00000000000000000000000000000001
    //10000000000000000000000000000001
    //10000000000000000000000000000010
    //-原码相加后为-2
    
    //00000000000000000000000000000001-- 1的补码
    //11111111111111111111111111111111-- -1的补码
    //100000000000000000000000000000000
    内存中只能存32个bit位,进上去的那位存不进去,丢了
    //00000000000000000000000000000000  --0  //更合适
    return 0;
}

我们发现a的内存是倒着存的,接下来我们看一个知识点大小端

image-20210521192227890

大小端介绍

大端字节序和小端字节序

int main()
{
    int a=0x11223344;
    return 0;
}

我们来看看内存
在这里插入图片描述

我们看到44所占用字节的地址为0x00DCF794,33所占用字节的地址为0x00DCF795,22所占用字节的地址为0x00DCF796,11所占用字节的地址为0x00DCF797,可以看到我们的十六进制数据的低位储存在了低地址处,高位储存在了高地址处,那么为什么这样存呢?
那是因为我们的编译器采用的小端字节序
这里介绍大端字节序和小端字节序
大端字节序:

把数据的低位字节序的内容存放在高地址处,高位字节序的内容存放在低地址处

小端字节序:

把数据的低位字节序的内容存放在低地址处,高位字节序的内容存放在高地址处

上面的a的内存分别按照大端字节序和小端字节序分别如下:
44332211-小端字节序
11223344-大端字节序

为什么会有大小端字节序呢?

在计算机系统中,每个地址单元都对应着一个字节,一个字节为8bit,在C语言中除了8bit的char之外,还有16bit的short型,32bit的int型,另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如果将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。

百度笔试题

请简述大端字节序和小端字节序的概念,设计一个小程序来判断当前机器的字节序。

#include<stdio.h>
int main()
{
    //写代码判断当前机器的字节序
    int a=1;
    char* p=(char*)&a;
    if(*p==1)
    {
        printf("小端\\n");
    }
    else
    {
        printf("大端\\n");
    }
    return 0;
}

通过函数判断

#include<stdio.h>
int check_sys()
{
    int a=1;
    char* p=(char*)&a;
    return *p;//返回1小端,返回0大端
}
int main()
{
    int ret=check_sys();
    if(ret==1)
    {
        printf("小端\\n");
    }
    else
    {
        printf("大端\\n");
    }
    return 0;
}

练习讲解

1.

int main()
{
    char a=-1;
    //10000000000000000000000000000001
    //11111111111111111111111111111110
    //11111111111111111111111111111111
    //11111111
    //整形提升
    //11111111111111111111111111111111
    signed char b=-1;
    //11111111
    //整形提升
    //11111111111111111111111111111111
    unsigned char c=-1//11111111
    //整形提升
    //00000000000000000000000011111111--补码
    //11111111111111111111111100000000--反码
    //11111111111111111111111100000001--补码
    printf("a=%d b=%d c=%d",a,b,c);
    return 0;
}

image-20210522103345820
解释如下:

10000000000000000000000000000001-- -1原码
11111111111111111111111111111110
11111111111111111111111111111111-- -1补码
-1放到char中要发生截断,只能放8个比特位11111111

以%d打印a,a要发生整形提升

11111111111111111111111111111111–a提升后–补码

10000000000000000000000000000001-- 原码

所以a打印的是-1,同理b也是-1

c被截断后:11111111
整形提升(是无符号char,高位补0)
00000000000000000000000011111111–补码,因为是无符号的数,所以也是原码

所以c打印的为255

补充:

1.char到底是signed char 还是unsigned char?

C语言标准并没有规定,取决于编译器

int是signed int

short是 signed short

2.

#include <stdio.h>
int main()
{
  char a = -128;
  printf("%u\\n",a);
  return 0;
}

image-20210522103640810

解释如下:

10000000000000000000000010000000–原码

11111111111111111111111101111111–反码

11111111111111111111111110000000–补码
放到char中要发生截断,只能放8个比特位
10000000

a是有符号char,高位补符号位,整形提升,

11111111111111111111111110000000–补码

以%u打印,以无符号形式打印,认为内存中它是无符号存储的,所以补码就是原码

3.

#include <stdio.h>
int main()
{
  char a = 128;
  printf("%u\\n",a);
  return 0;
}

image-20210522103818145

解释如下:

00000000000000000000000010000000

01111111111111111111111101111111

01111111111111111111111110000000–补码
放到char中要发生截断,只能放8个比特位
10000000

a是有符号char,高位补符号位,整形提升,

11111111111111111111111110000000–补码

以%u打印,以无符号形式打印,认为它是无符号的,无符号数原反补相同,所以补码就是原码

补充:

char

有符号char的取值范围为-128到127

00000000–>0

00000001–>1

……

01111111–>127–正的最大值

10000000 - -128

10000001 10000000 11111111 -127

……

11111110 11111101 10000010 -2

11111111 11111110 10000001 -1

反码 补码 原码

有符号的char取值范围如下图:

4.

#include<stdio.h>
int main()
{
    int i=-20;
    unsigned int j=10;
    printf("%d\\n",i+j);//%d认为内存中是有符号数  %u认为内存中是无符号的
    return 0;
}

image-20210522103923773

解释如下:

10000000000000000000000000010100–i原码

11111111111111111111111111101011–i反码

11111111111111111111111111101100–i补码

00000000000000000000000000001010–j

11111111111111111111111111110110–i+j补码

11111111111111111111111111110101

%d认为内存中是有符号数 %u认为内存中是无符号的

符号位不变,按位取反

10000000000000000000000000001010 -->-10

#include<stdio.h>
int main()
{
    unsigned int i;
    for(i=9;i>=0;i--)
    {
        printf("%u\\n",i);
    }
    return 0;
}

image-20210522104041713

解释如下:

i是无符号的整形,i怎么变都不会小于0,死循环

6.

#include<stdio.h>
int main()
{
    char a[1000];
    int i;
    for(i=0;i<1000;i++)
    {
        a[i]=-1-i;
    }
    //-1 -2 -3…… -127 -128 127 126…… 3 2 1 0 -1 -2 -3……
    printf("%d",strlen(a));//\\0为结束标志
    return 0;
}

image-20210522104841614

解释如下:

char是有符号的char,取值范围为-128到127,又因为strlen求字符串看到\\0就停止计算,strlen求出0前面的字符串长度。

7.

#include<stdio.h>
int main()
{
    unsigned char i = 0;//无符号char取值范围0-255
    for(i=0;i<=255;i++)//这个条件永远都满足
    {
        printf("hello world\\n");
    }
    return 0;
}

死循环

image-20210522105139847

解释如下:

无符号char取值范围为0-255,循环判断部分永远都满足

以上是关于深度剖析数据在内存中的存储之整形在内存中的存储以及大小端介绍的主要内容,如果未能解决你的问题,请参考以下文章

深度剖析数据在内存中的存储

深度剖析数据在内存中的存储之浮点型在内存中的存储

深度剖析数据在内存中的存储

从初识到进阶,硬核解说C语言< 进阶篇 1 > 深度剖析数据在内存中的存储

C语言万字肝爆!建议收藏!深度剖析数据在内存中的存储

深度剖析数据在内存中的存储