C语言进阶学习笔记一数据的存储

Posted 2021-05-26 大家好我叫张同学

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了C语言进阶学习笔记一数据的存储相关的知识，希望对你有一定的参考价值。

本章内容是【C语言进阶学习笔记】第一篇内容，主要探讨数据的分类、数据的存储方式、大小端字节序判断等。

一、数据类型分类（从大的方向上分为两类）

1、内置类型（c语言本身的数据类型）

在这里插入图片描述

2、自定义类型

用户自定义的类型，使用者自主设计的类型

3、类型的意义

要理解好这些类型，我们要思考好类型的意义。

类型的意义，可以从以下两个角度考虑：
1.使用这个类型开辟内存空间的大小（大小决定了使用范围）
比如说使用char类型创建的变量，开辟的内存空间是1个字节，使用int类型创建的变量，开辟的内存空间是4个字节。
2.如何看待内存空间的视角
比如：
int a = 0;
float b = 0.0;
虽然 a, b都是占用4个字节的空间，但是我们在看待a的时候，因为其类型是int，所以我们会把a当做整型来看待，在看待b的时候，因为其类型是float，所以我们会把b当做小数（而非整型）来看待。

二、数据类型细分类

1、整型家族

[int] 可以省略 unsigned (无符号） signed（有符号）
注意：char也算到整型家族里面，因为字符在底层存储的时候，存储的是字符所对应的ASCII值（整数）
unsigned / signed的理解和区别有符号signed的最高位为符号位，1表示负数，0表示正数， unsigned均为正数，最高位1是实数位，不为符号位。例如char类型，一个char是一个字节 = 8bit，10001101 如果是signed char，则最高位1是符号位，表示 - 1，如果是unsigned char，则最高位是实数位（有效位），不为符号位。

在这里插入图片描述

char的类型到底是unsigned char还是signed char是不确定的，取决于编译器。
short的类型明确规定为 signed
short int的类型明确规定为 signed int
long的类型明确规定为 signed long

2、浮点型家族

两类，均是小数（浮点数没有signed 和unsigned区分）
在这里插入图片描述

整型和浮点型属于内置类型：

3、构造类型

构造类型属于自定义类型：
在这里插入图片描述

4、指针类型

在这里插入图片描述

5、空类型

在这里插入图片描述

三、整型在内存中的存储

1、举例

看下面这个例子：

#include<stdio.h>
	int main()
{
	int a = 3;
	int b = -1;
	return 0;
}

为了查看a, b在内存中的存储形式，我们在编译器里面按F10进入调试，变量a，b创建后，打开内存监视器，输入& a，& b查看a，b对应的地址及其内容。
& a：
在这里插入图片描述
& b：

数据在内存中存储时是按二进制的补码存储的
VS在展示内存的时候，为了方便展示，显示的是16进制数据。
什么意思呢？我们定义一个变量c，以16进制形式对其赋值，然后& c，可以看到：

c输入的16进制形式是11223344，存储的时候是44332211，可以发现是倒着存储的（这个后面会详细讲解）。

2、原反补

下面先来了解几个概念︰原码、反码、补码
计算机中的有符号数有三种表示方法，即原码、反码和补码。
三种表示方法均有符号位和数值位两部分，符号位都是用0表示′正”，用1表示"负”，而数值位三种表示方法各不相同。
原码：直接将二进制按照正负数的形式翻译成二进制就可以。
反码：将原码的符号位不变，其他位依次按位取反就可以得到了。
补码：反码 + 1就得到补码。
（正数原码反码补码三码合一，负数的原反补按照上面的规则进行转换）

整数有两种，有符号数和无符号数
有符号数-- - 符号位 + 数值位
正数 0 + 数值位
负数 1 + 数值位

int b = -1;
//10000000 00000000 00000000 00000001 - 原码
//11111111 11111111 11111111 11111110 - 反码
//11111111 11111111 11111111 11111111 - 补码
//ff ff ff ff - 十六进制显示形式
int a = 3;
//00000000 00000000 00000000 00000011 - 原码、反码、补码
//0000 0000 0000 0000 0000 0000 0000 0000 0000 0011
//0 0 0 0 0 0 0 0 0 3
// 00 00 00 03

无符号数-- - 正整数是一样的！（只能表示正整数！）
在这里插入图片描述

unsigned short n = 0; // 0 --65535
signed short m = 0; // -32768–32767

对于整型来说:数据存放内存中其实存放的是补码。

3、为什么内存中要存储补码？

我们首先来看一下 1 - 1这个例子：
①先按照原码的方式去计算。
在这里插入图片描述

②接下来用补码来进行计算：
在这里插入图片描述

在计算机系统中，数值一律用补码来表示和存储。原因在于，使用补码，可以将符号位和数值域统一处理; 同时，加法和减法也可以统一处理(CPU只有加法器）此外，补码与原码相互转换，其运算过程是相同的，不需要额外的硬件电路。

怎么理解补码与原码相互转换，其运算过程是相同的？（以下运算，符号位均不变）
原码->取反 + 1->补码
补码->取反 + 1->原码
当然补码到原码也可以是：补码 -> - 1 取反->原码

例如 - 1：
11111111 11111111 11111111 11111111 - 补码
补码->取反 + 1->原码
10000000 00000000 00000000 00000000 - 取反
10000000 00000000 00000000 00000001 - +1
补码 -> - 1 取反->原码
11111111 11111111 11111111 11111110 - -1
10000000 00000000 00000000 00000001 - 取反
最终得到的结果均是：10000000 00000000 00000000 00000001

四、大小端介绍

1、什么大端小端︰

在这里插入图片描述

大端（存储)模式：是指数据的低位保存在内存的高地址中，而数据的高位，保存在内存的低地址中;
小端（存储）模式：是指数据的低位保存在内存的低地址中，而数据的高位, , 保存在内存的高地址中。

在这里插入图片描述

2、为什么有大端和小端

①为什么叫大端、小端呢？
和格列佛游记故事有关

②为什么会有大小端模式之分呢 ?

这是因为在计算机系统中，我们是以字节为单位的，每个地址单元都对应着一个字节，一个字节为8bit。
但是在C语言中除了8bit的char之外，还有16bit的short型，32bit的long型（要看具体的编译器）。
另外，对于位数大于8位的处理器，例如16位或者32位的处理器，由于寄存器宽度大于一个字节，那么必然存在着一个如果将多个字节安排的问题。
因此就导致了大端存储模式和小端存储模式。
例如一个16bit的short型x，在内存中的地址为ox0010)，x的值为0×1122，那么0x11为高字节，0x22为低字节。对于大端模式，就将0x11放在低地址中，即0x0010中，0x22放在高地址中，即0x0011中。小端模式，刚好相反
我们常用的x86结构是小端模式，而KEIL c51则为大端模式。很多的ARM，DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。

③如何判断大端、小端（字节序）呢？
思路：
int a = 1;
将a的第一个字节内容拿出来，判断其是1还是0，1为小端，0为大端。
在这里插入图片描述

当然，这里我们也可以将其封装成一个函数，根据其返回值确定是大端还是小端字节序。

int check_sys()
{
	int a = 1;
	char* p = (char*)&a;
	if (*p == 1)
		return 1;//小端
	else
		return 0;//大端
}

当然这个函数我们也可以进行简化：

int check_sys()
{
	int a = 1;
	return  (char*)&a;
}

五、练习题：

1、下面这段代码的结果是什么？

#include<stdio.h>
int main()
{
	char a = -1;
	signed char b = -1;
	unsigned char c = -1;
	printf("a = %d,b = %d,c = %d\\n", a, b, c);
	return 0;
}

结果展示：
在这里插入图片描述
结果分析：这里我们知道VS2019的编译器下char 类型等同于 signed char类型
进一步分析：a, b, c三者的存储形式是什么样子的？为什么% d打印出来的结果不同？

2、下面这段代码的结果是什么？

#include<stdio.h>
int main()
{
	char a = -128;
	printf("%u\\n", a);
	return 0;
}

结果展示：
在这里插入图片描述

分析：
在这里插入图片描述

3、下面这段代码的结果是什么？

#include<stdio.h>
int main()
{
	char a = 128;
	printf("%u\\n", a);
	return 0;
}

结果展示：
在这里插入图片描述
分析：

4、下面这段代码的结果是什么？

int main()
{
	int i = -20;
	unsigned int j = 10;
	printf("%d\\n", i + j);
	return 0;
}

在这里插入图片描述
分析：

5、下面这段代码的结果是什么？

#include<stdio.h>
int main()
{
	unsigned int i = 0;
	for (i = 9; i >= 0; i--)
	{
		printf("%u\\n", i);
	}
	return 0;
}

结果：死循环
在这里插入图片描述
分析：

unsigned int i//i为无符号整型，恒>=0,循环语句的判断条件恒成立。

为了能更好的观察到代码结果的变化，我们加上Sleep(1000)，每打印一行都暂停1000ms = 1s。

#include<stdio.h>
#include<Windows.h>
int main()
{
	unsigned int i = 0;
	for (i = 9; i >= 0; i--)
	{
		printf("%u\\n", i);
		Sleep(1000);
	}
	return 0;
}

在这里插入图片描述

6、下面这段代码的结果是什么？

#include<stdio.h>
#include<string.h>
int main()
{
	char arr[1000];
	int i;
	for (i = 0; i < 1000; i++)
	{
		arr[i] = -1 - i;
	}
	printf("%d", strlen(arr));
	return 0;
}

结果：
在这里插入图片描述
分析：

数组arr是char类型，char类型的取值范围为 - 128 — 127 用strlen函数求字符串的长度，
strlen会在找到\\0后停止计算长度，\\0的ASCII码值为0 arr[0] = -1, 从 - 1 —> 0要经过 - 1， - 2， - 3，…… - 128, 127, 126……3, 2, 1, 0
128 + 128 = 256个数字，将最后一位的\\0排除（strlen在计算字符串长度的时候，遇到\\0停止且不计算\\0的长度），所以最后的结果是255。

7、下面这段代码的结果是什么？

#include<stdio.h>
unsigned char i = 0;
int main()
{
	for (i = 0; i <= 255; i++)
	{
		printf("hello world\\n");
	}
	return 0;
}

结果：死循环打印
在这里插入图片描述

分析：

和第六题的原理类似，条件 <= 255恒成立，死循环了。

以上是关于C语言进阶学习笔记一数据的存储的主要内容，如果未能解决你的问题，请参考以下文章

C语言进阶学习笔记一数据的存储

文章目录

一、数据类型分类（从大的方向上分为两类）

1、内置类型（c语言本身的数据类型）

2、自定义类型

3、类型的意义

二、数据类型细分类

1、整型家族

2、浮点型家族

3、构造类型

4、指针类型

5、空类型

三、整型在内存中的存储

1、举例

2、原反补

3、为什么内存中要存储补码？

四、大小端介绍

1、什么大端小端︰

2、为什么有大端和小端

五、练习题：

1、下面这段代码的结果是什么？

2、下面这段代码的结果是什么？

3、下面这段代码的结果是什么？

4、下面这段代码的结果是什么？

5、下面这段代码的结果是什么？

6、下面这段代码的结果是什么？

7、下面这段代码的结果是什么？