自定义结构类型：结构体枚举联合

Posted 2021-10-19 暴走的橙子～

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了自定义结构类型：结构体枚举联合相关的知识，希望对你有一定的参考价值。

那在设计结构体的时候，我们既要满足对齐，又要节省空间，如何做到？

结构体

结构是一些值的集合，这些值称为成员变量。结构的每个成员可以是不同类型的变量。
它可以用来描述复杂对象。

比如：当描述一个学生的基本情况，c语言里提供的（int、char、double.....）类型无法满足描述这种复杂类型,所以结构体就可以很好来解决这类情况。

结构的声明

struct stu
{
	char name[20];//姓名
	char sex[5];//性别
	int age;//年龄
	char id[20];//学号
};//分号不能丢

   char name[20];//姓名
   char sex[5];//性别
   int age;//年龄
   char id[20];//学号 ------------------成员变量，用来描述学生个人信息

特殊的声明

struct
{
	int a;
	char b;
	float c;
}x;
struct
{
	int a;
	char b;
	float c;
}a[20], * p;

我们发现struct后面没有结构体标签，这种类型叫做匿名结构体。

匿名结构体特点

1、定义变量时只能在创建结构体同时定义，在后面不能定义。

2、如果遇到两个匿名结构体成员变量一样，编译器也会把这两种声明当成完全不同的类型。

//在上面代码的基础上，下面的代码合法吗？
p=&x;

警告：编译器会把上面的两个声明当成完全不同的两个类型。所以是非法的。

结构的自引用

在一个结构体中包含一个类型为该结构体类型是否可以呢？

struct Node
{
int data;
struct Node next;
};
//可行否？
如果可以，那sizeof(struct Node)是多少？

这用定义是不正确的。一个结构体里面不能包含一个类型为该结构体类型。

计算sizeof时：

struct Node next;在调用时会不断递归 / 死循环下去，不断消耗栈空间。造成系统崩溃。

正确改进方法：


#include<stdio.h>
struct Node
{
	int data;
	struct Node* next;
};
int main()
{
	printf("%d\\n", sizeof(struct Node));
}

计算结果如下：

int 是4个字节 struct Node*是指针，在32位平台上也是4个字节，根据结构体内存对齐原理（在后面会详细介绍），不难算出大小事8个字节。

注意

typedef struct
{
int data;
Node* next;
}Node;
这样的代码正确吗？

Node*next;在定义时，Node是在后面定义的，在这里还没有声明出来，编译器还不能识别。

改进：

typedef struct Node
{
int data;
struct Node* next;
}Node;

结构体内存对齐

规则：

1. 第一个成员在与结构体变量偏移量为0的地址处。
2. 其他成员变量要对齐到某个数字（对齐数）的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数与该成员大小的较小值。
VS中默认的值为8
Linux中的默认值为4
3. 结构体总大小为最大对齐数（每个成员变量都有一个对齐数）的整数倍。
4. 如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍

是不是感觉无从下手，接下来我们来举个栗子：

struct S1
{
char c1;
int i;
char c2;
};

对齐数 = 编译器默认的一个对齐数与该成员大小的较小值。
VS中默认的值为8
Linux中的默认值为4char是1个字节

char 1个字节< 8个字节 ------- 偏移量为1

int 4个字节< 8个字节 ------- 偏移量为4

char 1个字节< 8个字节 ------- 偏移量为1

1. 第一个成员在与结构体变量偏移量为0的地址处。

2. 其他成员变量要对齐到某个数字（对齐数）的整数倍的地址处。

下一个位置偏移量为1，不是4的倍数，所以要浪费3个字节的空间到偏移量为4的位置。

和上面同理。

char的偏移量为1,8是1的倍数。

3. 结构体总大小为最大对齐数（每个成员变量都有一个对齐数）的整数倍。

此时结构体的大小事9个字节，不是最大偏移量（4）的倍数，所以要继续浪费3个字节的空间。此时结构体的大小为12。

到这里是不是对结构体内存对齐有个大致的了解了？

对于结构体嵌套结构体的情况举个栗子：

struct S1
{
	char c1;
	int i;
	char c2;
};
struct S2
{
	char c1;
	struct S1 s1;
	double d;
};
int main()
{
	printf("%d\\n", sizeof(struct S2));
	return 0;
}

char 偏移量为1

4. 如果嵌套了结构体的情况，嵌套的结构体对齐到自己的最大对齐数的整数倍处，结构体的整体大小就是所有最大对齐数（含嵌套结构体的对齐数）的整数倍

struct S1在通过上面的计算已知为12。

嵌套的结构体对齐到自己的最大对齐数的整数倍处：struct S1里面成员最大的对齐数为4（int）。但是在对齐数之后填充的字节个数为struct S1的字节大小。

double的类型为8（要从偏移量为8的倍数处开始往后填充）

此时结构体的大小为24，是最大偏移量的整数倍。

为什么存在结构对齐

大部分的参考资料都是如是说的：
1. 平台原因(移植原因)：不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。
2. 性能原因： 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于，为了访问未对齐的内存，处理器需要作两次内存访问；而对齐的内存访问仅需要一次访问

在这里解释下性能原因：

假设CPU一次读取4个比特位，如果存在内存对齐，每次读到的都是有效地址，此时CPU只需要读取一次就可以了。

第一次在读取时，假设CPU一次往后读取了4个比特位，其中0x00ff42 和它后面的地址对应的空间也被读取了。

在第二次读取时，又从0x00ff42那个位置开始读取，和第一次读取内存时地址0x00ff42访问了两遍。

这种重复的过程占用了不该消耗的CPU，导致性能下降。

总体来说：
结构体的内存对齐是拿空间来换取时间的做法。

那在设计结构体的时候，我们既要满足对齐，又要节省空间，如何做到？

1、让占用空间小的变量尽量集中在一起

//例如：
struct S1
{
char c1;
int i;
char c2;
};
struct S2
{
char c1;
char c2;
int i;
};

S1和S2的成员变量一样，但是结构体大小却不一样。

2、修改默认对齐数

#pragma pack(2)//假设设置默认对齐数为2

#pragma pack() //取消默认对齐数，还原为默认

实际比较一下：

#include <stdio.h>
#pragma pack(8)//设置默认对齐数为8
struct S1
{
	char c1;
	int i;
	char c2;
};
#pragma pack()//取消设置的默认对齐数，还原为默认

#pragma pack(1)//设置默认对齐数为8
struct S2
{
	char c1;
	int i;
	char c2;
};
#pragma pack()//取消设置的默认对齐数，还原为默认
int main()
{
	//输出的结果是什么？
	printf("%d\\n", sizeof(struct S1));
	printf("%d\\n", sizeof(struct S2));
	return 0;
}

结果如下：

结论：结构在对齐方式不合适的时候，我么可以自己更改默认对齐数。

注意：尽量设置为2的次方个数。

offsetof 宏实现

既然了解了结构体偏移量，在这里介绍一个函数:offsetof(计算结构体中某变量相对于首地址的偏移量)

structNama：结构体类型名

memberName：对应结构体成员中的变量名

#include<stdio.h>
#include<stddef.h>
//例如：
struct S1
{
	char c1;
	int i;
	char c2;
}s1;
int main()
{
	int ret = offsetof(struct S1, i);
	printf("%d\\n", ret);
	return 0;
}

运行结果：

位段

什么是位段？

位段的声明和结构是类似的，有两个不同：
1.位段的成员必须是 int、unsigned int 或signed int....（整型）。
2.位段的成员名后边有一个冒号和一个数字。

举个栗子：

struct A
{
int _a:2;
int _b:5;
int _c:10;
int _d:30;
};

A就是一个位段类型。那位段A的大小是多少？

测试结果如下：

这时候我们发现计算出来的结果大小和我们的预测很不一样。通常我们会以结构体的计算方式来，但是在这里并不是这样。

那具体是怎么计算的呢？

在存放_a的时候首先开辟一个4个字节的空间 - 32个比特位;

_a占2个字节；紧接着_b会在同一块空间存放；_c也会接着存放；此时一共占用了17个比特位<32个比特位。

_d在存放时，第一次开辟的32个比特位空间大小不够了，会重新开辟一次；

整体一共开辟8个字节。

位段的内存分配

1. 位段的成员可以是 int unsigned int signed int 或者是 char （属于整形家族）类型
2. 位段的空间上是按照需要以4个字节（ int ）或者1个字节（ char ）的方式来开辟的。
3. 位段涉及很多不确定因素，位段是不跨平台的，注重可移植的程序应该避免使用位段。

我们接下来以VS为例，来测试一下。

举个栗子：

struct S
{
char a:3;
char b:4;
char c:5;
char d:4;
};
struct S s = {0};
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;

用一张图来解释~

位段的跨平台问题

1. int 位段被当成有符号数还是无符号数是不确定的。
2. 位段中最大位的数目不能确定。（16位机器最大16，32位机器最大32，写成27，在16位机器会出问题。
3. 位段中的成员在内存中从左向右分配，还是从右向左分配标准尚未定义。
4. 当一个结构包含两个位段，第二个位段成员比较大，无法容纳于第一个位段剩余的位时，是舍弃剩余的位还是利用，这是不确定的。

总结：

跟结构相比，位段可以达到同样的效果，但是可以很好的节省空间，但是有跨平台的问题存在。

位段的应用

假如我们给某个人发消息时，传输信息时并不简简单单的把消息传输到后台服务器，而是将分装好的消息进行传输，由上图可知，有效的利用了位段的特点，将各类要分装的信息空间利用合理化，有效节省空间，这样整个网络状态就大大提高。

如果不使用位段的，好比高速公路上全是大卡车在行驶；如果使用位段，好比高速公路上全是小轿车在跑。这两者对比起来我们不难发现后者情况交通会更加流畅。

枚举

枚举顾名思义就是一一列举。
把可能的取值一一列举。

比如我们现实生活中：
一周的星期一到星期日是有限的7天，可以一一列举。
性别有：男、女、保密，也可以一一列举。
月份有12个月，也可以一一列举
颜色也可以一一列举。

枚举的定义

enum Day//星期
{
	Mon,
	Tues,
	Wed,
	Thur,
	Fri,
	Sat,
	Sun
};
enum Sex//性别
{
	MALE,
	FEMALE,
	SECRET
}；
enum Color//颜色
{
	RED,
	GREEN,
	BLUE
};

以上定义的 enum Day ， enum Sex ， enum Color 都是枚举类型。 {}中的内容是枚举类型的可能取值，也叫枚举常量。

这些可能取值都是有值的，默认从0开始，一次递增1，当然在定义的时候也可以赋初值。例如：
enum Color//颜色
{
   RED = 1,
   GREEN = 4,
   BLUE
};

对于每个变量的数值情况：

枚举的优点

为什么使用枚举？
我们可以使用 #define 定义常量，为什么非要使用枚举？枚举的优点：
1. 增加代码的可读性和可维护性
2. 和#define定义的标识符比较枚举有类型检查，更加严谨。
3. 防止了命名污染（封装）
4. 便于调试
5. 使用方便，一次可以定义多个常量

枚举的使用

enum Color//颜色
{
RED=1,
GREEN=2,
BLUE=4
};
enum Color clr = GREEN;

这种方法可行不？此时clr的大小是多少？

枚举也可以像结构体一样在开始设置变量。

enum Color//颜色
{
	RED = 1,
	GREEN = 2,
	BLUE = 4
}clr;
int main()
{
	clr = RED;
	printf("%d\\n", clr);
	return 0;
}

比如：

联合（共用体）

联合类型的定义

联合也是一种特殊的自定义类型这种类型定义的变量也包含一系列的成员，特征是这些成员公用同一块空间（所以联合也叫共用体）。比如：

//联合类型的声明
union Un
{
char c;
int i;
};
//联合变量的定义
union Un un;
//计算大小
printf("%d\\n", sizeof(un));

测试如下：

在这联合体中，成员变量中最大的是int 类型，则un的大小最小是4个字节。

联合体大小计算也存在对齐情况，要对齐到最大对齐数的整数倍。所以在这里un大小是4。

在后面也会有具体介绍。

联合体的特点

联合的成员是共用同一块内存空间的，这样一个联合变量的大小，至少是最大成员的大小（因为联合至少得有能力保存最大的那个成员）。

union Un
{
int i;
char c;
};
union Un un;
// 下面输出的结果是一样的吗？
printf("%d\\n", &(un.i));
printf("%d\\n", &(un.c));

我们发现它们的起始地址是一样的。
//下面输出的结果是什么？
un.i = 0x11223344;
un.c = 0x55;
printf("%x\\n", un.i);

具体涉及到大小端的存储方式，结果如下：

面试题：
判断当前计算机的大小端存储

#include<stdio.h> 
int Check()
{
	union U
	{
		int i;
		char a;
	}u;
	u.i = 1;
	//返回1---小端
	//返回0---大端
	return u.a;
}
int main()
{
	int ret = Check();
	if (ret == 1)
	{
		printf("小端\\n");
	}
	else
	{
		printf("大端\\n");
	}
	return 0;
}

联合大小的计算

联合的大小至少是最大成员的大小。
当最大成员大小不是最大对齐数的整数倍的时候，就要对齐到最大对齐数的整数倍。
比如：

union Un1
{
char c[5];
int i;
};
union Un2
{
short c[7];
int i;
};
//下面输出的结果是什么？
printf("%d\\n", sizeof(union Un1));

c是一个数组，包含5个char类型每个大小为1个字节；数组总共是5个字节

int是4个字节；

所以这个共用体大小至少为5个字节；最大对齐数又是4，所以要浪费3个字节的空间。

则该共用体的大小事8个字节。

printf("%d\\n", sizeof(union Un2));

c是一个数组，包含7个short类型每个大小为2个字节；数组总共是14个字节

int是4个字节；

所以这个共用体大小至少为14个字节；最大对齐数又是4，所以要浪费2个字节的空间。

则该共用体的大小事16个字节。

测试结果：

以上是关于自定义结构类型：结构体枚举联合的主要内容，如果未能解决你的问题，请参考以下文章

自定义结构类型：结构体枚举联合

结构体

结构的声明

特殊的声明

结构的自引用

结构体内存对齐

为什么存在结构对齐

那在设计结构体的时候，我们既要满足对齐，又要节省空间，如何做到？

offsetof 宏实现

位段

位段的内存分配

位段的跨平台问题

位段的应用

枚举

枚举的定义

枚举的优点

枚举的使用

联合（共用体）

联合类型的定义

联合体的特点

面试题： 判断当前计算机的大小端存储

联合大小的计算

面试题：
判断当前计算机的大小端存储