C语言结构体及其内存对齐枚举联合的介绍

Posted aaaaaaaWoLan

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了C语言结构体及其内存对齐枚举联合的介绍相关的知识,希望对你有一定的参考价值。

c语言中允许自己创建类型,有结构体,枚举及联合体,以下就是对这三种自定义类型的讲解

结构体

结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。

结构的声明

struct tag

{

 member-list; 
}variable-list;

例如描述一个学生:

struct Stu

{

 char name[20];//名字

 int age;//年龄

 char sex[5];//性别

 char id[20];//学号

}//分号不能丢

特殊的声明

在声明结构的时候,可以不完全的声明。

比如:

//匿名结构体类型

struct//无名称

{

 int a;

 char b;

 float c; 
}x;

struct

{

 int a;

 char b;

 float c; 
}a[20], *p;

上面的两个结构在声明的时候省略掉了结构体标签(tag)。

那么问题来了

//在上面代码的基础上,下面的代码合法吗?

p = &x;	

不合法!!!

警告: 编译器会把上面的两个声明当成完全不同的两个类型。 所以是非法的。

匿名结构体类型只能使用一次,不能再次用其创建新变量

结构的自引用

在结构中包含一个类型为该结构本身的成员是否可以呢?

//代码1

struct Node

{

 int data;

 struct Node next;

};

//可行?

如果可以,那sizeof(struct Node)是多少?

不可行,此时会陷入死循环的创建结构体

正确的自引用方式:

//代码2

struct Node

{

 int data;

 struct Node* next;

}

与链表有关,利用struct Node* next可找到下一个结构体

注意:

//代码3

typedef struct

{

 int data;

 Node* next; 
}Node;

//这样写代码,可行?
//不可行,因为结构体还未重命名成功,就先使用了结构体重命名后的名字

//解决方案:

typedef struct Node

{

 int data;

 struct Node* next; 
}Node;//此时struct Node已经生成了,故可以使用该结构体变量名定义指针

结构体变量的定义和初始化

有了结构体类型,那如何定义变量,其实很简单。

struct Point

{

 int x;

 int y; 
}p1; //声明类型的同时定义变量p1

struct Point p2; //定义结构体变量p2

//初始化:定义变量的同时赋初值。

struct Point p3 = {x, y};

struct Stu        //类型声明

{

 char name[15];//名字

 int age;      //年龄

};

struct Stu s = {"zhangsan", 20};//初始化

struct Node

{

 int data;

 struct Point p;

 struct Node* next; 

}n1 = {10, {4,5}, NULL}; //结构体嵌套初始化
struct Node n2 = {20, {5, 6}, NULL};//结构体嵌套初始化

结构体内存对齐

我们已经掌握了结构体的基本使用了。

现在我们深入讨论一个问题:计算结构体的大小。

先来看几道练习:

//练习1

struct S1

{

 char c1;

 int i;

 char c2;

};

printf("%d\\n", sizeof(struct S1));

//练习2

struct S2

{

 char c1;

 char c2;

 int i;

};

printf("%d\\n", sizeof(struct S2));

//练习3

struct S3

{

 double d;

 char c;

 int i;

};

printf("%d\\n", sizeof(struct S3));

//练习4-结构体嵌套问题

struct S4

{

 char c1;

 struct S3 s3;

 double d;

};

printf("%d\\n", sizeof(struct S4));

结果是:12 8 16 32

如何得出的呢?

我们有必要了解结构体的对齐规则:

  1. 第一个成员在与结构体变量偏移量为0的地址处。

  2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。

对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值

VS中默认的值为8

  1. 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。

  2. 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。

以s1为例进行画图分析

image-20210614171942525

而s1的最大对齐数即为 i 的对齐数4,所以s1的内存大小应该为4的正整数倍,此时s1已经占用了9个字节了,所以8个字节是不够存下这个结构体的,只能往后加至12,故s1会有内存浪费,加上前面三个共6个字节被浪费

再解释下嵌套结构体的内存:

image-20210614172017211

为什么存在内存对齐?

大部分的参考资料都是如是说的:

  1. 平台原因(移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。

  2. 性能原因: 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。 原因在于,为了访问未对齐的内存,处理需要作两次内存访问;而对齐的内存访问仅需要一次访问

总体来说:

结构体的内存对齐是拿空间来换取时间的做法

那在设计结构体的时候,我们既要满足对齐,又要节省空间,如何做到:

让占用空间小的成员尽量集中在一起

//例如:

struct S1

{

 	char c1;

     int i;

 	char c2;

};

struct S2

{

     char c1;

    char c2;
    int i; 

};
struct S3

{
  	int i; 

     char c1;

    char c2;

};

S1、S2和S3类型的成员一模一样,但是三者所占空间的大小有了一些区别。

S1占用了12个字节的空间,S2占用了8个字节的空间,S3则只占用了6个字节的空间

修改默认对齐数

之前我们见过了 #pragma 这个预处理指令,这里我们再次使用,可以改变我们的默认对齐数。

#include <stdio.h>

#pragma pack(8)//设置默认对齐数为8

struct S1

{

 char c1;

 int i;

 char c2;
 };

#pragma pack()//取消设置的默认对齐数,还原为默认

#pragma pack(1)//设置默认对齐数为1

struct S2

{

 char c1;

 int i;

 char c2;

};

#pragma pack()//取消设置的默认对齐数,还原为默认

int main()

{

    //输出的结果是什么?

    printf("%d\\n", sizeof(struct S1));

    printf("%d\\n", sizeof(struct S2));

    return 0; 
}

注:在修改完一个结构体的默认对齐数后,如果不需要再使用,记得再用#pragma pack() 还原为默认

结论:

结构在对齐方式不合适的时候,我们可以自己更改默认对齐数

offsetof

#include <stdio.h>
#include <stddef.h>
struct S

{

 char c1;

 int i;

 char c2;

};
int main()
{
    printf("%d\\n", offsetof(struct S, c1));
     printf("%d\\n", offsetof(struct S, i));
      printf("%d\\n", offsetof(struct S, c2));
    return 0;
}

使用offsetof需要引头文件

结果如下图:

image-20210614084610218

结构体传参

直接上代码:

struct S 
{

 int data[1000];

 int num;

};

struct S s = {{1,2,3,4}, 1000};

//结构体传参

void print1(struct S s) 
{

 printf("%d\\n", s.num);

}

//结构体地址传参

void print2(struct S* ps) 
{

 printf("%d\\n", ps->num);

 }

int main()

{

 print1(s);  //传结构体

 print2(&s); //传地址

 return 0; 
}

上面的 print1 和 print2 函数哪个好些?

答案是:首选print2函数。 原因:

函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。

如果传递一个结构体对象的时候,结构体过大,参数压栈的的系统开销比较大,所以会导致性能的下降。

并且传址的话,可以修改结构成员的值,而如果不想改,则可以在定义形参指针时在前面加上const

结论: 结构体传参的时候,要传结构体的地址。

位段

结构体讲完就得讲讲结构体实现 位段 的能力。

什么是位段

位段的声明和结构是类似的,有两个不同:

1.位段的成员必须是 int、unsigned int 或signed int 。

2.位段的成员名后边有一个冒号和一个数字。

比如:

struct A 
{

 int a:2;

 int b:5;

 int c:10;

 int d:30;

};

A就是一个位段类型。

那位段A的大小是多少?

printf("%d\\n", sizeof(struct A));

结果是:

image-20210614091826863

并且,此时a,b,c,d的大小不能超过32个bit

位段的内存分配

  1. 位段的成员可以是 int 、unsigned int、 signed int 或者是 char (属于整形家族)类型

  2. 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。

  3. 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。

//一个例子

struct S 
{

 char a:3;

 char b:4;

 char c:5;

 char d:4;

};

int main()
{
    struct S s = {0};
    s.a = 10; 
    s.b = 12; 
    s.c = 3; 
    s.d = 4;
    return 0;
}

//空间是如何开辟的?

a占3个bit位,b占4个bit位,所以a,b可用一个字节存放

c占5个bit位,第一个字节已经存放不下了,所以开辟第二个字节的空间,而此时是把c的一个bit位放在第一个字节中,剩下四个放在第二个字节中,还是5个bit位都放在第二个字节中呢?在VS中,情况与后者相符

所以第二个字节还剩下3个bit位的大小,存放不下d的大小,需要再开辟一个字节的大小存放d

所以s初始化为0后的内存情况是这样的:00000000(a和b) 00000000(c) 00000000(d),当然,也只有初始化为0了才能够看到后来赋值后的结果不然是随机值的话可能会导致结果有误

来看赋值:

a只能接收3个bit的大小,而赋值a=10,10的二进制位是0…1010,所以a只能接收最后3个bit位,那么问题又来了,a是在高位还是低位呢?VS中是在低位,所以此时内存变为了00000 010 00000000 00000000

b可以接收4个bit位,b被赋值为12,12的二进制位是0…1100,所以b刚好可以接收1100,此时内存又变为了:

0 1100 010 00000000 00000000

c可以接收5个bit位,c被赋值为3,3的二进制位是0…00011,所以c可以接收00011,此时内存变为了:

0 1100 010 000 00011 00000000

d可以接收4个bit位,d被赋值为4,4的二进制位是0…0100,所以c可以接收0100,此时内存变为了:

0 1100 010 000 00011 00000100

所以此时可以通过调试观察s的内存设置情况,而内存是以十六进制形式呈现的

即0110 0010 0000 0011 0000 0100转换成十六进制:

​ 6 2 0 3 0 4

我们可以看vs2019的结果:

image-20210614091945288

可以看到结果也是62 03 04

位段的跨平台问题

​ 1.位段被当成有符号数还是无符号数是不确定的。

  1. 位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题。)

16位机器中int的大小的2个字节,32位是4个

所以在16位平台上,之前的b:30就会出错

  1. 位段中的成员在内存中从低位向高位分配,还是从高位向低位分配标准尚未定义。

根据上面的结果,可以看到VS2019中是从低位向高位分配的

  1. 当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。

同样,根据上面的结果,在VS2019中是舍弃剩余的位

不同编译器处理1.3.4是不一样的,所以位段的使用需要考虑跨平台问题,如果想跨平台,必须要提前了解清楚另一个平台是否和原平台处理这些问题的方法相同

总结:

跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题存在。

位段的应用

image-20210614092114421

枚举类型

枚举

枚举顾名思义就是一一列举。

把可能的取值一一列举。

比如我们现实生活中:

一周的星期一到星期日是有限的7天,可以一一列举。

性别有:男、女、保密,也可以一一列举。

月份有12个月,也可以一一列举

颜色也可以一一列举。

这里就可以使用枚举了。

枚举是一种类型

枚举类型的定义

enum Day//星期

{

 Mon,

 Tues,

 Wed,

 Thur,

 Fri,

 Sat,

 Sun

};

enum Sex//性别

{

 MALE,

 FEMALE,

 SECRET

}enum Color//颜色

{

 RED,
  GREEN,

 BLUE

};

以上定义的 enum Day , enum Sex , enum Color 都是枚举类型。

每一个成员之间逗号隔开

{}中的内容是枚举类型的可能取值,也叫 枚举常量 。

这些可能取值都是有值的,默认从0开始,一次递增1,当然在定义的时候也可以赋初值。 例如:

enum Color//颜色

{ 

 RED=1, 

 GREEN=2, 

 BLUE=4 

}; 

枚举常量的大小和int大小相同

枚举的优点

为什么使用枚举?

我们可以使用#define定义常量,为什么非要使用枚举?枚举的优点:

  1. 增加代码的可读性和可维护性

比如计算器:(并不实现具体函数)

void menu()
{
	printf("*****************************\\n");
	printf("****  1. add    2. sub  *****\\n");
	printf("****  3. mul    4. div  *****\\n");
	printf("****  0. exit          *****\\n");
	printf("*****************************\\n");
}

enum Option
{
	EXIT,//0
	ADD,//1
	SUB,//2
	MUL,//3
	DIV//4
};

int main()
{
	int input = 0;
	do
	{
		menu();
		printf("请选择:>");
		scanf("%d", &input);
		switch (input)
		{
		case ADD://ADD表示1
  			Add();
			break;
		case SUB://SUB表示2
  			Sub();  				
			break;
		case MUL://MUL表示3
  			Mul();
			break;
		case DIV://DIV表示4
   		Div();
			break;
		case EXIT://EXIT表示0
			break;
		default:
			break;
		}
	} while (input);


	return 0;
}
  1. 和#define定义的标识符比较枚举有类型检查,更加严谨。

如:

enum Color//颜色

{ 

 RED=1, 

 GREEN=2, 

 BLUE=4 

}; 

enum Color clr = 2;//此时如果用cpp编写,编译器会报错,因为2是整型,与枚举类型不匹配
  1. 防止了命名污染(封装)

#define定义的常量是全局的,可能会造成与局部变量的重名

  1. 便于调试

#define定义的常量在预处理时已经被替换成了实数,调试时就已经被换成常数了,观察不到它的问题,而枚举常量并没有替换,所以可以观察到是不是枚举常量的问题

  1. 使用方便,一次可以定义多个常量

#define定义多个常量比较繁琐

枚举的使用

enum Color//颜色

{ 

 RED=1, 

 GREEN=2, 

 BLUE=4 

}; 

enum Color clr = GREEN;//只能拿枚举常量给枚举变量赋值,才不会出现类型的差异。

clr = 5; //ok??
//不行,因为枚举类型不能用其他类型的值进行赋值,只能用枚举常量对枚举类型的变量赋值

不同枚举类型可以使用不同的枚举类型常量赋值,如:

enum weekday {
	mon,
	tue,
	wen,
	thu,
	fri,
	sat,
	sun
};
enum color {
	red,
	blue,
	green
};
int main()
{
	enum weekday day = green;
	printf("%d\\n", day);
}

结果是:

image-20210614092423226

联合(共用体)

联合类型的定义

联合也是一种特殊的自定义类型 这种类型定义的变量也包含一系列的成员,特征是这些成员公用同一块空间(所以

联合也叫共用体)。 比如:

//联合类型的声明
union Un 
{ 
 char c; 
 int i; 
}; 
//联合变量的定义
union Un un; 
//计算这个变量的大小
printf("%d\\n", sizeof(un));

结果为:

image-20210615193545873

共用体顾名思义,就是共用内存的意思,所以实际上这里的共用体un只占用了4个字节即int的大小,但是共用体的大小是否就是最大成员的内存大小呢?

联合的特点

联合的成员是共用同一块内存空间的,这样一个联合变量的大小,至少是最大成员的大小(因为联合至少得有能力保存最大的那个成员)。

union Un 
{ 
 int i; 
 char c; 
}; 
union Un un; 
// 下面输出的结果是一样的吗?
printf("%d\\n", &(un.i)); 
printf("%d\\n", &(un.c)); 
//下面输出的结果是什么?
un.i = 0x11223344; 
un.c = 0x55; 
printf("%x\\n", un.i);

结果为:

image-20210615193859169

i的地址与c的地址是相同的,所以更可以体现共用体中内存是公用的

再看i被赋值成0x11223344后,再将c复制成0x55,打印结果为11223355

因为作者机器为小端存储,所以c能访问的就是44这个字节,也就是把44所在的内存单元改成了55

所以,共用体中成员的内存是共用的

联合大小的计算

联合的大小至少是最大成员的大小。

当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。

比如:

union Un1 
{ 
 char c[5]; 
 int i; 
}; 
union Un2 
{ 
 short c[7]; 
 int i; 
}; 
//下面输出的结果是什么?
printf("%d\\n", sizeof(union Un1)); 
printf("%d\\n", sizeof(union Un2));

结果为:

image-20210615194345588

我们看Un1的内存大小为8,如果按照我们之前所说的共用体内存是按照最大成员内存来定义,这里的结果应该是5,但结果并不如此

是因为共用体的内存也必须是最大对齐数的整数倍(把char c[5]看成是5个char变量,所以其对齐数就为1)

同样地,再看Un2,如果按照成员最大内存来定义其内存大小,本应该是14,但实际结果是16

综上:共用体的内存必须是成员中最大对齐数的整数倍

联合的应用

判断当前计算机的大小端存储

之前在讲解大小端时,就介绍了如何判断当前机器是大端存储还是小端存储,当时的方法是:

int main()
{
	int a = 1;
	if (*(char*)&a == 1)//如果是小端存储
		//低地址  ——>   高地址
		//则a的内存存放方式应该是:
		// 01 00 00 00  (十六进制)
		//如果是大端存储,则为:
		// 00 00 00 01  
		//而把a的地址强制类型转换为char*类型后进行访问,就只能访问一个字节的大小
		//所以如果是小端存储,访问到的就是01
		//如果是大端存储,访问到的就是00
		//通过两种结果的差异来判断机器的大小段存储模式
	{
		printf("小端\\n");
	}
	else
		printf("大端\\n");
	return 0;
C语言进阶自定义类型详解(结构体+枚举+联合)

C语言☀️自定义类型(结构体+位段+枚举+联合体)建议收藏

“解剖”c语言——自定义类型(结构体,位段,枚举,联合体)

C语言自定义类型重难点总结(结构体位段枚举联合)

C语言学习笔记(15)自定义类型:结构体,枚举,联合

C语言自定义数据类型:结构体,枚举,联合