自定义类型的这些知识你知道吗?C语言超硬核结构体枚举联合体画图+文字详细讲解
Posted 小赵小赵福星高照~
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了自定义类型的这些知识你知道吗?C语言超硬核结构体枚举联合体画图+文字详细讲解相关的知识,希望对你有一定的参考价值。
自定义类型详解(结构体+枚举)
数据经常以成组的形式存在。例如,一本书必须指定书名,书的价格,书号。如果这些值能够存储在一起,访问起来会很简单。但是如果这些值的类型不同,它们无法存储在数组当中,在C语言中,使用结构可以把这些不同类型的值存储在一起。
接下来博主将以以下内容进行自定义类型的讲解:
文章目录
结构体
结构体的基础知识
数组是一组相同类型的元素的集合,结构体也是一些值的集合,这些值称为它的成员,结构的每个成员可以是不同类型。
有关结构体的一些基础知识,博主的另一篇文章也介绍了结构体的基础知识,有兴趣可以看一下:结构体
结构体的声明
在声明结构体时,我们需要列出它的所有成员。这个列表包括每个成员的类型和名字
struct Book
{
char name[20];
int price;//成员变量
char id[10];
}b4,b5,b6;//结构体变量,全局变量
int main()
{
struct Book b1;//b1,b2,b3为局部变量
struct Book b2;
struct Book b3;
return 0;
}
struct是结构体关键字。Book是是结构体的名字,也是标签,大括号里面声明的它的成员,这个声明创建了b4,b5,b6三个结构体变量,它们都包含三个成员:两个字符数组,一个整数,注意它们在声明时创建时是全局变量,而在main函数里面创建的b1,b2,b3变量为局部变量。
结构体的特殊声明
在声明结构体时我们可以匿名结构体类型,将标签省略。请看下面代码:
//匿名结构体类型,将标签省略
struct
{
char c;
int i;
char ch;
double d;
}s;//结构体变量
struct
{
char c;
int i;
char ch;
double d;
}* ps;//结构体变量
int main()
{
ps=&s;//error,是不可以的
//在编译器看来,虽然你们的成员变量是一样的,但编译器认为它们是不一样的结构体类型
return 0;
}
我们匿名声明结构体时,需要注意:在编译器看来,虽然你们的成员变量是一样的,但编译器认为它们是不一样的结构体类型,这两个声明被编译器当成了两种截然不同的类型因此变量s和变量ps的类型不同,所以ps=&s是非法的。
注意:匿名声明结构体,它只能在声明时创建结构体变量
结构体的自引用
一个结构体的成员可以是一个结构:
struct A
{
int i;
char c;
};
struct B
{
char c;
struct A sa;
double d;
};
那么在结构内部包含一个类型为该结构体本身的成员是否合法呢?
struct C
{
int d;
struct C c;//这样是不行的
};
这种自引用是不正确的,因为成员是c一个完整的结构,其内部还包括它自己的成员c,这第2个成员又是另一个完整的结构,它还将包括它自己的成员c,这样重复下去永无止境。就像一个永远不会终止的递归程序。
正确的结构体自引用如下:
struct C
{
int d;
struct C* c;//正确的结构体的自引用
};
c是一个指针,它指向的元素类型是struct C,它所指向的是同一种类型的不同结构。
注意下面这个陷阱:
typedef struct
{
int d;
Node* c;
}Node;//不正确,这里typedef类型重命名时,需要成员变量的类型确定了,才会重命名,所以新的名字在结构体成员里是不能直接用的
这个声明的目的是为了类型重命名为Node,但是,它失败了,为什么呢?是因为类型名直到声明的末尾才定义,所以在结构声明的内部它还没有定义。
我们可以定义一个结构标签来声明c,这样就可以了:
typedef struct Node_Tag
{
int d;
struct Node_Tag * c;
}Node;
结构体变量的定义和初始化
结构的成员可以是标量、数组、指针、甚至是其他结构体。
给结构体变量初始化时与数组相似,需要用{}大括号,这些初始化的值根据结构成员列表的顺序写出。
struct S
{
char ch;
int i;
}s1,s2;
struct A
{
int i;
char c;
struct S s;
};
int main()
{
struct S s3={'a',20};
struct A a={10,'b',{'b',30}};
printf("%d %c %c %d",a.i,a.c,a.s.ch,a.s.i);
return 0;
}
结构体内存对齐
我们首先看下面的代码
struct S
{
int i;//4
char c1;//1
char c2;//1
};
#include<stdio.h>
int main()
{
struct S s={0};
printf("%d\\n",sizeof(s));
return 0;
}
s所占的空间大小是多少呢?答案是8个字节
为什么呢?一个int类型两个char类型不应该是6字节吗?
这里就有关于结构体大小的一个规则,结构体的内存对齐:
- 第一个成员在与结构体变量偏移量为0的地址处。
- 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。
VS中默认的值为8
linux-没有默认对齐数的概念- 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
- 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所
有最大对齐数(含嵌套结构体的对齐数)的整数倍。
上面结构体大小的解释:
//练习1
struct S1
{
char c1;
int i;
char c2;
};
printf("%d\\n", sizeof(struct S1));
//练习2
struct S2
{
char c1;
char c2;
int i;
};
printf("%d\\n", sizeof(struct S2));
//练习3
struct S3
{
double d;
char c;
int i;
};
printf("%d\\n", sizeof(struct S3));
//练习4-结构体嵌套问题
struct S4
{
char c1;0
struct S3 s3;8-23
double d;24-31
};
printf("%d\\n", sizeof(struct S4));
练习1讲解:
练习2讲解:
练习3讲解:
练习4讲解:
为什么存在内存对齐?
- 平台原因(移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
- 性能原因: 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。 原因在于,为了访问未对齐的内存,处理器
需要作两次内存访问;而对齐的内存访问仅需要一次访问。
看下面这个结构体,我们举例说明一下为什么要内存对齐
struct S
{
char c;
int i;
}s;
假设一个计算机一次访问4个字节,第一种访问一次就能完整的访问到i,第二种首先访问c和i的前三个字节,然后访问i的第四个字节和后面三个字节。需要通过两次访问才能将i完全访问,这时有人可能会疑惑,我们为什么不直接找到i直接访问i的四个字节呢?别忘了我们的第一个原因:不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
结构体的内存对齐是拿空间来换取时间的做法。
那我们在设计结构体的时候,我们既要满足对齐,又要节省空间,我们如何做到呢?
让空间小的成员尽量集中在一起
例如:
//例如:
struct S1
{
char c1;
int i;
char c2;
};
struct S2
{
char c1;
char c2;
int i;
};
上面定义的结构体S2就比S1省空间
修改默认对齐数
那么我们可不可以修改默认对齐数数呢?答案是可以的。
#include<stdio.h>
struct S
{
char c1;
int i;
char c2;
};
int main()
{
printf("%d\\n",sizeof(struct S));//12
return 0;
}
不修改默认对齐数时,上面代码中的结构体大小为12。
如何修改默认对齐数呢?
//默认对齐数为8
//把默认对齐数改为2
#pragma pack(2)
这样我们就把我们的默认对齐数修改为2了。
#include<stdio.h>
//默认对齐数为8
//把默认对齐数改为2
#pragma pack(2)
struct S
{
char c1;0
int i;2-5
char c2;6
7
};
int main()
{
printf("%d\\n",sizeof(struct S));//8
return 0;
}
修改默认对齐数后,结构体大小变成了8
结构体传参
值传递:
struct S
{
int date[1000];
int num;
};
struct S s={{1,2,3,4},1000};
void print1(struct S s)
{
printf("%d\\n",s.num);
}
int main()
{
print1(s);//结构体地址传递
return 0;
}
地址传递:
struct S
{
int date[1000];
int num;
};
struct S s={{1,2,3,4},1000};
void print2(struct S* s)
{
printf("%d\\n",s->num);
}
int main()
{
print2(&s);//结构体地址传递
return 0;
}
上面的print1和print2函数哪个好一些呢?
答案是print2。原因:
函数传参的时候,参数是需要压栈的。如果传递一个结构体对象的时候,结构体过大,参数压栈的系统开销比较大,所以会导致性能的下降。
结论:结构体传参的时候,传结构体的地址好一些。
位段
关于结构,我们还需要提到它们实现位段的能力。位段的声明和结构类型,但它的成员是一个或多个位的字段。这些不同长度的字段实际上存储于一个或多个整形变量中。
什么是位段
位段的声明和结构是类似的,但是有两个不同:
1.位段的成员必须是 int、unsigned int 或signed int 。
2.位段的成员名后边有一个冒号和一个数字。这个整数指定该位段所占用的位的数目
位段的声明
struct A
{
int _a:2;//_a成员占两个bit位
int _b:5;//_b成员占5个bit位
int _c:10;//_c成员占10个比特位
int _d:30;//_d成员占30个bit位
};
A就是一个位段类型,那位段A的大小是多少呢?
#include<stdio.h>
struct A
{
int _a : 2;
int _b : 5;
int _c : 10;
int _d : 30;
};
int main()
{
printf("%d\\n", sizeof(struct A));
return 0;
}
首先_a是int类型,开辟4个字节的空间,_a占了2bit,_b占了5bit,_c占了10bit,此时32个bit位还剩下15个bit位,已经放不下_d(30bit)了,所以我们再开辟4个字节的空间,将_d放在新开辟的空间中,所以我们A位段的大小为8字节。那么我们能不能利用空间,将_d的15个bit位放入刚开始开辟的空间中去呢?这是不确定的,当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
位段的内存分配
-
位段的成员可以是 int ,unsigned int ,signed int 或者是 char (属于整形家族)类型
-
位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
-
位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。
下面我们看一个例子:
struct S
{
char a : 3;
char b : 4;
char c : 5;
char d : 4;
};
int main()
{
struct S s = { 0 };
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
return 0;
}
代码图解:
我们调试发现结构体内存中果然是这样存储的:
注意:
注重可移植的程序应该避免使用位段。由于下面这些与实现有关的依赖性,位段在不同的编译器或者系统中可能会有不同的结果
- int被当作有符号数还是无符号数是不确定的
- 位段中位的最大数目;好多编译器把位段成员的长度限制在一个整型值的长度以内,一个能够运行在32位机器上的位段,可能在16位机器上是无法运行的
- 位段中的成员的内存是从左向右分配还是从右向左是不确定的
- 当一个位段结构包含两个位段成员,第二个位段成员比较大,无法容纳于第一个位段成员存储空间剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
枚举
枚举的优点
我们为什么使用枚举呢?
- 增加代码的可读性和可维护性
- 和#define定义的标识符比较,枚举有类型检查,更加严谨。
- 防止了命名污染(封装)
- 便于调试
- 使用方便,一次可以定义多个常量
源文件是经过怎么样的一个过程生成可执行文件的呢?
源文件在经过编译链接后得到可执行文件。#define定义的常量在预编译阶段处理,我们在调试时,常量已经全部被处理了,不便于调试,而枚举是便于调试的。
枚举类型的声明
枚举顾名思义就是一一列举
枚举是 C 语言中的一种基本数据类型,它可以让数据更简洁,更易读。
枚举语法定义格式为:
enum 枚举名
{
枚举元素1,
枚举元素2,
...
};
首先我们举个例子,比如:一星期有7天,如果不用枚举,我们需要使用 #define 来为每个整数定义一个别名:
#define MON 1
#define TUE 2
#define WED 3
#define THU 4
#define FRI 5
#define SAT 6
#define SUN 7
接下来我们看一看枚举的方式:
enum DAY
{
MON=1,TUE,WED,THU,FRI,SAT,SUN
};
这样我们发现代码变得更加简洁了。
注意:
第一个枚举成员的默认值为整型的 0,后续枚举成员的值在前一个成员上加 1。我们如果把第一个枚举成员的值定义为 1,第二个就为 2,以此类推。
我们可以在定义枚举类型时可以改变枚举元素的值:
enum season {spring, summer=3, autumn, winter};
没有指定值的枚举元素,其值为前一元素加 1。也就说 spring 的值为 0,summer 的值为 3,autumn 的值为 4,winter 的值为 5
枚举变量的定义
前面我们讲的是枚举类型的声明,接下来我们看看如何定义枚举变量
我们有三种方式来定义枚举变量:
- 先定义枚举类型,再定义枚举变量
enum DAY
{
MON=1, TUE, WED, THU, FRI, SAT, SUN
};
enum DAY day;
注意:
enum DAY day = 2;//这个代码在c文件可以编译成功,但是在c++文件中不能成功
c文件可以编译成功,但是在c++文件中不能成功,2是int类型,int类型是不能赋给DAY类型,c++检查更加严格。
- 定义枚举类型的同时定义枚举变量
enum DAY
{
MON=1, TUE, WED, THU, FRI, SAT, SUN
} day;
- 省略枚举名称,直接定义枚举变量
enum
{
MON=1, TUE, WED, THU, FRI, SAT, SUN
} day;
枚举在 switch 中的使用
#include <stdio.h>
#include <stdlib.h>
int main()
{
enum color
{
red=1,
green,
blue
};
enum color favorite_color;
//用户输入数字来选择颜色
printf("请输入你喜欢的颜色: (1. red, 2. green, 3. blue): ");
scanf("%u", &favorite_color);
//输出结果
switch (favorite_color)
{
case red:
printf("你喜欢的颜色是红色");
break;
case green:
printf("你喜欢的颜色是绿色");
break;
case blue:
printf("你喜欢的颜色是蓝色");
break;
default:
printf("你没有选择你喜欢的颜色");
}
return 0;
}
联合
联合也是一种特殊的自定义类型,这种类型定义的变量也包含一系列的成员,特征是这些成员公用同一块空间(所以联合也叫共用体)。
联合体的声明和定义
联合类型的声明
//联合类型的声明
union Un
{
char c;
int i;
};
联合变量的定义
union Un u;
那么联合变量的大小是多少怎么计算呢?
//联合类型的声明
union Un
{
char c;//1
int i;//4
};
int main()
{
///联合变量的定义和初始化
union Un u={0};
printf("%d\\n",sizeof(u));//计算联合变量的大小
return 0;
}
我们发现这个联合变量大小为4,char是1字节,int为4字节,不应该至少是5字
以上是关于自定义类型的这些知识你知道吗?C语言超硬核结构体枚举联合体画图+文字详细讲解的主要内容,如果未能解决你的问题,请参考以下文章
指针的这些知识你知道吗?C语言超硬核指针进阶版3w+字详解+指针笔试题画图+文字详细讲解
Go语言结构体struct详解,Go空结构体的这些妙用你知道吗?