自定义类型的这些知识你知道吗?C语言超硬核结构体枚举联合体画图+文字详细讲解

Posted 小赵小赵福星高照~

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了自定义类型的这些知识你知道吗?C语言超硬核结构体枚举联合体画图+文字详细讲解相关的知识,希望对你有一定的参考价值。

自定义类型详解(结构体+枚举)

数据经常以成组的形式存在。例如,一本书必须指定书名,书的价格,书号。如果这些值能够存储在一起,访问起来会很简单。但是如果这些值的类型不同,它们无法存储在数组当中,在C语言中,使用结构可以把这些不同类型的值存储在一起。

接下来博主将以以下内容进行自定义类型的讲解:

结构体


结构体的基础知识

数组是一组相同类型的元素的集合,结构体也是一些值的集合,这些值称为它的成员,结构的每个成员可以是不同类型。

有关结构体的一些基础知识,博主的另一篇文章也介绍了结构体的基础知识,有兴趣可以看一下:结构体


结构体的声明

在声明结构体时,我们需要列出它的所有成员。这个列表包括每个成员的类型和名字

struct Book
{
    char name[20];
    int price;//成员变量
    char id[10];
}b4,b5,b6;//结构体变量,全局变量
int main()
{
    struct Book b1;//b1,b2,b3为局部变量
    struct Book b2;
    struct Book b3;
    return 0;
}

struct是结构体关键字。Book是是结构体的名字,也是标签,大括号里面声明的它的成员,这个声明创建了b4,b5,b6三个结构体变量,它们都包含三个成员:两个字符数组,一个整数,注意它们在声明时创建时是全局变量,而在main函数里面创建的b1,b2,b3变量为局部变量。

结构体的特殊声明

在声明结构体时我们可以匿名结构体类型,将标签省略。请看下面代码:

//匿名结构体类型,将标签省略
struct 
{
    char c;
    int i;
    char ch;
    double d;
}s;//结构体变量
struct 
{
    char c;
    int i;
    char ch;
    double d;
}* ps;//结构体变量
int main()
{
    ps=&s;//error,是不可以的
    //在编译器看来,虽然你们的成员变量是一样的,但编译器认为它们是不一样的结构体类型
    return 0;
}

我们匿名声明结构体时,需要注意:在编译器看来,虽然你们的成员变量是一样的,但编译器认为它们是不一样的结构体类型,这两个声明被编译器当成了两种截然不同的类型因此变量s和变量ps的类型不同,所以ps=&s是非法的。

注意:匿名声明结构体,它只能在声明时创建结构体变量


结构体的自引用

一个结构体的成员可以是一个结构:

struct A
{
    int i;
    char c;
};
struct B
{
    char c;
    struct A sa;
    double d;
};

那么在结构内部包含一个类型为该结构体本身的成员是否合法呢?

struct C
{
  	int d;
    struct C c;//这样是不行的 
};

这种自引用是不正确的,因为成员是c一个完整的结构,其内部还包括它自己的成员c,这第2个成员又是另一个完整的结构,它还将包括它自己的成员c,这样重复下去永无止境。就像一个永远不会终止的递归程序。

正确的结构体自引用如下:

 struct C
 {
     int d;
     struct C* c;//正确的结构体的自引用
 };

c是一个指针,它指向的元素类型是struct C,它所指向的是同一种类型的不同结构。

注意下面这个陷阱:

typedef struct
{
    int d;
    Node* c;
}Node;//不正确,这里typedef类型重命名时,需要成员变量的类型确定了,才会重命名,所以新的名字在结构体成员里是不能直接用的

这个声明的目的是为了类型重命名为Node,但是,它失败了,为什么呢?是因为类型名直到声明的末尾才定义,所以在结构声明的内部它还没有定义。

我们可以定义一个结构标签来声明c,这样就可以了:

typedef struct Node_Tag
{
    int d;
    struct Node_Tag * c;
}Node;

结构体变量的定义和初始化

结构的成员可以是标量、数组、指针、甚至是其他结构体。

给结构体变量初始化时与数组相似,需要用{}大括号,这些初始化的值根据结构成员列表的顺序写出。

struct S
{
    char ch;
    int i;
}s1,s2;
struct A
{
    int i;
    char c;
    struct S s;
};
int main()
{
    struct S s3={'a',20};
    struct A a={10,'b',{'b',30}};
    printf("%d %c %c %d",a.i,a.c,a.s.ch,a.s.i);
    return 0;
}

image-20210614184458421


结构体内存对齐

我们首先看下面的代码

struct S
{
    int i;//4
    char c1;//1
    char c2;//1
};
#include<stdio.h>
int main()
{
 	struct S s={0};
    printf("%d\\n",sizeof(s));
    return 0;
}

s所占的空间大小是多少呢?答案是8个字节

image-20210614184951548

为什么呢?一个int类型两个char类型不应该是6字节吗?

这里就有关于结构体大小的一个规则,结构体的内存对齐

  • 第一个成员在与结构体变量偏移量为0的地址处。
  • 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。
    对齐数 = 编译器默认的一个对齐数 与 该成员大小的较小值。
    VS中默认的值为8
    linux-没有默认对齐数的概念
  • 结构体总大小为最大对齐数(每个成员变量都有一个对齐数)的整数倍。
  • 如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所
    有最大对齐数(含嵌套结构体的对齐数)的整数倍。

上面结构体大小的解释:

image-20210614201335795

//练习1
struct S1
{
    char c1;
    int i;
    char c2;
};
	printf("%d\\n", sizeof(struct S1));
//练习2
struct S2
{
    char c1;
    char c2;
    int i;
};
	printf("%d\\n", sizeof(struct S2));
//练习3
struct S3
{
    double d;
    char c;
    int i;
};
	printf("%d\\n", sizeof(struct S3));
//练习4-结构体嵌套问题
struct S4
{
    char c1;0
    struct S3 s3;8-23
    double d;24-31
};
	printf("%d\\n", sizeof(struct S4));

练习1讲解:

image-20210718153110259

练习2讲解:

image-20210718153213441

练习3讲解:

image-20210718154039948

练习4讲解:

image-20210718154938871

为什么存在内存对齐?

  1. 平台原因(移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
  2. 性能原因: 数据结构(尤其是栈)应该尽可能地在自然边界上对齐。 原因在于,为了访问未对齐的内存,处理器
    需要作两次内存访问;而对齐的内存访问仅需要一次访问。

看下面这个结构体,我们举例说明一下为什么要内存对齐

struct S
{
    char c;
    int i;
}s;

image-20210718160038924

假设一个计算机一次访问4个字节,第一种访问一次就能完整的访问到i,第二种首先访问c和i的前三个字节,然后访问i的第四个字节和后面三个字节。需要通过两次访问才能将i完全访问,这时有人可能会疑惑,我们为什么不直接找到i直接访问i的四个字节呢?别忘了我们的第一个原因:不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。

结构体的内存对齐是拿空间来换取时间的做法。

那我们在设计结构体的时候,我们既要满足对齐,又要节省空间,我们如何做到呢?

让空间小的成员尽量集中在一起

例如:

//例如:
struct S1
{
    char c1;
    int i;
    char c2;
};
struct S2
{
    char c1;
    char c2;
    int i;
};

上面定义的结构体S2就比S1省空间

修改默认对齐数

那么我们可不可以修改默认对齐数数呢?答案是可以的。

#include<stdio.h>
struct S
{
    char c1;
    int i;
    char c2;
};
int main()
{
    printf("%d\\n",sizeof(struct S));//12
    return 0;
}

不修改默认对齐数时,上面代码中的结构体大小为12。

如何修改默认对齐数呢?

//默认对齐数为8
//把默认对齐数改为2
#pragma pack(2)

这样我们就把我们的默认对齐数修改为2了。

#include<stdio.h>
//默认对齐数为8
//把默认对齐数改为2
#pragma pack(2)
struct S
{
    char c1;0
    int i;2-5
    char c2;6
        7
};
int main()
{
    printf("%d\\n",sizeof(struct S));//8
    return 0;
}

修改默认对齐数后,结构体大小变成了8


结构体传参

值传递:

struct S
{
    int date[1000];
    int num;
};
struct S s={{1,2,3,4},1000};
void print1(struct S s)
{
    printf("%d\\n",s.num);
}
int main()
{
    print1(s);//结构体地址传递
    return 0;
}

地址传递:

struct S
{
    int date[1000];
    int num;
};
struct S s={{1,2,3,4},1000};
void print2(struct S* s)
{
    printf("%d\\n",s->num);
}
int main()
{
    print2(&s);//结构体地址传递
    return 0;
}

上面的print1和print2函数哪个好一些呢?

答案是print2。原因:

函数传参的时候,参数是需要压栈的。如果传递一个结构体对象的时候,结构体过大,参数压栈的系统开销比较大,所以会导致性能的下降。

结论:结构体传参的时候,传结构体的地址好一些。


位段

关于结构,我们还需要提到它们实现位段的能力。位段的声明和结构类型,但它的成员是一个或多个位的字段。这些不同长度的字段实际上存储于一个或多个整形变量中。

什么是位段

位段的声明和结构是类似的,但是有两个不同:

1.位段的成员必须是 int、unsigned int 或signed int 。
2.位段的成员名后边有一个冒号和一个数字。这个整数指定该位段所占用的位的数目

位段的声明

struct A
{
  	int _a:2;//_a成员占两个bit位
  	int _b:5;//_b成员占5个bit位
    int _c:10;//_c成员占10个比特位
    int _d:30;//_d成员占30个bit位
};

A就是一个位段类型,那位段A的大小是多少呢?

#include<stdio.h>
struct A
{
    int _a : 2;
    int _b : 5;
    int _c : 10;
    int _d : 30;
};
int main()
{
    printf("%d\\n", sizeof(struct A));
    return 0;
}

image-20210610224137829

首先_a是int类型,开辟4个字节的空间,_a占了2bit,_b占了5bit,_c占了10bit,此时32个bit位还剩下15个bit位,已经放不下_d(30bit)了,所以我们再开辟4个字节的空间,将_d放在新开辟的空间中,所以我们A位段的大小为8字节。那么我们能不能利用空间,将_d的15个bit位放入刚开始开辟的空间中去呢?这是不确定的,当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。

image-20210611090228996

位段的内存分配

  • 位段的成员可以是 int ,unsigned int ,signed int 或者是 char (属于整形家族)类型

  • 位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。

  • 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。

下面我们看一个例子:

struct S
{
    char a : 3;
    char b : 4;
    char c : 5;
    char d : 4;
};
int main()
{
    struct S s = { 0 };
    s.a = 10;
    s.b = 12;
    s.c = 3;
    s.d = 4;
    return 0;
}

代码图解:

image-20210611095307913

我们调试发现结构体内存中果然是这样存储的:

image-20210611094454834

注意:

注重可移植的程序应该避免使用位段。由于下面这些与实现有关的依赖性,位段在不同的编译器或者系统中可能会有不同的结果

  • int被当作有符号数还是无符号数是不确定的
  • 位段中位的最大数目;好多编译器把位段成员的长度限制在一个整型值的长度以内,一个能够运行在32位机器上的位段,可能在16位机器上是无法运行的
  • 位段中的成员的内存是从左向右分配还是从右向左是不确定的
  • 当一个位段结构包含两个位段成员,第二个位段成员比较大,无法容纳于第一个位段成员存储空间剩余的位时,是舍弃剩余的位还是利用,这是不确定的。

枚举


枚举的优点

我们为什么使用枚举呢?

  • 增加代码的可读性和可维护性
  • 和#define定义的标识符比较,枚举有类型检查,更加严谨。
  • 防止了命名污染(封装)
  • 便于调试
  • 使用方便,一次可以定义多个常量

源文件是经过怎么样的一个过程生成可执行文件的呢?

image-20210712145001305

源文件在经过编译链接后得到可执行文件。#define定义的常量在预编译阶段处理,我们在调试时,常量已经全部被处理了,不便于调试,而枚举是便于调试的。


枚举类型的声明

枚举顾名思义就是一一列举

枚举是 C 语言中的一种基本数据类型,它可以让数据更简洁,更易读。

枚举语法定义格式为:

enum 枚举名
{
    枚举元素1,
    枚举元素2,
    ...
};

首先我们举个例子,比如:一星期有7天,如果不用枚举,我们需要使用 #define 来为每个整数定义一个别名:

#define MON  1
#define TUE  2
#define WED  3
#define THU  4
#define FRI  5
#define SAT  6
#define SUN  7

接下来我们看一看枚举的方式:

enum DAY
{
 	MON=1,TUE,WED,THU,FRI,SAT,SUN  
};

这样我们发现代码变得更加简洁了。

注意:

第一个枚举成员的默认值为整型的 0,后续枚举成员的值在前一个成员上加 1。我们如果把第一个枚举成员的值定义为 1,第二个就为 2,以此类推。

我们可以在定义枚举类型时可以改变枚举元素的值:

enum season {spring, summer=3, autumn, winter};

没有指定值的枚举元素,其值为前一元素加 1。也就说 spring 的值为 0,summer 的值为 3,autumn 的值为 4,winter 的值为 5


枚举变量的定义

前面我们讲的是枚举类型的声明,接下来我们看看如何定义枚举变量

我们有三种方式来定义枚举变量:

  • 先定义枚举类型,再定义枚举变量
enum DAY
{
      MON=1, TUE, WED, THU, FRI, SAT, SUN
};
enum DAY day;

注意:

enum DAY day = 2;//这个代码在c文件可以编译成功,但是在c++文件中不能成功

c文件可以编译成功,但是在c++文件中不能成功,2是int类型,int类型是不能赋给DAY类型,c++检查更加严格。

  • 定义枚举类型的同时定义枚举变量
enum DAY
{
      MON=1, TUE, WED, THU, FRI, SAT, SUN
} day;
  • 省略枚举名称,直接定义枚举变量
enum
{
      MON=1, TUE, WED, THU, FRI, SAT, SUN
} day;

枚举在 switch 中的使用

#include <stdio.h>
#include <stdlib.h>
int main()
{
 
    enum color 
    {
        red=1,
        green,
        blue 
    };
    enum  color favorite_color;
 
    //用户输入数字来选择颜色
    printf("请输入你喜欢的颜色: (1. red, 2. green, 3. blue): ");
    scanf("%u", &favorite_color);
 
    //输出结果
    switch (favorite_color)
    {
    case red:
        printf("你喜欢的颜色是红色");
        break;
    case green:
        printf("你喜欢的颜色是绿色");
        break;
    case blue:
        printf("你喜欢的颜色是蓝色");
        break;
    default:
        printf("你没有选择你喜欢的颜色");
    }
    return 0;
}

image-20210614225520035

联合


联合也是一种特殊的自定义类型,这种类型定义的变量也包含一系列的成员,特征是这些成员公用同一块空间(所以联合也叫共用体)。

联合体的声明和定义


联合类型的声明

//联合类型的声明
union Un
{
    char c;
    int i;
};

联合变量的定义

union Un u;

那么联合变量的大小是多少怎么计算呢?

//联合类型的声明
union Un
{
    char c;//1
    int i;//4
};
int main()
{
    ///联合变量的定义和初始化
    union Un u={0};
    printf("%d\\n",sizeof(u));//计算联合变量的大小
    return 0;
}

image-20210712170330142

我们发现这个联合变量大小为4,char是1字节,int为4字节,不应该至少是5字

以上是关于自定义类型的这些知识你知道吗?C语言超硬核结构体枚举联合体画图+文字详细讲解的主要内容,如果未能解决你的问题,请参考以下文章

指针的这些知识你知道吗?C语言超硬核指针进阶版3w+字详解+指针笔试题画图+文字详细讲解

超硬核!苏州同程旅游学长给我的全面的面试知识库

Go语言结构体struct详解,Go空结构体的这些妙用你知道吗?

超硬核十万字!全网最全 数据结构 代码,随便秒杀老师/面试官,我说的

超硬核:Linux系统内存知识

万字长文超硬核详细学习系列——深入浅出Linux基础篇的知识点,值得你收藏学习必备