C语言自定义数据类型:结构体,枚举,联合

Posted 敲键盘的钢琴家

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了C语言自定义数据类型:结构体,枚举,联合相关的知识,希望对你有一定的参考价值。

1、结构体

1.1结构的声明

结构的基础知识
结构是一些值的集合,这些值称为成员变量。结构的每个成员可以是不同类型的变量。

在C语言中对于复杂对象,靠单一的数据类型已经无法描述,这时我们就要用到结构体来进行描述。
结构体的声明

struct tag
{
 member-list;
}variable-list;
struct为结构体关键字
member-list成员列表
variable-list变量列表(可以省略,但是;一定不可省略)
;一定不能丢

struct book
{
    char name[20];
    char auther[20];
    int price;
};

struct book
{
    char name[20];
    char auther[20];
    int price;
}b1,b2;
利用上面结构体类型创建了两个结构体类型b1、b2

特殊的声明
在声明结构的时候,可以不完全的声明。

//匿名结构体类型
struct
{
 int a;
 char b;
 float c;
}x;

struct
{
 int a;
 char b;
 float c;
}a[20], *p;

//匿名结构体变量的创建必须在定义的时候创建
//因为没有名字,无法直接使用struct创建结构体变量
//C语言支持使用,但是不建议使用
int main()
{
    p=&x;
    //此时会报错
    //编译器会把上面的两个声明当成完全不同的两个类型。 所以是非法的。
    return 0;
}

1.2结构的自引用

结构体的自引用:能够找到同类型的数据的下一个节点
在结构中包含一个类型为该结构本身的成员是不可以的:

//代码1
struct Node
{
 int data;
 struct Node next;
};
//无限查找下去,内存区间可能会溢出

正确的自引用方式:

//代码1
struct Node
{
 int data;
 struct Node next;
};
//无限查找下去,内存区间可能会溢出

注意有些写法是无法表达的:可以将这种错误的写法理解成先有蛋还是先有鸡的问题,对于问题本身来说就是错误的。

//代码1
typedef struct
{
 int data;
 Node* next;//此处之前没有出现过Node
}Node;
//非法的写法,所以对于结构体的匿名写法不要轻易使用
//解决方案
typedef struct Node
{
 int data;
 struct Node* next;
}Node;

1.3结构体变量的定义和初始化

1.3.1结构体变量的定义

struct Point
{
    int x;
    int y;
}p3,p4;//定义局部变量p3,p4

struct Point p2;
//定义全局变量p2

int main()
{
    struct Piont p1;
    //定义局部变量p1
}

1.3.2结构体变量的初始化

简单的初始化

struct Point
{
    int x;
    int y;
}p3={5,6},p4={7,8};
//在声明的时候直接初始化

struct Point p2={1,2};
//定义全局结构体变量的时候初始化
int main()
{
    struct Point p1={1,2};
    //定义局部结构体变量的时候初始化
}

嵌套结构体类型的初始化

struct Point 
{
    int x;
    int y;
};
struct S
{
    double d;
    struct Point p;
    char name[20];
    int date[20];
}

int main()
{
    struct S s={3.14,{1,5},"sunjiaao",{1,2,3,4,5,6}};
}

1.4结构内存对齐

内存对齐不仅仅在结构体中在别处也会有,但是在结构体中的内存对齐非常明显,所以我们称之为结构体内存对齐。
计算结构体的大小,此时需要注意结构体内存对齐

结构体内存对齐的规则:
1、结构体的第一个成员永远放在结构体起始位置偏移量为0的位置。即结构体从哪开始,第一个变量就从哪开始
2、结构体成员从第二个成员开始,总是放在偏移量为一个对齐数的整数倍数。
3、对齐数=编译器默认的对齐数和变量自身大小的较小值,Linux没有默认对齐数,VS下默认对齐数是8.所以在VS编译器下,当和int类型比较时,4<8,所以int类型的对齐数为4
4、结构体的总大小必须是各个成员的对齐数中最大那个对齐数的整数倍
5、如果嵌套了结构体的情况,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是所有最大对齐数(含嵌套结构体的对齐数)的整数倍。

下面让我们来看一些例子:

struct S2
{
    char c1;
    char c2;
    int a;
}
int main()
{
    struct S1 s={'x',100,'y'};
    printf("%d\\n",sizeof(struct S2));
}

图片解析结构体的内存空间:

为什么存在结构体内存对齐

  1. 1.平台原因(移值原因)
    不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
  2. 性能原因
    数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。

内存图片解析:

总结:结构体内存对齐是拿空间换取时间的做法。

那在设计结构体的时候,我们既要满足对齐,又要节省空间,如何做到:让占用空间小的成员尽量集中在一起。如下面的写法:

//例如:
struct S1
{
 char c1;
 int i;
 char c2;
};
struct S2
{
 char c1;
 char c2;
 int i;
};

S1和S2类型的成员一模一样,但是S1和S2所占空间的大小有了一些区别。
修改结构体的默认对齐数
之前我们见过了 #pragma这个预处理指令,这里我们再次使用,可以改变我们的默认对齐数。默认对齐数一般设置的是2的几次放,不要随意设置默认对齐数。

#include<stdio.h>
#pragma pack(8)//设置默认对齐数为8
struct S1
{
    char c1;
    int i;
    char c2;
 };
#pragma pack()//取消设置的默认对齐数,还原为默认
#pragma pack(1)//设置默认对齐数为1
struct S2
{
    char c1;
    int i;
    char c2;
};
#pragma pack()//取消设置的默认对齐数,还原为默认
int main()
{
    //输出的结果是什么?
    printf("%d\\n", sizeof(struct S1));//6
    printf("%d\\n", sizeof(struct S2));
    return 0;
}

1.5结构传参

先来看一段代码:

struct S
{
    int data[1000];
    int num;
};

//结构体传参
void print1(struct S tmp)
{
    int i=0;
    for(i=0;i<10;i++)
    {
        printf("%d"tmp.data[i]);
    }
    printf("%d\\n", tmp.num);
}
//结构体地址传参
void print2(struct S* ps)
{
    int i=0;
    for(i=0;i<10;i++)
    {
        printf("%d ",ps->data[i]);
    }
    printf("%d\\n",ps->num);
}
int main()
{
    struct S s = {{1,2,3,4,5,6,7,8,9,10}, 1000};
    print1(s);  //传结构体
    print2(&s); //传地址
    return 0;
}

答案是:首选print2函数。 原因:

函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。 如果传递一个结构体对象的时候,结构体过大,因为实参是形参的临时拷贝,所以参数压栈的的系统开销比较大,所以会导致性能的下降.如果担心传地址数据会被修改,可以在参数的前面加上const修饰。

2、位段

利用结构体实现位段的能力,位段是可以节省空间的。尤其是在对速度有极限要求的时候。

2.1什么是位段

1.位段的成员必须是 int、unsigned int 或signed int 。(char也可以-》整型家族的都可)

2.位段的成员名后边有一个冒号和一个数字。

比如:

struct A
{
    int _a:2;
    int _b:5;
    int _c:10;
    int _d:30;
};


位指的是二进制位->_a只需要2个比特位,_b只需要5个比特位,
_c只需要10个比特位,_d只需要30个比特位空间
int main()
{
    printf("%d\\n",sizeof(struct A));//8
    return 0;
}

2.2位段的内存分配

1、位段的成员可以是 int unsigned int signed int 或者是 char (属于整形家族)类型
2、位段的空间上是按照需要以4个字节( int )或者1个字节( char )的方式来开辟的。
3、位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使用位段。

struct A
{
    int _a:2;
    int _b:5;
    int _c:10;
    int _d:30;
};

struct S s={0};
s.a=10;
s.b=12;
s.c=3;
s.d=4;

先开辟了4个字节,在这个四节里放入了2+5+10个比特位,但是到_d的时候无法放入,就又开辟了4个字节,内存空间的使用及其剩余空间如何处理C语言没有给出标准规定。在VS编译器中是从右向左,即从低位到高位使用的,无法放入时剩余内存会被跳过,开辟新的空间放入。且当数据的二进制位高出位段的二进制位时,存入的二进制位会发生截断。

2.3位段的跨平台问题

1、int 位段被当成有符号数还是无符号数是不确定的。
2、位段中最大位的数目不能确定。(16位机器最大16,32位机器最大32,写成27,在16位机器会出问题。
3、位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
4、当一个结构包含两个位段,第二个位段成员比较大,无法容纳于第一个位段剩余的位时,是舍弃剩余的位还是利用,这是不确定的。
总结:跟结构相比,位段可以达到同样的效果,但是可以很好的节省空间,但是有跨平台的问题存在。

3、枚举

枚举的顾名思义就是一一列举,把可能的取值一一列举。

3.1枚举类型的定义

枚举类型的变量大小是固定的,大小为4个字节

enum Day//星期
{
    Mon,
    Tues,
    Wed,
    Thur,
    Fri,
    Sat,
    Sun
};
enum Sex//性别
{
    MALE,
    FEMALE,
    SECRET
}enum Color//颜色
{
    RED,
    GREEN,
    BLUE
};
int main()
{
    printf("%d\\n",RED);
    printf("%d\\n",GREEN);
    printf("%d\\n",BLUE);
    //0 1 2
}

以上定义的 enum Day , enum Sex , enum Color 都是枚举类型。 {}中的内容是枚举类型的可能取值,也叫枚举常量。这些可能取值都是有值的,默认从0开始,一次递增1,当然在定义的时候也可以赋初值。 例如:

enum Color//颜色
{
    RED=5,
    GREEN,
    BLUE
};
int main()
{
    printf("%d\\n",RED);
    printf("%d\\n",GREEN);
    printf("%d\\n",BLUE);
    //5 6 7
}

3.2枚举类型的定义

enum Color//颜色
{ 
    RED=1, 
    GREEN=2, 
    BLUE=4 
}; 
    enum Color clr = GREEN;
//只能拿枚举常量给枚举变量赋值,才不会出现类型的差异。
    clr = 5;
    //这中写法在严格的编译器下是非法的

使用枚举完成菜单

3.3枚举的优点

我们可以使用 #define定义常量,为什么非要使用枚举?枚举的优点:
1、增加代码的可读性和可维护性
2、和#define定义的标识符比较枚举有类型检查,更加严谨。
3、防止了命名污染(封装)
4、便于调试
5、使用方便,一次可以定义多个常量

4、联合体

4.1联合类型的定义

联合也是一种特殊的自定义类型这种类型定义的变量也包含一系列的成员,特征是这些成员公用同一块空间(所以联合也叫共用体)。 比如:

//联合体声明
union Un
{
    char c;
    int i;
    
};
int mian()
{
    //联合体变量的定义
    union Un u={0};
    printf("%d\\n",sizeof(u));//4
    return 0;
}

4.2联合的特点

  • 联合的成员是共用同一块内存空间的,这样一个联合变量的大小,至少是最大成员的大小(因为联合至少得有能力保存最大的那个成员)。

  • 图片解析:

    因为联合体共用一块空间,所以改变c的内容,i的内容也会随之改变

  • 判断机器的大小端

//方法1
int main()
{
    int a=1;
    char *pc=(char*)&a;
    if(*pc==1)
    {
        printf("小端");
    }
    else
    {
        printf("大端");
    }
    return 0;
}
//方法2
int main()
{
    union U
    {
        char c;
        int i;
    }u;
    u.i=1;
    if(u.c==1)
     {
        printf("小端");
    }
    else
    {
        printf("大端");
    }
    return 0;
}

4.3联合体的大小计算

1、联合的大小至少是最大成员的大小。
2、当最大成员大小不是最大对齐数的整数倍的时候,就要对齐到最大对齐数的整数倍。

union Un1 
{ 
    char c[5];//5个char类型的数据,对齐数是1
    int i; //对齐数是4
    //最终对齐数是4,5个字节不是4的倍数所以要上升到8
}; 
union Un2 
{ 
    short c[7]; //7个short类型的数据,对齐数是2
    int i; //对齐数是4
    //最终对齐数是4,数组用了14个字节的空间
    //但14不是4的整数倍,所以要上升到16
}; 
int main()
{
    printf("%d\\n", sizeof(union Un1));//8 
    printf("%d\\n", sizeof(union Un2));//16
}

以上是关于C语言自定义数据类型:结构体,枚举,联合的主要内容,如果未能解决你的问题,请参考以下文章

C语言自定义数据类型:结构体,枚举,联合

C语言自定义数据类型中的结构体,枚举,联合详解

C语言——自定义类型(结构体+枚举+联合)

c语言篇 +自定义类型(枚举联合结构体)以及位段

C语言学习笔记(15)自定义类型:结构体,枚举,联合

C语言进阶自定义类型详解(结构体+枚举+联合)