C++ 结构体内存对齐

Posted cpp_learner

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了C++ 结构体内存对齐相关的知识,希望对你有一定的参考价值。

刚出学校那会,出去找实习工作,面试答题被问到结构体内存大小的问题,虽然自己以前接触过,但是也还是答错了,最终面试的这份工作黄了。一年后的最近,还是在找工作的路上,面试了一家游戏公司,其中也是答题环节有一道题被问到结构体的内存大小,也还是答错了,最后面试也还是黄了。

到了现在自己才醒悟过来,这些知识点是有多么的重要,所以咬紧牙,把这个内容的知识点啃下来,写下这篇博客记录下来!


先看一段简单的程序

#include <iostream>

using namespace std;

typedef struct A {
	char c;
	int i;
};

typedef struct B {
	char c;
	int i;
	double d;
};

typedef struct C {
	char c;
	int i;
	double d;
	char c1;
};

int main(void) {

	cout << "struct A size = " << sizeof(struct A) << endl;
	cout << "struct B size = " << sizeof(struct B) << endl;
	cout << "struct C size = " << sizeof(struct C) << endl;

	return 0;
}

如果不运行,那么大家知道结构体A、B、C所占用的内存大小是多少吗?

运行截图:

以上输出的结果并非实际成员占用的字节数,这就是结构体的内存对齐!

按照我们正常的逻辑,结构体A的内存大小应该是5个字节,结构体B的内存大小应该是13个字节,结构体C的内存大小应该是14字节才对!
但是为什么是8、16和24呢?将在下面进行讲解。

结构体内存对齐原因

  1. 平台原因(移植原因):
    “不是所有的硬件平台都能访问任意地址上的任意数据;某些硬件平台只能在某些特定地址处取某些特定的数据,否则就会抛出硬件异常”。也就是说在计算机在内存读取数据时,只能在规定的地址处读数据,而不是内存中任意地址都是可以读取的。

  2. 效率原因:
    正是由于只能在特定的地址处读取数据,所以在访问一些数据时,对于访问未对齐的内存,处理器需要进行两次访问;而对于对齐的内存,只需要访问一次就可以。 其实这是一种以空间换时间的做法,但这种做法是值得的。

结构体对齐规则

  1. 第一个成员在结构体变量偏移量为0 的地址处,也就是第一个成员必须从头开始。

  2. 其他成员变量要对齐到某个数字(对齐数)的整数倍的地址处。对齐数为编译器默认的一个 对齐数与该成员大小中的较小值。vs中默认值是8 Linux默认值为4(可以通过#pragma pack (N) 修改,使用#pragma pack(show) 可以查看对齐值),但修改时N的取 值只能设置成1, 2,4,8,16.

  3. 结构体总大小为最大对齐数的整数倍。(每个成员变量都有自己的对齐数)

  4. 如果嵌套结构体,嵌套的结构体对齐到自己的最大对齐数的整数倍处,结构体的整体大小就是 所有最大对齐数(包含嵌套结构体的对齐数)的整数倍。(具体详情,请看下面代码结构体G)

结构体对齐的规则都是依据上面四条规则进行的!

结构体对齐示例

typedef struct A {
	char c;
	int i;
};

根据第二和第三条规则,VS中最大默认对齐数是8,结构体中最小的是int类型的4,8 < 4,所以结构体A的对齐数是4.
所以即使char类型占一个字节,但是他在内存中也会占用4个字节,来对齐4字节数,这就是所谓的,牺牲空间来换取时间!

后面的也是一样的道理!

如果是这样的结构体,那么他们的内存将会是多少呢?

typedef struct D {
	char c;
	int i;
	double d;
	char c1;
	int b;
	char c2;
};

typedef struct E {
	int i;
	double d;
	char c;
	double d2;
};

typedef struct F {
	int i;
	double d;
	char c;
	double d2;
	int i2;
	int i3;
	char c2;
	char c3;
	char c4;
	int i4;
};

typedef struct G {
	int i;
	double d;
	struct E e;
	char c;
	double d2;
};


下面是他们的内存关系图:


上述四张图基本涵盖了所有情况,希望这四张图大家能看明白是怎么个回事!

我本人的理解
以它为例,

typedef struct D {
	char c;
	int i;
	double d;
	char c1;
	int b;
	char c2;
};

首先我会先找到结构体中最大的变量字节大小(内部结构体除外),然后使用加法原则向其对齐。(结构体D的对齐数是8)
c 是1个字节,i是4个字节,c + i 等于5字节,为了符合内存对齐的原则,他俩占用最前方8个字节的内存,当然c是占4个字节,i也是占4个字节,这样4 + 4 等于8,才符合内存对齐。
d是8个字节,紧接着后面存储8个字节。
c1是一个字节,b是4个字节,计算规格和上面一样,占用8个字节。
最后剩余一个c2是一个字节,当然为了符合内存对齐的原则他在结构体中是占8个字节的。
所以最后计算出内存大小为:
(c + i) == 8(字节)
d == 8(字节)
(c1 + b) == 8(字节)
c2 == 8(字节)
8 + 8 + 8 + 8 == 32(字节)

相信再配合下图,一定可以理解是什么原理的:


总结
结构体内存对齐这是比较底层的知识点了,当然这也是我们程序员需要掌握的,特别是服务器开发人员。
对齐时需要注意对齐数!

以上是关于C++ 结构体内存对齐的主要内容,如果未能解决你的问题,请参考以下文章

C++ 结构体内存对齐

内存对齐详解 (C++代码)

C++基本知识点总结(网摘)

转载c++面试题

C++ 内存对齐

手把手写C++服务器(10):结构体struct常用技术之柔性数组字节对齐__attribute__