手把手写C++服务器(10):结构体struct常用技术之柔性数组字节对齐__attribute__

Posted 沉迷单车的追风少年

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了手把手写C++服务器(10):结构体struct常用技术之柔性数组字节对齐__attribute__相关的知识,希望对你有一定的参考价值。

前言:在Linux C/C++当中常用的技巧有很多,这里先讨论一下结构体struct中常用的柔型数组、字节对齐和__attribute__,了解针对结构体内存分配过程中的一些常用优化方法。

目录

柔性数组:为变长结构体而生

数组名不占用内存空间

柔性数组的定义方法

为什么需要柔性数组?

怎样使用柔性数组?

结构体中的字节对齐问题

__attribute__:进行属性设置

1、aligned:指定对选哪个的对齐格式

2、packed:取消编译过程中的优化对齐

3、at:绝对定位,将变量或函数绝对定位到flash或RAM中

4、weak:转换成弱符号类型

5、unused:忽略未使用函数的告警

6、deprecated:管理过时代码

7、may_alias:取消拒绝类型打印指针

8、transparent_union:指定透明联合体

参考:

柔性数组:为变长结构体而生

数组名不占用内存空间

数组名本身不占用内存空间!所以在结构体内部声明一个长度为0的数组,结构体长度不变。

先理解这一点,才能明白为什么会在结构体最后定义一个数组名。

柔性数组的定义方法

在struct的最后定义一个长度为0的数组即可,例如下面在网络编程中设定一个消息缓冲区:

struct PayloadMessage
{
  int32_t length;
  char data[0];
};

为什么需要柔性数组?

1、定长数组行不行?

在网络编程、服务端编程的过程中,我们经常需要设定数据缓冲区,需要存储缓冲区的长度和具体的数据,但是我们怎样知道要设定多大的长度呢?C语言中没有C++这样现成vector等数据结构可以动态扩展。默认一个最大长度好像是一个不错的做法,如下所示:

#define MAX_LENGTH 104000
struct PayloadMessage
{
  int32_t length;
  char data[MAX_LENGTH];
};

但是数据溢出了怎么办?扩大默认最大长度?那如果大量没有填满,造成大量浪费怎么办?这样基于MAX_LENGTH相互battle并不是一个好办法。

2、指针行不行?

此处可以当做内存泄漏风险的典例。例如将struct定义为下面这种形式:

struct PayloadMessage
{
  int32_t length;
  char *data;
};

每次要两次分配内存空间:先给结构体分配内存空间,再给指针变量分配空间;释放先释放data再释放结构体内存空间。

要是自己写的代码没有问题,如果给别人接手,who care?四个内存管理步骤一旦顺序错误或者漏掉一步,可怕的内存泄漏便开始了……

怎样使用柔性数组?

1、柔性数组是最好的解决方案

每次使用只用申请一次空间,在构造不定长数据包, 不会浪费空间浪费网络流量, 因为char data[0]; 只是个数组名, 是不占用存储空间。下面是一段小demo。

struct PayloadMessage
{
    int32_t length;
    char data[0];
};

PayloadMessage* payload = static_cast<PayloadMessage*>(::malloc(total_len));
assert(payload);
payload->length(your_length);
for (int i = 0; i < your_length; i++) {
    payload->data[i] = your_data;
} 

2、连续的内存分配空间有益于访问速度。

在指针的解决方案中,两次分配的空间时不连续的。但是柔性数组的解决方案中,只有一次内存分配,内存空间的是连续的,有利于访问速度,可以减少内存碎片。

3、标准的C/C++不支持柔性数组。

最开始的C90是不支持柔性数组的,最先使用柔性数组技术的GNU,其中具体的发展可以参看:https://blog.csdn.net/ssdsafsdsd/article/details/8234736

结构体中的字节对齐问题

这也是一道面试中经常考察、老生常谈的问题。

把握两个规律即可:

1、结构体中元素是按照定义顺序一个一个放到内存中去的,但并不是紧密排列的。从结构体存储的首地址开始,每一个元素放置到内存中时,它都会认为内存是以它自己的大小来划分的,因此元素放置的位置一定会在自己宽度的整数倍上开始(以结构体变量首地址为0计算)。

2、检查计算出的存储单元是否为所有元素中最宽的元素的长度的整数倍,是,则结束;若不是,则补齐为它的整数倍。

__attribute__:进行属性设置

使用__attribute__对结构体struct或共用体union进行设置,分成六种格式aligned, packed, transparent_union, unused, deprecated 和 may_alias 。

1、aligned:指定对选哪个的对齐格式

例如指定对齐格式为8字节:

struct SessionMessage
{
  int32_t number;
  int32_t length;
} __attribute__((aligned(8)))

2、packed:取消编译过程中的优化对齐

就是告诉编译器取消结构在编译过程中的优化对齐(使用1字节对齐),按照实际占用字节数进行对齐。

struct SessionMessage
{
  int32_t number;
  int32_t length;
} __attribute__ ((__packed__));//紧凑排列的方式取消字节对齐

3、at:绝对定位,将变量或函数绝对定位到flash或RAM中

  1. 定位到 flash 中,常用于固化信息,例如:设备的出厂信息,FLASH 标记等;
    const uint8_t usFlashInitVal[] __attribute__((at(0x00030000))) = {0x11,0x22,0x33,0x44,0x55,0x66};//定位在flash中,0x00030000开始的6个字节信息固定
    
  2. 定位到RAM中,常用于数据量较大的缓存,如:串口接收数据。也用于某个位置的特定变量。

    uint8_t ucUsartRecvBuffer[USART_RECV_LEN] __attribute__ ((at(0x00025000)));	//接收缓冲,最大USART_RECV_LEN个字节,起始地址为 0x00025000
    

注意:

  1. 绝对定位不能在函数中定义,局部变量是定义在栈区,栈区是自动分配、释放,不能定义为绝对地址,只能于函数外定义;

  2. 定义的长度不能超过栈或 Flash 的大小,否则导致栈、Flash 溢出。

4、weak:转换成弱符号类型

int  __attribute__((weak))  func(...)
{
    ...
    return 0;
}

func 转成弱符号类型

  • 如果遇到强符号类型(即外部模块定义了 func, extern int func(void);),那么我们在本模块执行的 func 将会是外部模块定义的 func。
  • 如果外部模块没有定义,那么将会调用这个弱符号,也就是在本地定义的 func,直接返回了一个 1(返回值视具体情况而定)相当于增加了一个默认函数

原理链接器发现同时存在弱符号强符号,就先选择强符号,如果发现不存在强符号,只存在弱符号,则选择弱符号。如果都不存在:静态链接,恭喜,编译时报错,动态链接:对不起,系统无法启动。

注意:weak 属性只会在静态库 (.o .a) 中生效,动态库 (.so) 中不会生效。

5、unused:忽略未使用函数的告警

如果一个函数没有被使用,在使用GCC编译的时候,会产生告警!在函数使用前面加上__attribute__((unused))即可:

__attribute__((unused)) double now()
{
  struct timeval tv = { 0, 0 };
  gettimeofday(&tv, NULL);//sys/time.h当中,精确获取当前时间
  return tv.tv_sec + tv.tv_usec / 1000000.0;
}

6、deprecated:管理过时代码

有些代码已经过时不被使用,但是又不能删除掉(保留下兼容的接口),这时候编译会产生告警,我们用deprecated管理过时代码。

直接将需要被兼容的接口写到宏当中,一劳永逸,举例如下:

 
#define  DEPR_AFTER __attribute__((deprecated))
#define  DEPR_BEFOR 
 
 
class DEPR_BEFOR AAA
{
}DEPR_AFTER;
 
int main(int argc, char** argv)
{
    typedef float T;
    AAA aa;
 
    return 0;
}

7、may_alias:取消拒绝类型打印指针

通过指向具有此属性的类型的指针进行的访问不受基于类型的别名分析的约束,而是假定能够为任何其他类型的对象设置别名。在 C99 标准第 6.5 节第 7 段的上下文中,取消引用此类指针的左值表达式被视为具有字符类型。看-fstrict-别名有关别名问题的更多信息。此扩展的存在是为了支持某些向量 API,其中允许指向一种向量类型的指针作为指向不同向量类型的指针的别名。

          typedef short __attribute__((__may_alias__)) short_a;
          
          int
          main (void)
          {
            int a = 0x12345678;
            short_a *b = (short_a *) &a;
          
            b[1] = 0;
          
            if (a == 0x12345678)
              abort();
          
            exit(0);
          }

请注意,具有此属性的类型的对象没有任何特殊语义。

更多参见:https://gcc.gnu.org/onlinedocs/gcc-4.8.4/gcc/Type-Attributes.html

8、transparent_union:指定透明联合体

当使用具有透明联合类型的参数定义函数时,使用联合中任何类型的参数调用该函数会导致联合对象的初始化,该联合对象的成员具有传递的参数的类型并且其值设置为传递参数的值。

当联合数据类型用 限定时__attribute__((transparent_union)),透明联合适用于具有该类型的所有函数参数。

更多参见:https://www.keil.com/support/man/docs/armclang_ref/armclang_ref_chr1384881256073.htm

参考:

以上是关于手把手写C++服务器(10):结构体struct常用技术之柔性数组字节对齐__attribute__的主要内容,如果未能解决你的问题,请参考以下文章

手把手写C++服务器(20):网络字节序与主机字节序大端小端与共用体

10.6 C++类与结构体类型

手把手写C++服务器(19):序列化数据网络传输解决方案

C++ struct结构体初始化

结构体进阶知识 struct内存对齐(笔试面试常考)

C++结构体中定义函数(C++结构体struct与C语言结构体区别)(C++结构体与C++类的区别)(结构体函数)