浅析C++内存布局

Posted 2022-05-23 特立独行的猫a

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了浅析C++内存布局相关的知识，希望对你有一定的参考价值。

C++程序在内存中的布局是怎样的？总结下C++内存布局的相关知识。

概述

简单总结下C++变量在内存中的布局和可执行文件相关的知识。暂未涉及虚函数，虚函数表，类的继承和多态等C++对象的内存模型。对象的内存模型推荐经典书籍《 深度探索C++对象模型》，豆瓣评分9.1。

开篇先回顾下Linux运行时存储器映像：

以下示例可以调试观测内存地址：

#include <iostream>
  
int  gdata1 = 1;
int  gdata2 = 0;
int  gdata3;
  
static int  gdata4 = 4;
static int  gdata5 = 0;
static int  gdata6;
  
int main() 
  int  a = 11;
  int  b = 0;
  int c;
  
  static int d = 12;
  static int e = 0;
  static int f;
  
  const char *p = "hello world";
  
  return 0;

使用size命令和objdump来查看目标文件的结构和内容：

使用 objdump -s -d 查看更详细的内容：

使用 nm （names）查看符号表：

若是在linux下，上述指令都有效。还可使用readelf 可显示一个或者多个elf格式的目标文件的信息。

readelf是Linux下的分析ELF文件的命令，这个命令在分析ELF文件格式时非常有用。常见的文件如在Linux上的可执行文件，动态库(*.so)或者静态库(*.a) 等包含ELF格式的文件。

什么是ELF文件？

ELF(Executable and Linkable Format)是Unix及类Unix系统下可执行文件、共享库等二进制文件标准格式。

系统里的目标文件是按照特定的目标文件格式来组织的，各个系统的目标文件格式都不相同。

从贝尔实验室诞生的第一个Unix系统使用的是a.out格式（直到今天，直到文件仍然称为a.out文件）。Windows使用可移植植入（PortableExecutable，PE）格式。MacOS- X使用Mach-O格式。现代x86-64Linux和Unix系统使用可调可链接格式（ELF）。

ELF格式的文件在Linux系统下有.axf，.bin，.elf，.o，.prx，.puff，.ko，.mod和.so等等。

.text（代码段）

.text段存放程序代码，运行前就已经确定（编译时确定），通常为只读。

在window平台上，可执行程序为xxx.exe。它产生两种东西：指令和数据。.exe程序存放在磁盘中，执行时被加载到内存中，不是物理内存，而是虚拟内存空间，.text中存放指令。

.rodata(只读数据段)

rodata段存储常量数据，比如程序中定义为const的全局变量，#define定义的常量，以及诸如“Hello World”的字符串常量。(注意有些立即数与指令编译在一起，是放在text段中的)。

const修饰的全局变量在常量区。const修饰的局部变量只是为了防止修改，没有放入常量区。

编译器会去掉重复的字符串常量，程序的每个字符串常量只有一份。

有些系统中rodata段是多个进程共享的，目的是为了提高空间利用率。

如在main中的 const char *p = "hello world"; 即存放在.rodata中。在vs2017中，并不能将常量字符串定义为char *p类型，否则会编译失败；

.data

data存储已经初始化的全局变量，属于静态内存分配。（注意：初始化为0的全局变量还是被保存在BSS段），static声明的变量也存储在数据段。

.bss

bss段存储没有初值的全局变量或默认为0的全局变量，属于静态内存分配。 bss段内容会被全部设为0。

stack

stack段存储参数变量和局部变量，由系统进行申请和释放，属于静态内存分配。

stack的特点是先进先出，可用于保存/恢复调用现场。

heap

heap段是程序运行过程中被动态分配的内存段，由用户申请和释放（例如malloc和free）。

申请时至少分配虚存，当真正存储数据时才分配物理内存；释放时也不是立即释放物理内存，而是可能被重复利用。

总结

1、执行文件中包含了text、rodata、data段的内容，不包含bss段内容（一堆0放入执行文件没有意义）

2、堆和栈的内存增长方向是相反的：栈是从高地址向低地址生长，堆是从低地址向高地址生长。

3、局部变量存储在stack中，编写函数时要注意如果该函数被递归调用很多次，可能会引起stack overflow的问题。

C++程序的内存格局通常分为四大区：全局数据区(静态区，常量区)，代码区(code area)，栈区(stack area)，堆区(heap area)(即自由存储区)。全局数据区存放全局变量，静态数据和常量。所有类和函数代码存放在代码区。为运行函数而分配的局部变量、函数参数、返回数据、返回地址等存放在栈区。余下的空间被称为堆区（在栈与堆之间有部分动态分配的姑且称之为共享区，叫法可能不一样）。

推荐书籍《程序员的自我修养》

该书主要介绍系统软件的运行机制和原理，涉及在Windows和Linux两个系统平台上，一个应用程序在编译、链接和运行时刻所发生的各种事项。

包括：代码指令是如何保存的，库文件如何与应用程序代码静态链接，应用程序如何被装载到内存中并开始运行，动态链接如何实现，C/C++运行库的工作原理，以及操作系统提供的系统服务是如何被调用的。

类对象所占的内存空间

一个类的实例化对象所占空间的大小？注意不要说类的大小,是类的对象的大小。首先，类的大小是什么？确切的说，类只是一个类型的定义，它是没有大小可言的，用sizeof运算符对一个类型名操作，得到的是具有该类型实体的大小：

#include <iostream>
 
class Test

;
 
int main()

  Test test;
  std::cout << sizeof(test) << std::endl; //1
 
  return 0;

打开VS2019开发者命令行工具（每个版本都有）
切换到源文件所在路径
cl /dl reportSingleClassLayout类名 "源文件名.cpp"

可以看到一个空类对象的大小1。

一个空类对象的大小是1，为什么不是0？

类A明明是空类，它的大小应该为0，为什么编译器输出的结果为1呢？这就是实例化的原因（空类同样被实例化），每个实例在内存中都有一个独一无二的地址，为了达到这个目的，编译器往往会给一个空类隐含的加一个字节，这样空类在实例化后在内存中得到了独一无二的地址，所以obj的大小是1。

添加虚函数之后，类的变化

当类中添加了虚函数时，类的大小变为4，同时编译器给类中添加了虚函数表指针vfptr 这个指针指向了vftable，vftable 这张表里面存放的本类所有的虚函数入口地址。

结论

1.当类中添加了虚函数时，类的大小变为4，同时编译器给类中添加了虚函数表指针vfptr 这个指针指向了vftable，vftable 这张表里面存放的本类所有的虚函数入口地址。
2.当发生继承时，子类会将父类的虚函数表指针继承下来，指向父类的的虚函数表，在子类调用构造函数后，编译器会将该指针指向自己的虚函数表。
3.当子类重写了父类的虚函数时，在虚函数表中会用子类的函数地址去覆盖父类对应的虚函数地址。
4.程序运行时，通过父类指针或者引用调用函数时，编译器会先找到该对象中的虚函数指针，根据指针找到虚函数表，在虚函数表中找到对应的函数入口地址进行调用。

二进制可执行文件的执行流程

可执行文件生成过程

预处理：进行头文件和宏定义的替换
编译：由编译器把高级语言代码编译为汇编代码
汇编：由汇编器把汇编代码翻译成二进制代码，也即是.o文件
连接：由连接器把多个.o文件连接成可执行文件；可分为编译时链接，加载时链接（程序被加载到内存中执行时），运行时链接（由应用程序来执行时）。

加载可执行目标文件

ELF头标书文件的整体格式还包含程序的入口点（程序需要运行时执行的第一条指令的地址）。可执行文件的连续片（chunk）被映射到连续的内存段。

当在shell中输入./programName时，shell解析到/判断不是内置命令（如果是内置命令时会搜索/usr /usr/lib ...）而是一个可执行文件，调用常驻内存的加载器（通过execve调用加载器）的操作系统代码来调用他。将可执行程序的代码和数据从磁盘复制到内存，在程序头部表的引导下加载器将可执行文件的片（chunk）复制到代码段和数据段，跳转到程序的第一条指令或入口点来运行。

linux的每个程序都运行在一个进程的上下文中，有自己的虚拟地址空间。当一个shell运行时，父进程shell生成一个子进程，他是父进程的一个复制。子进程通过execve系统调用调用加载器，加载器删除现有的虚拟内存段，创建新的代码段数据段堆栈，新堆栈被初始化为0，通过将虚拟地址空间的页映射到可执行文件的页面大小chunk，新的代码段和数据段被初始化为可执行文件的内容，最后跳转到_start，最终调用程序的main函数，除了头部的一些信息，加载过程没有任何数据从磁盘复制到内存，知道CPU引用的第一个虚拟页时才被复制。利用页面调度算法将他从磁盘复制到内存。

linux系统从开机到启动，执行流程从代码层面看大致经历：

设备上电后执行一段bootloader的汇编阶段。汇编第一阶段的代码主要可以分为以下部分：

设置异常向量表

设置特权管理模式

初始化PLL、DDR、MUX…

关MMU，关CACHE

判断代码在RAM还是FLASH，将FLASH代码复制至RAM中

设置堆栈、清空bss段

跳转至C语言处进入第二阶段，第二段也属于bootloader的功能，完成一些硬件资源初始化。最后才是操作系统内核的引导启动。