一文你就懂C程序内存布局

Posted 公众号高性能架构探索

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了一文你就懂C程序内存布局相关的知识,希望对你有一定的参考价值。


关注公众号:高性能架构探索。后台回复【pdf】,可以免费领取计算机经典书籍

【一文你就懂】C程序内存布局_Linux

作为计算机专业的来说,程序入门基本都是从C语言开始的,了解C程序中的内存布局,对我们了解整个程序运行,分析程序出错原因,会起到事半功倍的作用 。

C程序的内存布局包含五个段,分别是STACK(栈段),HEAP(堆段),BSS(以符号开头的块),DS(数据段)和TEXT(文本段)。

每个段都有自己的读取,写入和可执行权限。如果程序尝试以不允许的方式访问内存,则会发生段错误,也就是我们常说的coredump。

段错误是导致程序崩溃的常见问题。核心文件(核心储文件)也与段错误相关联,开发人员使用该文件来查找崩溃的根本原因(段错误)。下面我们将深入这五个段,更加详细的讲解每个段在程序开发或者运行中的作用。

High Addresses ---> .----------------------.
| Environment |
|----------------------|
| | Functions and variable are declared
| STACK | on the stack.
base pointer -> | - - - - - - - - - - -|
| | |
| v |
: :
. . The stack grows down into unused space
. Empty . while the heap grows up.
. .
. . (other memory maps do occur here, such
. . as dynamic libraries, and different memory
: : allocate)
| ^ |
| | |
brk point -> | - - - - - - - - - - -| Dynamic memory is declared on the heap
| HEAP |
| |
|----------------------|
| BSS | Uninitialized data (BSS)
|----------------------|
| Data | Initialized data (DS)
|----------------------|
| Text | Binary code
Low Addresses ----> ----------------------
复制代码


  • 它位于较高的地址,与堆段的增长和收缩方向正好相反。
  • 函数的局部变量存在于栈上
  • 调用函数时,将在栈中创建一个栈帧。
  • 每个函数都有一个栈帧。
  • 栈帧包含函数的局部变量参数和返回值。
  • 栈包含一个LIFO结构。函数变量在调用时被压入栈,返回时将函数变量从栈弹出。
  • SP(栈指针)寄存器跟踪栈的顶部。

#include <stdio.h>
int main(void)
int data; // 局部变量,存储在栈上
return 0;

复制代码


  • 用于在运行时分配内存。
  • 由内存管理函数(如malloc、calloc、free等)管理的堆区域,这些函数可以在内部使用brk和sbrk系统调用来调整其大小。
  • 堆区域由进程中的所有共享库和动态加载的模块共享。
  • 它在堆栈的相反方向上增长和收缩。

#include <stdio.h>
int main(void)
char *pStr = malloc(sizeof(char)*4); //pStr指向堆地址
return 0;

复制代码

BSS(未初始化的数据块)


  • 包含所有未初始化的全局和静态变量。
  • 此段中的所有变量都由零或者空指针初始化。
  • 程序加载器在加载程序时为BSS节分配内存。

#include <stdio.h>
int data1; // 未初始化的全局变量存储在BSS段
int main(void)
static int data2; // 未初始化的静态变量存储在BSS段
return 0;

复制代码

DS(初始化的数据块)


  • 包含显式初始化的全局变量和静态变量。
  • 此段的大小由程序源代码中值的大小决定,在运行时不会更改。
  • 它具有读写权限,因此可以在运行时更改此段的变量值。
  • 该段可进一步分为初始化只读区和初始化读写区。

#include <stdio.h>
int data1 = 10 ; //初始化的全局变量存储在DS段
int main(void)
static int data2 = 3; //初始化的静态变量存储在DS段
return 0;

复制代码

TEXT


  • 该段包含已编译程序的二进制文件。
  • 该段是一个只读段,用于防止程序被意外修改。
  • 该段是可共享的,因此对于文本编辑器等频繁执行的程序,内存中只需要一个副本。

深入

现在有一个简单的程序,代码如下:

#include <stdio.h> 

int main(void)
return 0;

复制代码

我们通过如下命令进行编译

gcc -g a.cc -o a
复制代码

然后通过size命令,可以看到各个段的大小

[root@build src]# gcc a.c -o a
[root@build src]# size a
text data bss dec hex filename
1040 484 16 1540 604 a
复制代码

其中前三列分别为可执行程序a的text、data以及bss段的大小,第四列为该三段大小之和,第四列为该大小的十六进制表示,最后一列是文件名。

增加一个未初始化的静态变量

#include <stdio.h> 

int main(void)
static int data;
return 0;

复制代码

通过size命令

[root@build src]# size a
text data bss dec hex filename
1040 484 24 1548 60c a
复制代码

从上面可以看出,bss段size变大

增加一个初始化的静态变量

#include <stdio.h> 

int main(void)
static int data = 10;
return 0;

复制代码

通过size命令

[root@build src]# size a
text data bss dec hex filename
1040 488 16 1544 608 a
复制代码

从上面可以看出,data段size变大

增加一个未初始化的全局变量

#include <stdio.h> 
int data;
int main(void)
return 0;

复制代码

通过size命令

[root@build src]# size a
text data bss dec hex filename
1040 484 24 1548 60c a
复制代码

从上面可以看出,bss段size变大

数据段的只读区域和读写区域

#include <stdio.h>
char str[]= "Hello world";
int main(void)
printf("%s\\n",str);
str[0]=K;
printf("%s\\n",str);
return 0;

复制代码

输出

Hello world
Kello world
复制代码

可以看到上面的示例str是一个全局数组,因此它将进入数据段。 还可以看到能够更改该值,因此它具有读取和写入权限。

现在查看其他示例代码

#include <stdio.h>
char *str= "Hello world";
int main(void)
str[0]=K;
printf("%s\\n",str);
return 0;


在上面的示例中,我们无法更改数组字符是因为它是文字字符串。常量字符串不仅会出现在数据部分,而且所有类型的const全局数据都将进入该部分。

数据块只读部分,通常除了const变量和常量字符串外,程序的文本部分(通常是.rodata段)也存在于数据块的只读部分,因为通常无法通过程序进行修改。

以上是关于一文你就懂C程序内存布局的主要内容,如果未能解决你的问题,请参考以下文章

Java注解-一文就懂

软件测试方法有多少种?看完这篇文章你就懂了

synchronized如何实现两个线程交替运行?看完你就懂了,列害dei

一看你就懂,超详细java中的ClassLoader详解

一看你就懂,超详细 java 中的 ClassLoader 详解

你就懂了