虚拟地址空间布局架构

Posted 打工人打工魂打工人上人

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了虚拟地址空间布局架构相关的知识,希望对你有一定的参考价值。

内存管理架构

内存管理子系统架构可以分为:用户空间、内核空间及硬件部分3个层面。

  1. 用户空间:应用程序使用malloc()申请内存资源/free()释放内存资源。
  2. 内核空间:内核总是驻留在内存中,是操作系统的一部分。内核空间为内核保留, 不允许应用程序读写该区域的内容或直接调用内核代码定义的函数。
  3. 硬件:处理器包含一个内存管理单元(Memory Management Uint,MMU)的部 件,负责把虚拟地址转换为物理地址。

Linux内核整体架构及子系统

Linux内核只是操作系统当中的一部分,对下管理系统所有硬件设备;对上通过系统调用向Library Routinue或(或者其它应用程序提供API接口)。

重心:管理硬件设备、供应用程序使用。
现在系统标准组成:CPU、Memory(内存和外存)、I/O设备、网络设备和其他外围设备。

用户空间

应用程序使用malloc()申请内存,free()释放内存。malloc()/free()是glibc库的内存分配器ptmalloc提供的接口,ptmalloc使用系统调用brk或mmap向内核以页为单位申请内存,然后进行分成很小的内存块分配给对应的应用程序。

内核空间

虚拟内存管理负责从进程的虚拟地址空间分配虚拟页,sys_brk来扩大或收缩堆,sys_mmap用来在内存映射区域分配虚拟页,sysmunmap用来释放虚拟页。页分配器负责分配物理页,使用的分配器是伙伴分配器。
内核空间扩展功能,不连续页分配器提供分配内存的接口vmalloc和释放内存接口vfree。在内存碎片化的时候,申请连续物理页的成功率比较低,可以申请不连续的物理页,映射到连续的虚拟页,即虚拟地址连续而物理地址不连续。
内存控制组用来控制进程占用的内存资源。当内存碎片化的时候,找不到连续的物理页,内存碎片整理通过迁移方式得到连续的物理页。在内存不足的时候,页回收负责回收物理页。

硬件

MMU包含一个页表缓存,保存最近使用过的页表映射,避免每次把虚拟地址转换为物理地址都需要查询内存中的页表。解决处理器执行速度和内存速度不匹配问题,中间增加一个缓存。一级缓存分为数据缓存和指令缓存。二级作用协调一级缓存和内存之间的工作效率。

系统调用(system call)

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#define MAX 1024

int main(int argc, char* argv[]) 
    int *p = sbrk(0);
    int *old = p; 
    p = sbrk(MAX*MAX);

    if(p == (void*)(-1)) 
        perror("sbrk error.\\n");
        exit(-1);
     

    printf("old:%p\\np:%p\\n",p,old);
    int *new=sbrk(0);
    printf("new:%p\\n",new);
    printf("pid=%d\\n",getpid());
    while(1);
    sbrk(-MAX*MAX);
    
    return 0;


虚拟地址空间布局架构

应用程序没有那么大的内存需求,ARM64处理器不支持完全的64位虚拟地址。
在ARM64架构的Linux内核中,内核虚拟地址和用户虚拟地址的宽度相同。 所有进程共享内核虚拟地址空间,每个进程有独立的用户虚拟地址空间,同一个线程组的用户线程共享用户虚拟地址空间,内核线程没有用户虚拟地址空间。

用户虚拟地址空间划分

进程的用户虚拟空间的起始地址是0,长度是TASK_SIZE,由每种处理器架构定义自己的宏TASK_SIZE。
ARM64架构定义的宏TASK_SIZE如下:
32位用户空间程序:TASK_SIZE的值是TASK_SIZE_32,即0x100000000,等4GB。
64位用户空间程序:TASK_SIZE的值是TASK_SIZE_64,即2^VA_BITS字节。
VA_BITS是编译内核时候选择的虚拟地址位数
进程的用户虚拟地址空间包含区域:

  • 代码段、数据段、未初始化的数据段
  • 动态库的代码段、数据段和未初始化的数据段
  • 存放动态生成的数据的堆
  • 存放局部变量和实现函数调用的栈
  • 把文件区间映射到虚拟地址空间的内存映射区域
  • 存放在栈底部的环境变量和参数字符串
    内核使用内存描述符mm_struct描述进程的用户虚拟地址空间。
    一个进程的虚拟地址空间主要由两个数据结构进行描述。一个是最高层次的mm_struct,一个是较高层次的vm_area_struct。最高层次mm_struct描述一个进程整个虚拟地址空间,较高层次结构描述虚拟地址空间的一个区间(称为虚拟区)。每个进程只有一个mm_struct结构,在每个进程的task_struct结构中,有一个专门用来指向该进程的结构。mm_struct结构是对整个用户空间的描述。

内核地址空间布局

KASAN:动态内存错误检查工具

总结

本文介绍了Linux内存管理架构,包括用户空间、内核空间、硬件部分,系统调用作用;虚拟地址空间架构,虚拟地址空间划分,内核地址空间布局等。

技术参考

https://ke.qq.com/webcourse/3294666/103425320#taid=11011153688937930&vid=5285890815717635737

以上是关于虚拟地址空间布局架构的主要内容,如果未能解决你的问题,请参考以下文章

Linux 内核 内存管理虚拟地址空间布局架构 ⑦ ( Linux 内核地址空间布局简介 )

Linux 内核 内存管理虚拟地址空间布局架构 ② ( 用户虚拟地址空间组成 | 内存描述符 mm_struct 结构体源码 )

Linux 内核 内存管理虚拟地址空间布局架构 ⑤ ( Linux 内核中对 “ 虚拟地址空间 “ 的描述 | task_struct 结构体源码 )

内存管理:虚拟地址空间布局

Linux 内核 内存管理虚拟地址空间布局架构 ⑥ ( mm_struct 结构体源码 | vm_area_struct 结构体源码 )

Linux 内核内存布局与堆管理