LINUX架构

Posted 2021-01-16

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了LINUX架构相关的知识，希望对你有一定的参考价值。

现代计算机由 CPU、Memory（内存和外存）、输入输出设备、网络设备和其它的外围设备。为了管理这些设备，Linux内核提出了如下的架构:
技术分享图片

上图说明了Linux内核的整体架构。根据内核的核心功能，Linux内核提出了5个子系统，分别负责如下的功能：

Process Scheduler，也称作进程管理、进程调度。负责管理CPU资源，以便让各个进程可以以尽量公平的方式访问CPU。
Memory Manager，内存管理。负责管理Memory（内存）资源，以便让各个进程可以安全地共享机器的内存资源。另外，内存管理会提供虚拟内存的机制，该机制可以让进程使用多于系统可用Memory的内存，不用的内存会通过文件系统保存在外部存储器中，需要使用的时候，再取回到内存中。
VFS（Virtual File System），虚拟文件系统。Linux内核将不同功能的外部设备，例如Disk设备（硬盘、磁盘、NAND Flash、Nor Flash等）、输入输出设备、显示设备等等，抽象为可以通过统一的文件操作接口（open、close、read、write等）来访问。这就是Linux系统“一切皆是文件”的体现（其实Linux做的并不彻底，因为CPU、内存、网络等还不是文件，如果真的需要一切皆是文件，还得看贝尔实验室正在开发的"Plan 9”的）。
Network，网络子系统。负责管理系统的网络设备，并实现多种多样的网络标准。
IPC（Inter-Process Communication），进程间通信。IPC不管理任何的硬件，它主要负责Linux系统中进程之间的通信。

内存管理（Memory Manager, MM)

ARM架构寄存器

Arm处理器有七种工作模式，为的是形成不同的使用级别，以防造成对系统的破坏。不同模式可以访问的寄存器不同，可以运行的指令不同。

（1）usr（10000）：普通应用程序运行的模式（应用程序）
（2）FIQ（10001）：快速中断模式，以处理快速情况，高速数据传输
（3）IRQ（10010）：外部中断模式，普通中断处理
（4）svc（10011）：保护模式（管理模式），操作系统使用的特权模式（内核）
（5）abt（10111）：数据访问中止模式，用于虚拟存储和存储保护
（6）und（11011）：未定义指令终止模式，用于支持通过软件仿真硬件的协处理器
（7）sys（11111）：系统模式，用于运行特权级的操作系统任务（armv4以上版本才具有）

注意：usr是普通模式，其他六种是特权模式，而除了usr和sys模式以外的五种模式是异常模式

我们首先可以找到这样一本资料《ARM Architecture Reference Manual》在其中的Programmers’Model一章中，我们可以轻松的找到官方文档对寄存器的说明:
Arm处理器总共有37个寄存器其可以分为以下两类（在此我先列出大框架下面会一一介绍）：

通用寄存器（31个）
--不分组寄存器（R0—R7）
--分组寄存器（R8—R14）
--PC指针（R15）

状态寄存器（6个）
--CPSR（1个）
--SPSR（5个）

ARM微处理器共有37个32位寄存器，其中31个为通用寄存器，6个为状态寄存器。
技术分享图片

技术分享图片
通用寄存器
1、不分组寄存器（R0-R7）
2、分组寄存器（R8-R14）
程序计数器R15（PC）

不分组通用寄存器
R0-R7是不分组寄存器。这意味着在所有处理器模式下，访问的都是同一个物理寄存器。不分组寄存器没有被系统用于特别的用途，任何可采用通用寄存器的应用场合都可以使用未分组寄存器。

分组寄存器R8-R12
1、FIQ模式分组寄存器R8-R12
2、FIQ以外的分组寄存器R8-R12
分组寄存器R8-R12
1、FIQ模式分组寄存器R8-R12
2、FIQ以外的分组寄存器R8-R12

分组寄存器R13、R14
1、寄存器R13通常做堆栈指针SP
2、寄存器R14用作子程序链接寄存器（Link Register-LR），也称为LR，指向函数的返回地址。
r15充当程序寄存器PC，r14（link register）存储子程序的返回地址，r13存储的是堆栈地址。

程序计数器
寄存器R15被用作程序计数器，也称为PC。其值等于当前正在执行的指令的地址+8（因为在取地址和执行之间多了一个译码的阶段）。

ARM所有工作模式下都可以访问程序状态寄存器CPSR。CPSR包含条件码标志、中断禁止位、当前处理器模式以及其他状态和控制信息。

CPSR在每个异常模式下都有一个对应的物理寄存器——程序状态保存寄存器SPSR。当异常出现时，SPSR用于保存CPSR的值，以便异常返回后恢复异常发生时的工作状态。

MMU

MMU就是负责虚拟地址（virtual address）转化成物理地址（physical address）。
在这里肯定有人跟我一样的疑惑，既然有物理地址我们访问的时候访问物理地址不就完事了吗？为什么要有虚拟地址的存在，然后还要加个专门的硬件去转换，这就是多此一举吗？

其实加入了虚拟地址后有下面两个作用

1) 虚拟内存：有了虚拟内存，可以在处理器上运行比实际物理内存大的应用程序。

2) 内存保护：根据需要对特定的内存区块的访问进行保护，通过这一功能，我们可以将特定的内存块设置成只读、只写或是可同时读写。

ARM CPU上的地址转换过程涉及三个概念：虚拟地址（VA）（CPU内核对外发出VA），变换后的虚拟地址（MVA）（VA被转换为MVA供cache和MMU使用，在此将MVA转换为PA），物理地址（PA）（最后使用PA读写实际设备）。

CPU看到的用到的只是VA，CPU不管VA最终是怎样到PA的。
cache、MMU也是看不到VA的，它们使用的是MVA（VA到MVA的转换是由硬件自动完成的）。
实际设备看不到VA、MVA，读写设备使用的是PA物理地址。

I/D cache

Cache 是位于 CPU与主存储器DRAM之间的少量超高速静态存储器 SRAM（static RAM），其是为了解决 CPU 与主存之间速度匹配问题而设置的。

Cache又分为I-cache（用来存指令）和D-cache（用来存数据）
(instruction /command /order 指令)

为什么要让cache失效
同我们编写业务代码一样,对配置数据进行更改后需要清空缓存(或让其超时失效)

内存基本分类

1) SDRAM（2440常用）
2) DDR（6410常用）
3) DDR2（210常用）
4) DDR3/ DDR4

DRAM
Dynamic Random Access Memor），即动态随机存取存储器，最为常见的系统内存。DRAM 只能将数据保持很短的时间。为了保持数据，DRAM使用电容存储，所以必须隔一段时间刷新（refresh）一次，如果存储单元没有被刷新，存储的信息就会丢失。（关机就会丢失数据）

表结构：

内存的内部结构如同一张表格，我们称为l-bank类似与下图，其中每个单元格中可以存放数据

技术分享图片

内存寻址

1) L-Bank

一方面由于技术、成本等原因，不可能只做一个全容量的L-Bank，而另一方面由于SDRAM的工作原理限制，单一的L-Bank将会造成非常严重的寻址冲突，大幅降低内存效率。所以人们在SDRAM内部分割成多个L-Bank。

因此我们在寻址时就要先确定是哪个L-Bank，然后再在这个选定的L-Bank中选择行列地址进行寻址。

2) 行地址（Row）

3) 列地址（Column）

上面已经说明了内存的寻址方法，其实其内部构造如下图
技术分享图片
内存芯片容量的计算

内存芯片的容量就是所有的L-Bank中的存储单元的总容量，那么我们可以得到总的存储单元数量

存储单元数量=行数×列数（一个L-Bank的存储单元数量）×L-Bank的数量

那么如何知道一个存储单元的容量呢？其实在内存芯片的文档中都会有说明，大家可以自己找找看。大家也可以参考其芯片命名进行计算，这里有篇博文简单分析了常见内存芯片的命名规则http://blog.chinaunix.net/uid-20964486-id-1831487.html

编程分析

我们的芯片通过存储控制器对内存进行访问，我们对内存的初始化起始就是对控制器的初始化，所以我们知道怎么对存储控制器进行初始化，
内存的位置:
技术分享图片
从上图可知210的DRAM分为两个区域，DRAM0和DRAM1总共为1.5G大小，分别通过DMC0和DMC1进行控制，我们要根据自己手头的板子进行确定。

Linux体系结构（linux系统构成）

Linux可以分为两部分，分别为用户空间和内核空间具体如下图：
技术分享图片

a) 用户空间包括：用户的应用程序、C库

b) 内核空间包括：系统调用接口、内核（狭义内核）、平台架构相关的代码

为什么要分为内核空间和用户空间?

我们在分析u-boot的时候就说到过，我们的cpu在不同的工作模式下可以访问的寄存器是不一样的，所以为了保护我们的操作系统，避免用户程序将内核搞崩，所以进行了内核空间和用户空间的划分。

Linux内核结构（广义内核）

Linux内核由七个部分构成，具体如下图：
技术分享图片

a) 系统调用接口（SCI）：open、read、write等系统调用
b) 进程管理（PM）：创建进程、删除进程、调度进程等
c) 内存管理（MM）：内存分配、管理等
d) 虚拟文件系统（VFS）：为多种文件系统提供统一的操作接口
e) 网络协议栈：提供各种网络协议
f) CPU架构相关代码（Arch）：为的是提高至移植性
g) 设备驱动程序（DD）：各种设备驱动，占到内核的70%左右代码

源码目录简介
其源码主要有以下目录（介绍重要目录）：

a) Arch目录：存放处理器相关的代码。下设子目录，分别对应具体的CPU，每个子目录有boot，mm，以及kernel三个子目录，分别对应系统引导以及存储管理，和系统调用

b) Include目录：内核所需要的大部分头文件目录。与平台无关的在include/linux子目录下，与平台相关的则放在include相应的子目录中。

c) fs目录：存放各种文件系统的实现代码。

d) init目录：init子目录包含核心的初始化代码（不是系统的引导代码）。其包含两个文件main.c和version.c，可以用来研究核心如何工作。

e) ipc目录：包含核心进程间的通信代码。

f) kernel目录：包含内核管理的核心代码。与硬件相关代码放在arch/*/kernel目录下。

g) mm目录：包含了所有的内存管理代码。与硬件相关的内存管理代码位于arch/*/mm目录下。

h) scripts目录：包含用于配置核心的脚本文件。

i) lib目录：包含了核心的库代码，与硬件相关的库代码被放在arch/*/lib/目录下

动态加载内核模块

linux内核提供在运行时可进行扩展的特性，这意味着当系统启动并运行时，我们可以向内核添加或移除部分功能。

我们在运行时添加到内核中的代码就被成为动态可加载内核模块，我们简称为内核模块。

内核模块的相关操作

a) 加载内核模块：insmod
b) 卸载内核模块：rmmod
c) 查看内核模块：lsmod

模块声明

a) MODULE_LICENSE（“GPL”）：内核可以识别的许可证有GPL（任意版本GNU通用公共许可证）、GPL v2等
b) MODULE_AUTHOR（“作者”）：声明作者信息可以不用
c) MODULE_VERSION（“版本”）：声明版本信息也可以不用
d) MODULE_DESCRIPTION（“功能描述”）：声明模块功能，可不用
ref:https://www.cnblogs.com/wrjvszq/p/4260996.html

1、内核模块编写
2、Makefile编写
3、编译Makefile
4、加载
5、查看
6、卸载
printk函数为内核打印函数，其和printf函数功能类似，不过比printf多了打印权限一共有8个级别，printk的日志级别定义如下（在include/linux/kernel.h中）：

1 #define KERN_EMERG 0 //紧急事件消息，系统崩溃之前提示，表示系统不可用
2 #define KERN_ALERT 1 //报告消息，表示必须立即采取措施
3 #define KERN_CRIT 2 //临界条件，通常涉及严重的硬件或软件操作失败
4 #define KERN_ERR 3 //错误条件，驱动程序常用KERN_ERR来报告硬件的错误
5 #define KERN_WARNING 4 //警告条件，对可能出现问题的情况进行警告
6 #define KERN_NOTICE 5 //正常但又重要的条件，用于提醒
7 #define KERN_INFO 6 //提示信息，如驱动程序启动时，打印硬件信息
8 #define KERN_DEBUG 7 //调试级别的消息

Linux地址映射

技术分享图片

用户空间（0~3G）

a) 空间简介

其从0x00000000到0xBFFFFFFF共3GB的线性地址空间，每个进程都有一个独立的3GB用户空间，当然这是虚拟的空间。

b) 如何转换为物理空间

这一部分虚拟空间到物理空间的转换方法通过MMU地址转换。

内核空间（3~4G）

其中0xC0000000到0xFFFFFFFF共1GB大小，内核空间又可以根据映射方式的不同分为下面四块，我们一一分析

a) 内核逻辑地址空间

l 空间简介

其从0xC0000000到high_memory(图中896MB的地方)最大为896MB（也就是说这块空间有可能不满，但最大为896MB），当然是虚拟空间。

注：在此注意一下896MB我们一会在分析。
如何转换为物理空间

这一部分虚拟地址与物理内存中对应的地址只差一个固定偏移量（3G），如果内存物理地址空间从0x00000000地址编址，那么这个固定偏移量就是PAGE_OFFSET（如上图）

b) Vmalloc空间

l 空间简介

其地址没有严格的界限，这段空间既可以访问到我们的高端内存，也可以访问到低端内存。（高端和低端一会解释）

l 如何转换为物理空间

不是通过简单的线性关系映射，在此不研究。
c) 永久内核映射

l 空间简介

其固定用来访问高端内存。

l 如何转换为物理空间

不是通过简单的线性关系映射，在此不研究。

d) 固定映射

l 空间简介

其在系统初始化期间永久映射I/O地址空间，或者特殊的寄存器。

1) 低端内存

内核逻辑地址空间所映射的物理内存就是低端内存(实际物理内存的大小，但是小于896MB)

2) 高端内存

低端内存地址之上的物理内存是高端内存（物理内存896MB之上）。

3) 896MB来由

Linux将内存分为内核空间和用户空间，其中内核空间中的0xC0000000~high_memory部分用来映射物理内存，但是我们还需要映射I/O空间和固定的寄存器，所以留出了high_memory~0xFFFFFFFF之间的地址来映射I/O空间和固定的寄存器，而在X86平台根据经验设定了这个high_memory为896MB。

Linux内存分配

通过上面的介绍我们对linux对内存的管理，以及地址的映射有了一个了解，下面我们来分析linux是如何进行内存分配的。
技术分享图片
通过上图我们可以分析出内存的分配过程

由malloc、fork等系统调用和kmalloc、vmalloc申请得到虚拟内存。
在我们使用该内存的时候，产生请页异常（kmalloc除外）
从空闲的页框分配物理内存，和虚拟地址建立映射。

注：kmalloc申请空间是不用经过请页异常的，返回的虚拟地址已经对应了物理内存。Kmalloc可以分配到连续的物理内存，vmalloc分配的是非连续的物理内存。

以上是关于LINUX架构的主要内容，如果未能解决你的问题，请参考以下文章

马哥Linux教程：Linux基础入门和架构了解

LINUX架构

架构Linux的架构(architecture)

Linux系统目录架构

从Linux零基础小白到Linux云计算架构师的成长之路！