深入理解计算机操作系统(笔记)

Posted 2020-07-27 逆水东流

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了深入理解计算机操作系统(笔记)相关的知识，希望对你有一定的参考价值。

1.实时系统概念
2.编译连接
3.AT&T汇编指令学习(GCC)
4.内存对齐
5.Big-Endian大端模式和Little-Endian小端模式
6.过程调用

1.实时系统概念

前后台系统

后台是各种面向硬件的程序，如中断，定时器，gpio等。
前台是：

main()
{

    while(1)
    {
        ;
    }
}

循环中不断调用各种函数实现功能。

代码临界段

指处理时不可分割的代码，一旦这部分代码运行就不可以打断、
为了确保代码能正常运行，进入临界段代码钱需要关中断，执行完后再开中断。

任务

一个任务也就是一个线程，是一个简单的程序。
任务间通信最简单的办法是使用数据共享结构。
任务间通信途径：1）全局变量；2）发消息给另一个任务。
任务切换（context switch）

基于优先级的内核

不可剥夺型内核，允许使用不可重入函数。
可剥夺型内核，，最高优先级的任务一就绪，总能得到CPU的使用权。，不能直接使用不可重入函数。

互斥条件

处理共享数据时保证互斥，最简单的办法是关中断和开中断。

信号量

一种约定机制。
就好像一把钥匙。任务要运行下去需要获得信号量，且信号量没有被占用。

死锁

两个任务相互等待对方释放资源。

同步

一个中断或者任务触发另一个任务。

邮箱

一种内存共享方式。

时钟节拍

特定的周期性中断，如同系统的心脏。

2.编译连接

目标文件的格式

可重定位文件：

包含代码和数据  
可被用来链接成执行文件或者共享目标文件  
linux（.o） windows（.obj）

可执行文件：

包含可以执行的程序
系统可以直接执行的文件
linux (ELF文件,无后缀) windows (.exe)

共享目标文件：

包含代码和数据
跟可重定位文件和共享目标文件链接，产生新的目标文件
动态连接器将共享目标文件与可执行文件结合，作为进程映像的一部分来运行
linux（.so） windows (.DLL)

核心转储文件

Linux（core dump）

目标文件的具体内容
file header

目标文件头

code section

程序指令(.code /.text)
存放程序代码程序

data section

程序数据(.data /.bss)
.data段 初始化的全局和局部静态变量
.bss段  未初始化的全局和局部静态变量
.bss（block started by symbol）符号预留块,没有内容不占据空间

othe section

还有可能包含的其他段，例 bank data .ect

程序指令和数据分开存放的优点？3点。

3.AT&T汇编指令学习(GCC)

寄存器命名原则:
相比inter语法,AT&T语法格式要求所有的寄存器都必须加上取值符”%”.
操作码命令格式:
1. 源/目的操作数顺序:
  Intel语法格式中命令表示格式为:”opcode dest, src”; “操作码目标, 源”
  AT&T语法格式表示为:”opcode src, dest”; “操作码源, 目标”
2. 操作数长度标识:
  在AT&T语法中,通过在指令后添加后缀来指明该指令运算对象的尺寸.
  后缀 ‘b’ 指明运算对象是一个字节(byte)
  后缀 ‘w’ 指明运算对象是一个字(word)
  后缀 ‘l’ 指明运算对象是一个双字(long)
  Intel语法中指令’mov’在AT&T语法必须根据运算对象的实际情况写成:’movb’,’movw’或’movl’。
  注:若在AT&T中省略这些后缀,GAS将通过使用的寄存器大小来猜测指令的操作数长度.
3. 另外,
  ‘FAR’不是GAS的关键字,因此对far的call或jmp指令须加前缀 ‘l’, ‘far call’要写成 ‘lcall’ , ‘far jmp’ 要写成 ‘ljmp’ , ‘ret far’ 写成 ‘lret’。
常数/立即数的格式:
在AT&T语法中对立即数,须在其前加前缀 $ 来指明,而Inter语法则不需要。
另外, 在常数前也必须加一个前缀字符 * ,而Inter语法则也是不需要的。
内存寻址方式:
在Intel语法中,使用下面格式来表示存储器寻址方式:
SECTION:[BASE + INDEX*SCALE + DISP];段:[基地址+变址*比例因子+偏移量]
BASE是基地址索引寄存器(可以是任一通用寄存器),
INDEX是变址寄存器(除ESP外的任一通用寄存器),
SCALE是变址寄存器的比例常数,
DISP是基址/变址寄存器的位移量。
AT&T语法则使用不同的格式来表示寻址方式:
SECTION:DISP(BASE, INDEX, SCALE);段:偏移量(基地址,变址,比例因子)
标号 & 标识符:
所有的标号必须以一个字母,点或下划线开始,标号后加一个冒号表示标号的结束。
局部标号使用数字0-9后跟一个冒号,使用局部标号时要在数字后跟一个字符’b’(向后引用)或字符’f’(向前引用)。因为只能使用数字0-9作为局部标号名,所以最多只能定义10个局部标号.一个标识符能给它赋于一个值。(如:’TRUE=1’, 或者使用 .set 或 .equ 指令)。
基本的行内汇编格式:
asm("statements");
例如：asm(“nop”); asm(“movl %eax,%ebx”);
asm　和　_asm_是完全一样的.
如果有多行汇编，则每一行都要加上　“\n\t”
扩展的行内汇编格式:
asm ( "statements" : output_regs : input_regs : clobbered_regs);
冒号后的语句指明输入，输出和被改变的寄存器．
IA32整数寄存器：
常用指令：
1. 数据传送指令：move,push,pop;
2. 加载有效地址指令：leal;
3. 一元操作指令：inc(加1),dec(减1)，neg(取负)，not(取补);
4. 二元操作指令：add,sub,imul,idivl(有符号除法),xor,or,and;
5. 移位指令：sal(左移)，shl,sar(算数右移)，shr(逻辑右移)；
6. 跳转指令：jmp,je,jne,js,jns,jg,jl,ja,jb,jbe…

条件码寄存器(单个bit)：
cf(进位标志),zf(零标志),sf(符号标志),of(溢出标志)…
访问条件码指令：cmp,test,set…

t = a + b;
cf: (unsigned) t < (unsigned) a;//无符号溢出  
zf: t == 0;//零  
sf: t < 0;//负数  
of: (a < 0 == b < 0) && (t < 0 != a < 0)//有符号溢出

4.内存对齐

为何要内存对齐
1. 平台原因(移植原因)：不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。
2. 性能原因：经过内存对齐后，CPU的内存访问速度大大提升。
内存对齐的规则

许多实际的计算机系统对基本类型数据在内存中存放的位置有限制，它们会要求这些数据的首地址的值是某个数k(通常它为4或8)的倍数，这就是所谓的内存对齐，而这个k则被称为该数据类型的对齐模数(alignment modulus)。当一种类型S的对齐模数与另一种类型T的对齐模数的比值是大于1的整数，我们就称类型S的对齐要求比T强(严格)，而称T比S弱(宽松)。这种强制的要求一来简化了处理器与内存之间传输系统的设计，二来可以提升读取数据的速度。

比如这么一种处理器，它每次读写内存的时候都从某个8倍数的地址开始，一次读出或写入8个字节的数据，假如软件能保证double类型的数据都从8倍数地址开始，那么读或写一个double类型数据就只需要一次内存操作。否则，我们就可能需要两次内存操作才能完成这个动作，因为数据或许恰好横跨在两个符合对齐要求的8字节内存块上。某些处理器在数据不满足对齐要求的情况下可能会出错.

但是Intel的IA32架构的处理器则不管数据是否对齐都能正确工作。不过Intel奉劝大家，如果想提升性能，那么所有的程序数据都应该尽可能地对齐。
1. Win32平台下的微软C编译器(cl.exe for 80x86)在默认情况下采用如下的对齐规则:
  任何基本数据类型T的对齐模数就是T的大小，即sizeof(T)。比如对于double类型8字节)，就要求该类型数据的地址总是8的倍数，而char类型数据(1字节)则可以从任何一个地址开始。
2. Linux下的GCC对齐规则:
  char类型数据(1字节)起始位置任意,任何2字节大小的数据类型(比如short)的对齐模数是2，而其它所有超过2字节的数据类型(比如long,double)都以4为对齐模数。也就是说2字节数据类型（如short）的地址必须是2的倍数，而较大的数据类型（如int,double等）的地址必须是4的倍数，这意味着short类型的队形的地址最低位必须等于0，任何int类型的对象或指针的最低两位必须都是0.

5.Big-Endian大端模式和Little-Endian小端模式

定义

Little-Endian就是低位字节排放在内存的低地址端，高位字节排放在内存的高地址端。

Big-Endian就是高位字节排放在内存的低地址端，低位字节排放在内存的高地址端。

网络字节序：TCP/IP各层协议将字节序定义为Big-Endian，因此TCP/IP协议中使用的字节序通常称之为网络字节序.

高/低字节定义:在十进制中我们都说靠左边的是高位，靠右边的是低位，在其他进制也是如此。就拿 0x12345678来说，从高位到低位的字节依次是0x12、0x34、0x56和0x78.

例子分析:

unsigned int value = 0x12345678

1.Big-Endian: 低地址存放高位

栈底（高地址）
buf[3]	(0x78)	低位
buf[2]	(0x56)
buf[1]	(0x34)
buf[0]	(0x12)	高位
栈顶（低地址）

2.Little-Endian: 低地址存放低位

栈底（高地址）
buf[3]	(0x12)	高位
buf[2]	(0x34)
buf[1]	(0x56)
buf[0]	(0x78)	低位
栈顶（低地址）

在Little-endian模式CPU内存中的存放方式(假设从地址0x4000开始存放)

内存地址	0x4000	0x4001	0x4002	0x4003
存放内容	0x78	0x56	0x34	0x12

在Big- endian模式CPU内存中的存放方式则为

内存地址	0x4000	0x4001	0x4002	0x4003
存放内容	0x12	0x34	0x56	0x78

注意：通常我们说的主机序（Host Order）就是遵循Little-Endian规则。所以当两台主机之间要通过TCP/IP协议进行通信的时候就需要调用相应的函数进行主机序（Little-Endian）和网络序（Big-Endian）的转换。
检查CPU是大端还是小端:

int checkCPU(void)  
{  
    union  
    {  
        int a;  
        char b;  
    }c;  
    c.a = 1;  
    return (c.b == 1);  
}

6.过程调用

1. 栈帧结构

说明：
返回值在相对%ebp偏移量为4的位置；
第一个参数放在相对于%ebp偏移量为8的位置；

支持过程调用和返回的指令：

一个过程调用的整个汇编流程示意：

以上是关于深入理解计算机操作系统(笔记)的主要内容，如果未能解决你的问题，请参考以下文章

《深入理解计算机系统》笔记

4.1《深入理解计算机系统》笔记链接知识附图

深入理解计算机操作系统－－读书笔记－第八章异常

《深入理解计算机系统》读书笔记：第七章链接

深入理解计算机操作系统——读书笔记01

《深入理解计算机系统》 Chapter 7 读书笔记