深入理解计算机操作系统(笔记)
Posted 逆水东流
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了深入理解计算机操作系统(笔记)相关的知识,希望对你有一定的参考价值。
深入理解计算机系统
1.实时系统概念
2.编译连接
3.AT&T汇编指令学习(GCC)
4.内存对齐
5.Big-Endian大端模式和Little-Endian小端模式
6.过程调用
1.实时系统概念
前后台系统
后台是各种面向硬件的程序,如中断,定时器,gpio等。
前台是:
main()
while(1)
;
循环中不断调用各种函数实现功能。
代码临界段
指处理时不可分割的代码,一旦这部分代码运行就不可以打断、
为了确保代码能正常运行,进入临界段代码钱需要关中断,执行完后再开中断。
任务
一个任务也就是一个线程,是一个简单的程序。
任务间通信最简单的办法是使用数据共享结构。
任务间通信途径:1)全局变量;2)发消息给另一个任务。
任务切换(context switch)
基于优先级的内核
不可剥夺型内核,允许使用不可重入函数。
可剥夺型内核,,最高优先级的任务一就绪,总能得到CPU的使用权。,不能直接使用不可重入函数。
互斥条件
处理共享数据时保证互斥,最简单的办法是关中断和开中断。
信号量
一种约定机制。
就好像一把钥匙。任务要运行下去需要获得信号量,且信号量没有被占用。
死锁
两个任务相互等待对方释放资源。
同步
一个中断或者任务触发另一个任务。
邮箱
一种内存共享方式。
时钟节拍
特定的周期性中断,如同系统的心脏。
2.编译连接
目标文件的格式
可重定位文件:
包含代码和数据
可被用来链接成执行文件或者共享目标文件
linux(.o) windows(.obj)
可执行文件:
包含可以执行的程序
系统可以直接执行的文件
linux (ELF文件,无后缀) windows (.exe)
共享目标文件:
包含代码和数据
跟可重定位文件和共享目标文件链接,产生新的目标文件
动态连接器将共享目标文件与可执行文件结合,作为进程映像的一部分来运行
linux(.so) windows (.DLL)
核心转储文件
Linux(core dump)
目标文件的具体内容
file header
目标文件头
code section
程序指令(.code /.text)
存放程序代码程序
data section
程序数据(.data /.bss)
.data段 初始化的全局和局部静态变量
.bss段 未初始化的全局和局部静态变量
.bss(block started by symbol)符号预留块,没有内容不占据空间
othe section
还有可能包含的其他段,例 bank data .ect
程序指令和数据分开存放的优点?3点。
3.AT&T汇编指令学习(GCC)
- 寄存器命名原则:
相比inter语法,AT&T语法格式要求所有的寄存器都必须加上取值符”%”. 操作码命令格式:
源/目的操作数顺序:
Intel语法格式中命令表示格式为:”opcode dest, src”; “操作码 目标, 源”
AT&T语法格式表示为:”opcode src, dest”; “操作码 源, 目标”操作数长度标识:
在AT&T语法中,通过在指令后添加后缀来指明该指令运算对象的尺寸.
后缀 ‘b’ 指明运算对象是一个字节(byte)
后缀 ‘w’ 指明运算对象是一个字(word)
后缀 ‘l’ 指明运算对象是一个双字(long)
Intel语法中指令’mov’在AT&T语法必须根据运算对象的实际情况写成:’movb’,’movw’或’movl’。
注:若在AT&T中省略这些后缀,GAS将通过使用的寄存器大小来猜测指令的操作数长度.- 另外,
‘FAR’不是GAS的关键字,因此对far的call或jmp指令须加前缀 ‘l’, ‘far call’要写成 ‘lcall’ , ‘far jmp’ 要写成 ‘ljmp’ , ‘ret far’ 写成 ‘lret’。
- 常数/立即数的格式:
在AT&T语法中对立即数,须在其前加前缀 $ 来指明,而Inter语法则不需要。
另外, 在常数前也必须加一个前缀字符 * ,而Inter语法则也是不需要的。 - 内存寻址方式:
在Intel语法中,使用下面格式来表示存储器寻址方式:
SECTION:[BASE + INDEX*SCALE + DISP];
段:[基地址+变址*比例因子+偏移量]
BASE是基地址索引寄存器(可以是任一通用寄存器),
INDEX是变址寄存器(除ESP外的任一通用寄存器),
SCALE是变址寄存器的比例常数,
DISP是基址/变址寄存器的位移量。
AT&T语法则使用不同的格式来表示寻址方式:
SECTION:DISP(BASE, INDEX, SCALE);
段:偏移量(基地址,变址,比例因子) - 标号 & 标识符:
所有的标号必须以一个字母,点或下划线开始,标号后加一个冒号表示标号的结束。
局部标号使用数字0-9后跟一个冒号,使用局部标号时要在数字后跟一个字符’b’(向后引用)或字符’f’(向前引用)。因为只能使用数字0-9作为局部标号名,所以最多只能定义10个局部标号.一个标识符能给它赋于一个值。(如:’TRUE=1’, 或者使用 .set 或 .equ 指令)。 - 基本的行内汇编格式:
asm("statements");
例如:asm(“nop”); asm(“movl %eax,%ebx”);
asm 和 _asm_是完全一样的.
如果有多行汇编,则每一行都要加上 “\\n\\t” - 扩展的行内汇编格式:
asm ( "statements" : output_regs : input_regs : clobbered_regs);
冒号后的语句指明输入,输出和被改变的寄存器. - IA32整数寄存器:
- 常用指令:
- 数据传送指令:move,push,pop;
- 加载有效地址指令:leal;
- 一元操作指令:inc(加1),dec(减1),neg(取负),not(取补);
- 二元操作指令:add,sub,imul,idivl(有符号除法),xor,or,and;
- 移位指令:sal(左移),shl,sar(算数右移),shr(逻辑右移);
- 跳转指令:jmp,je,jne,js,jns,jg,jl,ja,jb,jbe…
条件码寄存器(单个bit):
cf(进位标志),zf(零标志),sf(符号标志),of(溢出标志)…
访问条件码指令:cmp,test,set…t = a + b; cf: (unsigned) t < (unsigned) a;//无符号溢出 zf: t == 0;//零 sf: t < 0;//负数 of: (a < 0 == b < 0) && (t < 0 != a < 0)//有符号溢出
4.内存对齐
- 为何要内存对齐
- 平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
- 性能原因:经过内存对齐后,CPU的内存访问速度大大提升。
内存对齐的规则
许多实际的计算机系统对基本类型数据在内存中存放的位置有限制,它们会要求这些数据的首地址的值是某个数k(通常它为4或8)的倍数,这就是所谓的内存对齐,而这个k则被称为该数据类型的对齐模数(alignment modulus)。当一种类型S的对齐模数与另一种类型T的对齐模数的比值是大于1的整数,我们就称类型S的对齐要求比T强(严格),而称T比S弱(宽松)。这种强制的要求一来简化了处理器与内存之间传输系统的设计,二来可以提升读取数据的速度。
比如这么一种处理器,它每次读写内存的时候都从某个8倍数的地址开始,一次读出或写入8个字节的数据,假如软件能保证double类型的数据都从8倍数地址开始,那么读或写一个double类型数据就只需要一次内存操作。否则,我们就可能需要两次内存操作才能完成这个动作,因为数据或许恰好横跨在两个符合对齐要求的8字节内存块上。某些处理器在数据不满足对齐要求的情况下可能会出错.
但是Intel的IA32架构的处理器则不管数据是否对齐都能正确工作。不过Intel奉劝大家,如果想提升性能,那么所有的程序数据都应该尽可能地对齐。
- Win32平台下的微软C编译器(cl.exe for 80x86)在默认情况下采用如下的对齐规则:
任何基本数据类型T的对齐模数就是T的大小,即sizeof(T)。比如对于double类型8字节),就要求该类型数据的地址总是8的倍数,而char类型数据(1字节)则可以从任何一个地址开始。 - Linux下的GCC对齐规则:
char类型数据(1字节)起始位置任意,任何2字节大小的数据类型(比如short)的对齐模数是2,而其它所有超过2字节的数据类型(比如long,double)都以4为对齐模数。也就是说2字节数据类型(如short)的地址必须是2的倍数,而较大的数据类型(如int,double等)的地址必须是4的倍数,这意味着short类型的队形的地址最低位必须等于0,任何int类型的对象或指针的最低两位必须都是0.
- Win32平台下的微软C编译器(cl.exe for 80x86)在默认情况下采用如下的对齐规则:
5.Big-Endian大端模式和Little-Endian小端模式
定义
- Little-Endian就是低位字节排放在内存的低地址端,高位字节排放在内存的高地址端。
- Big-Endian就是高位字节排放在内存的低地址端,低位字节排放在内存的高地址端。
- 网络字节序:TCP/IP各层协议将字节序定义为Big-Endian,因此TCP/IP协议中使用的字节序通常称之为网络字节序.
- 高/低字节定义:在十进制中我们都说靠左边的是高位,靠右边的是低位,在其他进制也是如此。就拿 0x12345678来说,从高位到低位的字节依次是0x12、0x34、0x56和0x78.
例子分析:
unsigned int value = 0x12345678
1.Big-Endian: 低地址存放高位
| ||
---|---|---|
|
|
|
|
| |
|
| |
|
|
|
|
2.Little-Endian: 低地址存放低位
| ||
---|---|---|
|
|
|
|
| |
|
| |
|
|
|
|
在Little-endian模式CPU内存中的存放方式(假设从地址0x4000开始存放)
内存地址 | 0x4000 | 0x4001 | 0x4002 | 0x4003 |
---|---|---|---|---|
存放内容 | 0x78 | 0x56 | 0x34 | 0x12 |
在Big- endian模式CPU内存中的存放方式则为
内存地址 | 0x4000 | 0x4001 | 0x4002 | 0x4003 |
---|---|---|---|---|
存放内容 | 0x12 | 0x34 | 0x56 | 0x78 |
注意:通常我们说的主机序(Host Order)就是遵循Little-Endian规则。所以当两台主机之间要通过TCP/IP协议进行通信的时候就需要调用相应的函数进行主机序 (Little-Endian)和网络序(Big-Endian)的转换。
检查CPU是大端还是小端:
int checkCPU(void)
union
int a;
char b;
c;
c.a = 1;
return (c.b == 1);
6.过程调用
1. 栈帧结构
说明:
返回值在相对%ebp偏移量为4的位置;
第一个参数放在相对于%ebp偏移量为8的位置;
支持过程调用和返回的指令:
一个过程调用的整个汇编流程示意:
以上是关于深入理解计算机操作系统(笔记)的主要内容,如果未能解决你的问题,请参考以下文章