ARM 架构及汇编
Posted 听枫要靠谱
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ARM 架构及汇编相关的知识,希望对你有一定的参考价值。
文章目录
1.ARM 架构及汇编
1.1 ARM架构
ARM芯片属于精简指令集计算机(RISC:Reduced Instruction Set Computor),它所用的指令比较简单,有如下特点:
① 对内存只有读、写指令
② 对于数据的运算是在CPU内部实现
③ 使用RISC指令的CPU复杂度小一点,易于设计
cpu与RAM和flash之间有地址总线和数据总线,cpu访问内存时,会发出地址addr,然后会得到数据。
比如对于a=a+b这样的算式,需要经过下面4个步骤才可以实现:
细看这几个步骤,有些疑问:
① 读a,那么a的值读出来后保存在CPU里面哪里?
② 读b,那么b的值读出来后保存在CPU里面哪里?
③ a+b的结果又保存在哪里?
我们需要深入ARM处理器的内部。简单概括如下,我们先忽略各种CPU模式(系统模式、用户模式等等)。
CPU运行时,先去取得指令,再执行指令:
① 把内存a的值读入CPU寄存器R0
② 把内存b的值读入CPU寄存器R1
③ 把R0、R1累加,存入R0(对于数据的运算是在cpu内部执行)
④ 把R0的值写入内存a
CPU内部有r0到r15寄存器,这些寄存器有别名(下图来自百度文库):
1.2 几条汇编指令
需要我们掌握的汇编指令并不多,只有几条:
- 读内存指令:LDR,即Load之意,加载寄存器,表示读4个字节,可以加后缀,B:LDRB表示读1个字节, H:LDRH表示读2个字节。
- 写内存指令:STR,即Store之意,存储的意思,可以加后缀,B:STRB表示写1个字节,STRH:2个字节
- 加减指令:ADD、SUB,不涉及内存操作即不用访问地址,只在cpu内部来实现
- 跳转:BL,即Branch And Link,
- 入栈指令:PUSH
- 出栈指令:POP
在栈的操作里,高标号的寄存器放在高地址Rn,低标号的寄存器放在低地址Rn-1
汇编并不复杂:
加载/存储指令(LDR/STR)
- 加载指令LDR:
LDR r0,[r3]
意思是将地址r3的内容加载(存放)到r0里面 ,r0=*r3
,去r3表示的地址读数据放入r0,注意r3是一个地址,不能使用MOV R0, R3,这个表示的意思是:将寄存器 R3 中的数据传递给 R0,即 R0=R3。- 存储指令STR:
STR r0,[r3]
意思是将r0中的值存储到地址r3上 ,*r3=r0
,把r0的值写到r3指示的地址上去,注意r3是一个地址,不能使用MOV R3, R0,这个表示的意思是:将寄存器 R0 中的数据传递给 R3,即 R3=R0。加法运算指令(ADD)
- 加法运算指令(ADD):
ADD r0,r1,r2
意思为:r0=r1+r2- 减法运算指令(SUB):
SUB r0,r1,r2
意思为:r0=r1-r2寄存器入栈/出栈指令(PUSH/POP)
- 寄存器入栈(PUSH):
PUSH r3,lr
意思是将寄存器r3和lr(用来存放当前子程序的返回地址)写入内存栈
- 本质是写内存STR指令,高标号寄存器写入高地址的栈里,低标号寄存器写入低地址的栈里,多次调用STR指令,并调整sp的值,先将sp=sp-4,再将r14的值放进去, sp=sp-4 [sp]=lr(即将lr中的内容放入sp所指的内存地址,后面亦是如此,不做阐述),sp=sp-4, [sp]=r3
- lr即r14,写入地址为
sp-4
的内存,然后:sp=sp-4- r3,写入地址为
sp-4
的内存,然后:sp=sp-4- 寄存器出栈指令(POP):
POP r3,pc
意思是取出内存栈的数据放入r3和pc中
- 本质是读内存LDR指令,高标号寄存器的内容来自高地址的栈,低标号寄存器的内容来自低地址的栈,r3=[sp] (即将sp所指的内存地址的内容放入r3寄存器) ,sp=sp+4,pc=[sp],sp=sp+4
- 读地址为
sp
的内存存入r3,然后:sp=sp+4- 读地址为
sp
的内存存入pc,然后:sp=sp+4跳转指令BL
- 跳转到标号地址,并将返回地址保存在 LR 中,R14(LR)来存放当前子程序的返回地址, BL A ,此指令有两个作用,第一记录返回地址(下一条指令的地址),保存在R14(LR),第二执行A函数。
1.3 函数运行的本质
如下是一个简单的程序
主函数里调用函数add_val()
:
void add_val(int *pa, int *pb)
volatile int tmp;
tmp = *pa;
tmp = tmp + *pb;
*pa = tmp;
int main()
int a = 1;
int b = 2;
add_val(&a, &b);
return 0;
其中调用函数add_val()
的汇编代码如下,我们加上了注释:
1 /* enter */
2 PUSH r3,lr //进入函数,寄存器r3、lr的值,都存入内存的栈中(lr保存程序返回地址)
3
4 /* tmp = *pa; */
5 LDR r2,[r0,#0x00] //将寄存器r0的值存放到r2,其中r0是函数的第一个参数值(ARM ATPCS规定)
6 STR r2,[sp,#0x00] //将寄存器r2的值存储到sp指向的内存
7
8 /* tmp = tmp + *pb; */
9 LDR r2,[r1,#0x00] //将寄存器r1的值存放到r2,其中r1是函数的第二个参数值(ARM ATPCS规定)
10 LDR r3,[sp,#0x00] //将寄存器sp指向内存的值存放到r3
11 ADD r2,r2,r3 //将寄存器r2和r3相加,保存到r2
12 STR r2,[sp,#0x00] //将寄存器r2的值存储到sp指向的内存
13
14 /* *pa = tmp; */
15 LDR r2,[sp,#0x00] //将寄存器sp指向内存的值存放到r2
16 STR r2,[r0,#0x00] //将寄存器r2的值存储到r0,其中r0将作为函数返回值(ARM ATPCS规定)
17
18 /* quit */
19 POP r3,pc //退出函数,获取内存的栈中的数据放入r3和pc中(此时pc为lr,实现了函数返回)
注:本文出自韦老师的教学
优化系列汇编优化技术:ARM架构32位汇编优化及demo
以上是关于ARM 架构及汇编的主要内容,如果未能解决你的问题,请参考以下文章
优化系列汇编优化技术:ARM架构Intrinsic汇编优化及demo
优化系列汇编优化技术:ARM架构64位(AARCH64)汇编优化及demo
Android 逆向arm 汇编 ( 使用 IDA 解析 arm 架构的动态库文件 | 分析 malloc 函数的 arm 汇编语言 )
Android 逆向arm 汇编 ( 使用 IDA 解析 arm 架构的动态库文件 | 分析 malloc 函数的 arm 汇编语言 )