ARM 架构及汇编

Posted 听枫要靠谱

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ARM 架构及汇编相关的知识,希望对你有一定的参考价值。

文章目录

1.ARM 架构及汇编

1.1 ARM架构

ARM芯片属于精简指令集计算机(RISC:Reduced Instruction Set Computor),它所用的指令比较简单,有如下特点:

对内存只有读、写指令

② 对于数据的运算是在CPU内部实现

③ 使用RISC指令的CPU复杂度小一点,易于设计

cpu与RAM和flash之间有地址总线和数据总线,cpu访问内存时,会发出地址addr,然后会得到数据。
比如对于a=a+b这样的算式,需要经过下面4个步骤才可以实现:

细看这几个步骤,有些疑问:

① 读a,那么a的值读出来后保存在CPU里面哪里?

② 读b,那么b的值读出来后保存在CPU里面哪里?

③ a+b的结果又保存在哪里?

我们需要深入ARM处理器的内部。简单概括如下,我们先忽略各种CPU模式(系统模式、用户模式等等)。

CPU运行时,先去取得指令,再执行指令:

① 把内存a的值读入CPU寄存器R0

② 把内存b的值读入CPU寄存器R1

③ 把R0、R1累加,存入R0(对于数据的运算是在cpu内部执行)

④ 把R0的值写入内存a

CPU内部有r0到r15寄存器,这些寄存器有别名(下图来自百度文库):

1.2 几条汇编指令

需要我们掌握的汇编指令并不多,只有几条:

  • 读内存指令:LDR,即Load之意,加载寄存器,表示读4个字节,可以加后缀,B:LDRB表示读1个字节, H:LDRH表示读2个字节。
  • 写内存指令:STR,即Store之意,存储的意思,可以加后缀,B:STRB表示写1个字节,STRH:2个字节
  • 加减指令:ADD、SUB,不涉及内存操作即不用访问地址,只在cpu内部来实现
  • 跳转:BL,即Branch And Link,
  • 入栈指令:PUSH
  • 出栈指令:POP

在栈的操作里,高标号的寄存器放在高地址Rn,低标号的寄存器放在低地址Rn-1

汇编并不复杂:

加载/存储指令(LDR/STR)

  • 加载指令LDR: LDR r0,[r3] 意思是将地址r3的内容加载(存放)到r0里面 ,r0=*r3,去r3表示的地址读数据放入r0,注意r3是一个地址,不能使用MOV R0, R3,这个表示的意思是:将寄存器 R3 中的数据传递给 R0,即 R0=R3。
  • 存储指令STR: STR r0,[r3] 意思是将r0中的值存储到地址r3上 ,*r3=r0,把r0的值写到r3指示的地址上去,注意r3是一个地址,不能使用MOV R3, R0,这个表示的意思是:将寄存器 R0 中的数据传递给 R3,即 R3=R0。

加法运算指令(ADD)

  • 加法运算指令(ADD): ADD r0,r1,r2 意思为:r0=r1+r2
  • 减法运算指令(SUB): SUB r0,r1,r2 意思为:r0=r1-r2

寄存器入栈/出栈指令(PUSH/POP)

  • 寄存器入栈(PUSH): PUSH r3,lr 意思是将寄存器r3和lr(用来存放当前子程序的返回地址)写入内存栈
    • 本质是写内存STR指令,高标号寄存器写入高地址的栈里,低标号寄存器写入低地址的栈里,多次调用STR指令,并调整sp的值,先将sp=sp-4,再将r14的值放进去, sp=sp-4 [sp]=lr(即将lr中的内容放入sp所指的内存地址,后面亦是如此,不做阐述),sp=sp-4, [sp]=r3
    • lr即r14,写入地址为sp-4的内存,然后:sp=sp-4
    • r3,写入地址为sp-4的内存,然后:sp=sp-4
  • 寄存器出栈指令(POP): POP r3,pc 意思是取出内存栈的数据放入r3和pc中
    • 本质是读内存LDR指令,高标号寄存器的内容来自高地址的栈,低标号寄存器的内容来自低地址的栈,r3=[sp] (即将sp所指的内存地址的内容放入r3寄存器) ,sp=sp+4,pc=[sp],sp=sp+4
    • 读地址为sp的内存存入r3,然后:sp=sp+4
    • 读地址为sp的内存存入pc,然后:sp=sp+4

跳转指令BL

  • 跳转到标号地址,并将返回地址保存在 LR 中,R14(LR)来存放当前子程序的返回地址, BL A ,此指令有两个作用,第一记录返回地址(下一条指令的地址),保存在R14(LR),第二执行A函数。

1.3 函数运行的本质

如下是一个简单的程序

主函数里调用函数add_val()

void add_val(int *pa, int *pb)

	volatile int tmp;
	
	tmp = *pa;
	tmp = tmp + *pb;
	*pa = tmp;



int main()

	int a = 1;
	int b = 2;
	
	add_val(&a, &b);

	return 0;

其中调用函数add_val()的汇编代码如下,我们加上了注释:

1   /* enter */ 
2   PUSH     r3,lr         //进入函数,寄存器r3、lr的值,都存入内存的栈中(lr保存程序返回地址)
3  
4   /* tmp = *pa; */ 
5   LDR      r2,[r0,#0x00]   //将寄存器r0的值存放到r2,其中r0是函数的第一个参数值(ARM ATPCS规定)
6   STR      r2,[sp,#0x00]   //将寄存器r2的值存储到sp指向的内存
7 
8   /* tmp = tmp + *pb;  */
9   LDR      r2,[r1,#0x00]   //将寄存器r1的值存放到r2,其中r1是函数的第二个参数值(ARM ATPCS规定)
10  LDR      r3,[sp,#0x00]   //将寄存器sp指向内存的值存放到r3
11  ADD      r2,r2,r3        //将寄存器r2和r3相加,保存到r2
12  STR      r2,[sp,#0x00]   //将寄存器r2的值存储到sp指向的内存 
13 
14  /* *pa = tmp; */ 
15  LDR      r2,[sp,#0x00]   //将寄存器sp指向内存的值存放到r2
16  STR      r2,[r0,#0x00]   //将寄存器r2的值存储到r0,其中r0将作为函数返回值(ARM ATPCS规定)
17  
18  /* quit */
19  POP      r3,pc         //退出函数,获取内存的栈中的数据放入r3和pc中(此时pc为lr,实现了函数返回)


注:本文出自韦老师的教学

优化系列汇编优化技术:ARM架构32位汇编优化及demo

DATE: 2021.8.15


1、前言

前面的几篇文章详细讲解了X86架构纯汇编、Intrinsic汇编和内联汇编三种形式的汇编方法,从本文开始详细讲解ARM架构汇编优化的基础知识和示例demo。

2、Arm汇编架构和Reference Manuals

ARM是RISC(精简指令集)处理器,不同于x86指令集(CISC,复杂指令集)。
Arm3

以上是关于ARM 架构及汇编的主要内容,如果未能解决你的问题,请参考以下文章

优化系列汇编优化技术:ARM架构内联汇编优化及demo

优化系列汇编优化技术:ARM架构Intrinsic汇编优化及demo

优化系列汇编优化技术:ARM架构64位(AARCH64)汇编优化及demo

Android 逆向arm 汇编 ( 使用 IDA 解析 arm 架构的动态库文件 | 分析 malloc 函数的 arm 汇编语言 )

Android 逆向arm 汇编 ( 使用 IDA 解析 arm 架构的动态库文件 | 分析 malloc 函数的 arm 汇编语言 )

嵌入式:ARM内嵌汇编及C和ARM汇编相互调用