在发布与调试模式下生成本地堆栈变量的代码
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在发布与调试模式下生成本地堆栈变量的代码相关的知识,希望对你有一定的参考价值。
作为我在Rust中的操作系统的一部分,我有以下系统调用入口点:
#[no_mangle]
#[naked]
#[inline(never)]
unsafe extern "C" fn syscall_handler() {
// switch to the kernel stack dedicated for syscall handling, and save the user task's details
asm!("swapgs;
mov gs:[0x8], rsp;
mov gs:[0x10], rcx;
mov gs:[0x18], r11;
mov rsp, gs:[0x0];"
: : : "memory" : "intel", "volatile");
let (rax, rdi, rsi, rdx, r10, r8, r9): (u64, u64, u64, u64, u64, u64, u64);
asm!("" : "={rax}"(rax), "={rdi}"(rdi), "={rsi}"(rsi), "={rdx}"(rdx), "={r10}"(r10), "={r8}"(r8), "={r9}"(r9) : : "memory" : "intel", "volatile");
// do stuff with rax, rdi, rsi...
这在调试模式下工作正常,并且在发布模式下(启用了调试信息),因为它生成汇编代码,用于存储本地堆栈变量,如rdi
,rsi
等,与基指针rbp
的负偏移量相同。例如,这是生成的代码:
<syscall_handler>:
swapgs
mov %rsp,%gs:0x8
mov %rcx,%gs:0x10
mov %r11,%gs:0x18
mov %gs:0x0,%rsp
mov %rax,-0x1f0(%rbp)
mov %rdi,-0x1e8(%rbp)
mov %rsi,-0x1e0(%rbp)
mov %rdx,-0x1d8(%rbp)
mov %r10,-0x1d0(%rbp)
mov %r8,-0x1c8(%rbp)
mov %r9,-0x1c0(%rbp)
movb $0x4,-0x1b1(%rbp)
该代码工作正常,因为我的系统调用处理程序使用指向当前内核堆栈顶部的堆栈指针运行(像往常一样),这意味着可以使用堆栈指针/基址指针的负偏移(基本指针rbp
已设置)在此之前基于堆栈指针值)。
当我在没有调试信息的情况下构建发布模式时,它生成的代码使用堆栈指针本身的正偏移量(rsp
,而不是基本指针)作为本地堆栈变量的位置。这非常奇怪并且导致问题,因为当前堆栈指针rsp
上方的内存超出了界限。
这是在没有调试信息的纯发布模式下生成的代码:
<syscall_handler>:
swapgs
mov %rsp,%gs:0x8
mov %rcx,%gs:0x10
mov %r11,%gs:0x18
mov %gs:0x0,%rsp
mov %rax,0x1c0(%rsp)
mov %rdi,0x1c8(%rsp)
mov %rsi,0x1d0(%rsp)
mov %rdx,0x1d8(%rsp)
mov %r10,0x1e0(%rsp)
mov %r8,0x1e8(%rsp)
mov %r9,0x1f0(%rsp)
为什么要生成此代码,使用堆栈指针的正偏移量的代码?这让我非常奇怪。
有什么方法可以避免这种情况或以某种方式更改代码生成?
堆栈增长了。来自RSP的正偏移是安全的中断异步修改的部分,即“保留”。
RSP的负偏移将是the red zone, which you can't have on the kernel stack。
使用sub rsp, 0x100
或其他任何东西来为你的裸函数的局部变量保留足够的空间。或者更好的是,在asm中编写整个入口点,而不是为编译器生成的代码搞乱。
或者更好的是,你自己使用push
,它更紧凑(代码大小),同样有效。 push
非常适合在堆栈中保存寄存器; Linux的系统调用入口点使用它。 (例如,the entry point into an x86-64 kernel from syscall
in 64-bit user-space使用push
来保存所有寄存器,从Linux 4.12开始(在Spectre / Meltdown缓解/解决方法补丁使得入口点更加复杂之前)。
它奇怪/令人困惑的原因是你要求一个naked
函数(因此没有函数序言来保留堆栈空间),但是无论如何你在其中使用了局部变量。否则编译器将自己sub rsp, 0x...
为本地人保留足够的空间,然后再访问它们。
我认为在一些支持裸功能的C / C ++编译器中,这是不受支持的;只允许内联asm,因为允许整个函数体。但是,就内联asm和编译器之间的奇怪探索而言,Rust所说的IDK正式得到支持。就像我说的那样,如果你用纯粹的asm编写入口点,你就不会遇到这些问题。
您的调试模式版本似乎已损坏;你是相对于RBP存储的,但还没有设置RBP。你要求naked
函数,所以你需要自己mov rbp, rsp
(从gs:0
加载RSP后),然后sub rsp, 0x20
或其他什么来保留堆栈帧中足够的空间用于那些负补偿。
我认为你的调试模式版本是相对于用户空间的RBP存储的,如果用户空间进行系统调用,RBP指向不应该被破坏的任何东西,这将会非常可怕,如果RBP持有非指针值。
(如果你刚刚使用mov rbp, rsp
或其他东西,根据你的评论,你把这部分留下了,那么你在RSP下面使用空间,没有红区就不安全。)
以上是关于在发布与调试模式下生成本地堆栈变量的代码的主要内容,如果未能解决你的问题,请参考以下文章