链接器为rodata 部分计算错误的地址

Posted

技术标签:

【中文标题】链接器为rodata 部分计算错误的地址【英文标题】:Linker calculates wrong addresses for rodata section 【发布时间】:2019-02-11 23:46:59 【问题描述】:

我为我的问题创建了一个最小示例。在 c 文件中,我初始化了一个包含 16 个元素的数组。然后我用数组指针和它的大小作为参数调用一个函数。该函数本身有效,我已经通过反汇编文件验证了这一点。堆栈指针初始化也可以正常工作。问题是数组指针的函数参数错误。我检查了它,失败的根源在主要部分的最开始。这里指针被存储在堆栈中。

我不明白的是:数组值存储在 .rodata 部分中。本节从 0x1000 开始。所以指向数组的指针也应该是0x1000。在反汇编中,0x1000 被加载到 a5 中(正确的值)。但随后它将地址 a5 的值加载到 a4 中。所以 0x1000 代表一个指向数组指针的指针,这没有任何意义恕我直言。有谁知道我做错了什么?

这里是所有需要的信息:

c 程序:

void test(uint8_t *array, int size)
    for(int i=0; i<size; ++i)
        LED_ADDR = array[i];
    

int main()
    uint8_t buf[] = 0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15;
    test(buf, 16);

链接脚本:

OUTPUT_ARCH( "riscv" )
ROMSIZE = 0x1000;
ROM_OFFSET = 0x0000;
RAMSIZE = 0x1000;
RAM_OFFSET = 0x1000;
/* provide variables for startup code (stack init) */
STACK_TOP = ( RAMSIZE + RAM_OFFSET - 4 );
ENTRY (start)
MEMORY 
    rom (rx) : ORIGIN = ROM_OFFSET, LENGTH = ROMSIZE
    ram (!rx) : ORIGIN = RAM_OFFSET, LENGTH = RAMSIZE

SECTIONS 
    .reset :  <PROJECTPATH>/obj/startup.o  > rom    /* startup code */
    .text :  *(.text)  > rom                        /* executable data */
    .rodata :  *(.rodata)  > ram                    /* read only data */
    .sdata :  *(.sdata)  > ram                      /* init vars */
    .bss (NOLOAD) :  *(.bss) FILL(0x0f);  > ram     /* uninit data */

反汇编文件重要部分: -in .text,main() 的开头:我假设数组的指针应该存储在堆栈中:

80:  000017b7    lui     a5,0x1      # a5 = first ram addr: begin of .rodata
84:  0007a703    lw      a4,0(a5)    # a4 = content of this addr?!?!?!
88:  fee42023    sw      a4,-32(s0)  # a4 gets stored on stack

-.rodata,包含数组的值:

Disassembly of section .rodata:
00001000 <.rodata>:
1000:   0100
1002:   0302
1004:   0504
...
100e:   0f0e

编辑:

我的 CPU 是哈佛架构,无法直接访问 ROM 中的数据。所以 .rodata 和 .data 必须在 RAM 中。我的做法是程序进程将指令写入 ROM,同时将 .rodata 和 .data 写入 RAM。我的硬件实现有助于实现这一点。 (我的一个脚本将二进制文件的这两个数据块分开,并以我的程序单元可以处理的协议对其进行转码。)

乍一看二进制文件是有效的:.text 位于 ROM 的地址空间中,.rodata 和 .data 位于 RAM 的地址空间中。但是链接器计算的 .rodata 的地址是错误的。

我的这个程序只是为了测试它的功能,否则我不会写这样的代码。 (优化标志也是-o0。)

首先,我想了解 main() 开头的那几行,它们应该将数组指针放入堆栈。

80:  000017b7    lui     a5,0x1      # a5 = first ram addr: begin of .rodata
84:  0007a703    lw      a4,0(a5)    # a4 = content of this addr?!?!?!
88:  fee42023    sw      a4,-32(s0)  # a4 gets stored on stack

为什么链接器将 .rodata 的开头视为指向数组的指针,而不是数组的实际地址?

【问题讨论】:

i 在您的代码中未初始化。在深入挖掘之前,请先修复编译器报告为警告的基本问题。 我在这里手动输入的,它没有被复制。在原始代码中,它已正确初始化。不过谢谢你的提示,我更正了。 minimal reproducible example 是从您编译的代码中逐字复制的代码,并验证它正在重现问题。在这里吗? 为什么链接描述文件将只读数据.rodata放在RAM中? 我已将其添加到我的问题中。 【参考方案1】:

我发现这里发生了什么:在 main 的开头,存储在 RAM 中 .rodata 的值被完全复制到堆栈中。因此,数组的指针现在指向堆栈而不是.rodata。这不是最优的,我可能必须找到一种方法来优化它并删除冗余数据。但无论如何这应该有效。我忘记了不仅要初始化堆栈指针,还要初始化帧指针。我的硬件还有另一个错误。这就是为什么它没有奏效。感谢您的帮助!

【讨论】:

【参考方案2】:

你的链接描述文件中有很多奇怪的东西

    .rodata 通常位于 ROM 中

    .rodata :  *(.rodata)  > ROM
    

    .data 在 RAM 中,但在启动期间从 ROM 复制数据:

    .data :  *(.data)  > ram AT > rom 
    

    您的局部变量 buff 不必从 .rodata 初始化。编译器可能会对其进行优化,以存储代码中的立即值。它可以完全优化它并内联测试功能。由于代码非常简单,因此有许多可能的优化。制作buffvolatile然后编译。

【讨论】:

我还推荐static const buf[]volatile static const buf[]。如果没有static const,编译器仍然可能将其复制到堆栈中(可能来自立即数)。但是,是的,volatile 将阻止编译器完全展开循环并使用立即数。 我已将其添加到我的问题中。

以上是关于链接器为rodata 部分计算错误的地址的主要内容,如果未能解决你的问题,请参考以下文章

Access 2007 链接表管理器为一个用户禁用 - 和错误 8458

在“.rodata”部分中引用

计算机系统篇之链接(10):.bss.data 和 .rodata section 之间的区别

构建时的链接器符号算术计算错误的结果

对于 SQL Server,SSIS xlsx For Each File 枚举器为空

AVR - GNU 链接器脚本 - 如何获取 .data 部分的加载地址