编译器可以通过指向易失性的指针优化存储吗? [复制]

Posted

技术标签:

【中文标题】编译器可以通过指向易失性的指针优化存储吗? [复制]【英文标题】:May the compiler optimize out stores though a pointer-to-volatile? [duplicate] 【发布时间】:2021-02-10 07:24:42 【问题描述】:

对 volatile 变量的写入在某种程度上是 C++ 中的副作用,通常无法在 as-if 规则下进行优化。在实践中,这通常意味着在检查程序集时,您会看到抽象机器为每个易失性存储提供一个存储1

但是,我不清楚是否必须在以下情况下执行存储,即底层对象不是易失性的,但存储是通过指向易失性的指针完成的:

void vtest() 
    int buf[1];

    volatile int * vptr = buf;

    *vptr = 0;
    *vptr = 1;
    *vptr = 2;

在这里,gcc does in fact 优化所有的商店。 Clang 没有。奇怪的是,行为取决于缓冲区大小:buf[3] gcc 会发出存储,但buf[4] 不会,依此类推。

gcc 在这里的行为合法吗?


[1] 有一些小的变化,例如,一些编译器将在 x86 上使用单个读取-修改-写入指令来实现类似 v++ 的东西,其中 v 是易失性的)。

【问题讨论】:

可能与序列点有关...您需要深入了解n3337。您可能会对CompCert 或Decoder 项目(或Frama-C...的C++ 扩展)感兴趣 我建议在一些GCC mailing list上问同样的问题 @BasileStarynkevitch - 嗯this 似乎回答了这个问题(至少在新文本的标准中):重要的是用于访问的指针的限定,而不是底层的定义对象。 在当前草案中,this sentence 似乎是相关的:通过 volatile glvalue 访问的语义是实现定义的。 相关的Why is a volatile local variable optimised differently from a volatile argument, and why does the optimiser generate a no-op loop from the latter? 和Does accessing a declared non-volatile object through a volatile reference/pointer confer volatile rules upon said accesses? 的答案甚至可能是重复的。 【参考方案1】:

虽然对于 C 和 C++ 标准来说,识别其中 volatile 加载和存储具有特定语义的实现类别,并通过预定义的宏、内在函数或其他此类方式报告特定实现正在使用什么语义,这将是有用的,但两者都不是实施目前这样做。给定一个循环:

void hang_if_nonzero(int mode)

  int i = 1;
  do  +*(volatile int*)0x1234;  while(mode);

如果模式不为零,则需要编译器生成将阻止程序执行的代码,因为 volatile 读取被定义作为其本身的副作用,无论是否有任何方法可以将执行它的效果与跳过它的效果区分开来。但是,并不要求编译器实际为易失性访问生成任何加载指令。如果编译器指定它仅用于读取地址 0x1234 的效果与跳过读取的效果无法区分的硬件平台上,则允许跳过读取。

如果获取了对象的地址,但编译器可以考虑使用地址的所有方式并且代码从不检查地址的表示,则编译器不需要分配“正常”可寻址存储但可能会在闲暇时分配一个寄存器或其他形式的存储,这些存储不会通过正常的加载和存储访问。如果它可以判断一个对象在访问时将包含什么值,它甚至可以假装分配存储而不实际这样做。如果例如一个程序要执行以下操作:

int test(int mode)

  int a[2] = 1,2;
  int *p = a;
  return p[mode & 1] + p[mode & 1];

编译器不需要实际为a 分配任何存储空间,而是可以在闲暇时生成等效于return (1+(mode & 1)) << 1; 的代码。即使p 被声明为int volatile *p = a;,编译器也不需要为a 分配可寻址存储空间,因为编译器仍然可以解释通过指向a 的指针完成的所有事情,因此没有将a 保存在可寻址存储中的义务。因此允许编译器将读取a[mode & 1] 视为等同于评估表达式(1+(mode & 1))。如果读取是通过 volatile 指针完成的,则需要将其视为副作用,以确定是否可以省略循环,但不要求读取本身实际执行任何操作。

【讨论】:

“易失性写入被定义为副作用”实际上意味着易失性读取吗? @BenVoigt:谢谢;我稍微修改了那段文字。你还注意到什么?

以上是关于编译器可以通过指向易失性的指针优化存储吗? [复制]的主要内容,如果未能解决你的问题,请参考以下文章

优化volatile变量

将易失性数组与非易失性数组进行比较

everspin非易失性存储器中MRAM的潜在用途

易失性关键字和线程本地内存[关闭]

Flash硬件原理

MicroPython ESP32NVS数据非易失性存储示例讲解说明