什么是“Pentium4 及以上”处理器的 gcc 的最佳 March & mtune 选项

Posted

技术标签:

【中文标题】什么是“Pentium4 及以上”处理器的 gcc 的最佳 March & mtune 选项【英文标题】:What's optimal march & mtune options for gcc for "Pentium4 and above" processors 【发布时间】:2011-07-21 16:21:37 【问题描述】:

我的 C++ 应用程序(使用 g++ 编译)需要在 Pentium-4(32 位)及更​​高版本上运行。但是,它通常与 Core2Duo 或更好的处理器一起使用。

我目前正在使用:-march=pentium4 -mtune=pentium4。但是一些阅读促使我认为 -march=pentium4 -mtune=generic 可能会更好。

任何人都可以对此有所了解吗?在这种情况下,march & mtune 选项的最佳值是多少?

平台:RHEL 5.3(32 位)上的 GCC 4.1.2。

【问题讨论】:

【参考方案1】:

那就是-march=pentium4 -mtune=core2,可以看到on the GCC manual。

【讨论】:

为什么选择“-march=pentium4 -mtune=core2”?哪个版本最好?较新的 gcc (4.6.1) 对arch=core2 的指令调度没有问题。 OP 要求在 >= Pentium4 上运行并通常在 core2 上使用的东西 即-march=core2 包含 Pentium4 上不可用的指令,而 -mtune 仅控制指令调度。 但是-march=pentium4 时有-mtune=core2 有什么好处,因为无论如何只会使用与pentium4 兼容的指令集? @Syam: -mtune 更改指令调度(即如何订购指令以获得最佳性能)。

以上是关于什么是“Pentium4 及以上”处理器的 gcc 的最佳 March & mtune 选项的主要内容,如果未能解决你的问题,请参考以下文章

使用gcc编译C程序

gcc 和 g++/gcc-c++ 有啥区别?

GCCARM-LINUX-GCCARM-ELF-GCC浅析

为啥 gcc -O3 处理 avx256 的内在比较与 gcc -O0 和 clang 不同?

gcc -g -o -c分别是什么意思

gcc 自动矢量化(未处理的数据参考)