C/C++：浮点比较速度

Posted 2023-02-17

技术标签:

【中文标题】C/C++：浮点比较速度【英文标题】：C/C++: Float comparison speed 【发布时间】：2011-01-15 01:00:41 【问题描述】：

我正在检查以确保浮点数不为零。浮点数不可能变为负数。那么这个float != 0.0f 还是这个float > 0.0f 更快？

谢谢。

编辑：是的，我知道这是微优化。但这每次都会在我的游戏循环中被调用，无论如何我都想知道。

【问题讨论】：

浮点数可以是负数。它们也可能在零附近呈片状。微优化这个词浮现在脑海！如果存在差异，可能会非常小，以至于您永远不会注意到差异。您是否分析过您的代码并发现这种特殊的比较是性能瓶颈？如果存在差异，也很可能是特定于体系结构和 CPU 的。您确定如果该值为零，那么它将完全为零吗？请记住，浮点计算通常是不精确的。除非您明确设置f = 0.0f;，否则您需要考虑计算错误。 @Jay：如果它们可以为零，那么它们很有可能是负数。即使数学上说它们应该等于 0，但浮点运算的现实意味着它可以非常接近于零，但在负数方面。 @Jay：作为一个游戏开发者，我要告诉你，如果你不知道如何确定要使用哪个版本，那么你的游戏就没有足够的高性能需要知道。 始终编写最干净的代码。 永远不要编写“最快”的代码，因为在您拥有干净、可运行的程序之前，这无关紧要。你要快吗？ int main() 。我保证这比你能写的任何东西都快。 “但它什么都做不了！”为快速而不是正确而编写的损坏代码也不是。 【参考方案1】：

在性能上不太可能存在可检测的差异。

【讨论】：

和float > 0.0f，或者更好的float > EPSION更安全。【参考方案2】：

请考虑，仅供娱乐：

只有 2 个浮点值比较等于 0f：零和负零，它们仅相差 1 位。因此，测试 31 个非符号位是否清晰的电路/软件仿真就可以做到。

比较>0f稍微复杂一些，因为负数和0导致假，正数导致真，但NaN（两个符号的）也会导致假，所以它不仅仅是检查符号位.

根据浮点模式，任一操作都可能导致浮点寄存器在比较之前被舍入为 32 位的超精确结果，因此分数相等。

如果有任何区别，我有点希望!= 会更快，但我真的不希望有区别，我不会对某些特定的错误感到很惊讶实施。

我假设您的值不能为负的证明不受浮点错误的影响。例如，如果错误碰巧累积而不是取消，则沿1/2.0 - 1/3.0 - 1/6.0 或0.4 - 0.2 - 0.2 的计算可能会导致正值或负值，因此大概不会发生类似的情况。关于与 0 相等的浮点测试的唯一实际用途是测试您是否为它分配了文字 0。或者其他一些计算的结果保证在float 中有结果0，但这可能很棘手。

【讨论】：

关于你的最后一段，通过反复乘以小于一的值来降低浮点数。在硬件级别上，检查可以并行执行，因此两次检查将花费相同的时间。并且考虑到分支错误预测的代价要高得多，因此速度上不会有任何差异。 @ruslik：可以并行执行，还是保证并行执行？因此，速度不会有差异，还是速度很可能没有差异？换句话说，如果没有人可以提供一个速度不同的 C 实现，你会提供多大的可能性呢？你有信心提供 1000:1 吗？我的钱会花在软件浮动在相对简单的 CPU 上的东西上，比如早期的系列 ARM，作为最有可能产生差异的候选者。【参考方案3】：

如果不了解您的平台和编译器，就不可能给出明确的答案。 C 标准没有定义浮点数是如何实现的。

在某些平台上，是的，在其他平台上，不是。

如有疑问，请测量。

【讨论】：

【参考方案4】：

据我所知，f != 0.0f 有时会在您认为应该为假时返回真。

要检查浮点数是否非零，您应该执行Math.abs(f) > EPSILON，其中EPSILON 是您可以容忍的错误。

在此比较中，性能应该不是一个大问题。

【讨论】：

仅供参考，他说这个数字总是 >= 0 所以你不需要腹肌。【参考方案5】：

几乎可以肯定，在您有定量数据表明这是一个问题之前，您不应该进行这种微优化。如果你能证明这是一个问题，你应该弄清楚如何让你的编译器显示它正在生成的机器指令，然后获取该信息并转到你正在使用的处理器的数据手册，并查找所需的时钟周期数对于相同逻辑的替代实现。然后你应该再次测量以确保你看到了好处（如果有的话）。

如果您没有任何数据表明这是性能问题，请坚持使用最清晰、最简单地呈现您正在尝试执行的操作的逻辑的实现。

【讨论】：

以上是关于C/C++：浮点比较速度的主要内容，如果未能解决你的问题，请参考以下文章