慎用 maxrregcount
Posted 杏子肥
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了慎用 maxrregcount相关的知识,希望对你有一定的参考价值。
需要编译一个 *.cubin 文件。
在编译时使用--ptxas-option=v参数,显示register使用的个数是36。于是,在编译时使用maxrregcount=32。从而,register的使用个数是32,使用了“8 bytes stack frame, 12 bytes spill stores, 28 bytes spill loads”
nvcc -cubin -m64 -arch sm_35 *.cu --use_fast_math --maxrregcount=32 --ptxas-options=-v -O3 -o *.cubin
但是,经过多次测试,发现浮点计算结果不一样(int计算结果没有测试)。
因此,发现了这个bug:maxrregcount可能导致最终结果不同。
搜了一下,其他人也遇到了这个问题。有一个解释如下:
“Operation order may change with register optimization. Since fp arithmetic is not associative due to finite precision, this may affect the result.”
以上是关于慎用 maxrregcount的主要内容,如果未能解决你的问题,请参考以下文章
编写高质量代码改善C#程序的157个建议——建议67:慎用自定义异常