将 INT_MAX 转换为浮点数,然后再转换回整数。

Posted

技术标签:

【中文标题】将 INT_MAX 转换为浮点数,然后再转换回整数。【英文标题】:Convert INT_MAX to float and then back to integer. 【发布时间】:2014-06-18 16:53:21 【问题描述】:

在 C 编程中,我发现了一个奇怪的问题,这与我的直觉相反。当我将integer 声明为INT_MAX2147483647,在limits.h 中定义)并隐式将其转换为float 值时,它工作正常,即浮点值与最大整数相同.然后,我将浮点数转换回整数,有趣的事情发生了。新的integer 成为最小整数 (-2147483648)。 源代码如下:

int a = INT_MAX;
float b = a; // b is correct
int a_new = b; // a_new becomes INT_MIN

我不确定当浮点数 b 转换为整数 a_new 时会发生什么。那么,有没有合理的解决方案来找到integerfloat类型之间可以来回切换的最大值?

PS:INT_MAX - 100 的值可以正常工作,但这只是一个任意的解决方法。

【问题讨论】:

浮点的精度有限,所以我不认为这种转换很奇怪。 与您的评论相反,b正确的。如果你仔细看,我想你会发现它实际上是第一次转换后的INT_MAX+1INT_MAX 在您的平台上是 2147483647,不是 2147483648。即,第一次转换是第一次引入结果增量的地方。 See it live 4 字节浮点数使用 23 位存储尾数,使用 9 位存储符号和指数。这意味着无法完全准确地存储最大的 32 位整数。 看起来问题并非在所有平台上都发生:见example here @AurélienGasser 这是一个谬论。我确信编译器默认会优化。禁用优化,然后查看结果。有问题的数字不能完全表示为浮点数,因此无法取回。 【参考方案1】:

此答案假定 float 是 IEEE-754 单精度浮点数,编码为 32 位,int 是 32 位。有关 IEEE-754 的更多信息,请参阅this Wikipedia article。


浮点数只有 24 位精度,而 int 是 32 位。因此,从 0 到 16777215 的 int 值具有浮点数的精确表示,但大于 16777215 的数字不一定具有浮点数的精确表示。以下代码演示了这一事实(在使用 IEEE-754 的系统上)。

for ( int a = 16777210; a < 16777224; a++ )

    float b = a;
    int c = b;
    printf( "a=%d c=%d b=0x%08x\n", a, c, *((int*)&b) );

预期的输出是

a=16777210 c=16777210 b=0x4b7ffffa
a=16777211 c=16777211 b=0x4b7ffffb
a=16777212 c=16777212 b=0x4b7ffffc
a=16777213 c=16777213 b=0x4b7ffffd
a=16777214 c=16777214 b=0x4b7ffffe
a=16777215 c=16777215 b=0x4b7fffff
a=16777216 c=16777216 b=0x4b800000
a=16777217 c=16777216 b=0x4b800000
a=16777218 c=16777218 b=0x4b800001
a=16777219 c=16777220 b=0x4b800002
a=16777220 c=16777220 b=0x4b800002
a=16777221 c=16777220 b=0x4b800002
a=16777222 c=16777222 b=0x4b800003
a=16777223 c=16777224 b=0x4b800004

这里有趣的是 float 值 0x4b800002 用于表示三个 int 值 16777219、16777220 和 16777221,因此将 16777219 转换为 float 并返回到 int 不会保留int 的确切值。


最接近INT_MAX的两个浮点值是2147483520和2147483648,可以用这段代码演示

for ( int a = 2147483520; a < 2147483647; a++ )

    float b = a;
    int c = b;
    printf( "a=%d c=%d b=0x%08x\n", a, c, *((int*)&b) );

输出中有趣的部分是

a=2147483520 c=2147483520 b=0x4effffff
a=2147483521 c=2147483520 b=0x4effffff
...
a=2147483582 c=2147483520 b=0x4effffff
a=2147483583 c=2147483520 b=0x4effffff
a=2147483584 c=-2147483648 b=0x4f000000
a=2147483585 c=-2147483648 b=0x4f000000
...
a=2147483645 c=-2147483648 b=0x4f000000
a=2147483646 c=-2147483648 b=0x4f000000

请注意,从 2147483584 到 2147483647 的所有 32 位 int 值将向上舍入为 float 值 2147483648。将向下舍入的最大 int 值是 2147483583,与 (INT_MAX - 64) 相同在 32 位系统上。

因此,人们可能会得出结论,低于(INT_MAX - 64) 的数字将安全地从int 转换为float 并返回到int。但这仅适用于 int 的大小为 32 位且 float 是根据 IEEE-754 编码的系统。

【讨论】:

以上是关于将 INT_MAX 转换为浮点数,然后再转换回整数。的主要内容,如果未能解决你的问题,请参考以下文章

LLVM 通过将整数转换为浮点数

Python:将 2 个整数转换为浮点数

在 C 中的某些整数上使用位操作中断将整数转换为浮点数

如何在 x86(32 位)程序集中将无符号整数转换为浮点数?

将文本转换为浮点数/整数/日期时,Delphi 消息“您已插入无效值”

C:将最小 32 位整数 (-2147483648) 转换为浮点数给出正数 (2147483648.0)