java 浮点数表示法

Posted zhangxuezhi

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java 浮点数表示法相关的知识,希望对你有一定的参考价值。

 

这个要从Double类的一个方法说起:Double.doubleToLongBits(double value),根据官方文档,其部分注释内容如下:

public static long doubleToLongBits(double value)
Returns a representation of the specified floating-point value according to the IEEE 754 floating-point "double format" bit layout.

Bit 63 (the bit that is selected by the mask 0x8000000000000000L) represents the sign of the floating-point number. Bits 62-52 (the bits that are selected by the mask 0x7ff0000000000000L) represent the exponent. Bits 51-0 (the bits that are selected by the mask 0x000fffffffffffffL) represent the significand (sometimes called the mantissa) of the floating-point number.

个人翻译一下:

根据IEEE 754浮点“double格式” 比特位的布局,返回一个浮点值。

bit63表示符号位,bits62-52表示指数域,bits51-0表示有效数字(尾数域)

关于 IEEE 754,可以参考该博客:https://blog.csdn.net/m0_37972557/article/details/84594879

 

现在做如下测试:

System.out.println(Double.doubleToLongBits(0.75));

System.out.println(Double.doubleToLongBits(0.5));

结果

0.75

十进制值:4604930618986332160

十六进制值:3FE8 0000 0000 0000

0.5

十进制值:4602678819172646912

十六进制值:3FE0 0000 0000 0000

 

对于0.75的十六进制,其符号位为0,指数域为3FE,尾数域为 8 0000 0000 0000

计算过程:

  指数域0x3FE的十进制为:1022,而指数域的偏移码是:1023,因此实际的指数值为:1022 -1023 = -1

  对于尾数域,后面的一堆0不看,最左边的值就是1,则表示其有效值为0.1,而尾数域的正规表示形式为:1.xxx(最左边的1在转换为浮点表示时会自动省略),因此尾数的实际值的计算方法是其有效值加1,即:1 + 0.1 = 1.1,该结果是二进制值

  通过上面两步,拿到了指数为-1, 位数为1.1(二进制)

  结果计算3种方法,结果一致,都是0.75

    小数点移位法:指数域为-1,表示尾数1.1的小数点往左移动一位,得出结果: 0.11,转换成十进制就是:0.5 + 0.25 = 0.75

    二进制相乘:指数域为-1,表示实际的指数结果为:2-1,即0.5,二进制表示为0.1,计算:1.1 * 0.1 = 0.11,十进制即0.75

    十进制相乘:指数域为-1,表示实际的指数结果为:2-1,即0.5,而1.1的十进制表示为1.5,计算:1.5 * 0.5 = 0.75

同理:

  0.5的十六进制中的有效数值3FE0,算出来指数域是-1,尾数域是0,结果为:0.1,转为十进制:0.5

 

可以类推:

  0.25的浮点表示为:0x3FD0 0000 0000 0000

  -0.25的浮点表示为:0xBFD0 0000 0000 0000

  0.625的浮点表示为:0x3FE4 0000 0000 0000

  1.5的浮点表示为:0x3FF8 0000 0000 0000

  -3.625的浮点表示为:0xC00D 0000 0000 0000

 

再来看下最开始提到的方法的源码:

public static long doubleToLongBits(double value) {
        long result = doubleToRawLongBits(value);
        // Check for NaN based on values of bit fields, maximum
        // exponent and nonzero significand.
        if ( ((result & DoubleConsts.EXP_BIT_MASK) ==
              DoubleConsts.EXP_BIT_MASK) &&
             (result & DoubleConsts.SIGNIF_BIT_MASK) != 0L)
            result = 0x7ff8000000000000L;
        return result;
    }

public static native long doubleToRawLongBits(double value);

该方法的核心其所调用的native方法,但是还额外处理了一类特殊值:当指数域的值达到1024,即超出规定的1023值,并且尾数域不为0时,此时会返回一个固定值。在IEEE 754中,这样的值是NaN,即not  a number,不是一个数。

除此之外,IEEE 754还规定了另外两个特殊值:正无穷和负无穷。对应的形式:指数域为1024,尾数域为0,符号位为正则正无穷,为负则负无穷。

 

除此之外,Double类还提供一个逆过程的方法如下,可以传入浮点表示法的值(8个字节,所以要用long类型接收),然后返回实际的double值

public static native double longBitsToDouble(long bits);

这也是一个native方法,不知道是C++支持还是操作系统支持的这个方法。

 

因为双精度浮点表示的指数最大值是1023,因此其可表示的最大值为:21023 * 0x1.FFFFFFFFFFFFF(13个F),约等于:1.7976931348623157e+308

在jdk1.8的源码中,其表示如下:

public static final double MAX_VALUE = 0x1.fffffffffffffP+1023;

以上是关于java 浮点数表示法的主要内容,如果未能解决你的问题,请参考以下文章

java 浮点数表示法

java 浮点数指数表示法

OpenGL:为啥我不能将单个浮点数从顶点着色器传递到片段着色器?

第04部分:浮点数类型

4-浮点数运算

字节数组byte[]和整型,浮点型数据的转换——Java代码