详解浮点数的二进制表示

Posted VoidMe

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了详解浮点数的二进制表示相关的知识,希望对你有一定的参考价值。

1.十进制转二进制方法

     十进制数转换为二进制数   十进制数转换为二进制数时,由于整数和小数的转换方法不同,所以先将十进制数的整数部分和小数部分分别转换后,再加以合并。  

    1.1十进制整数转换为二进制整数  

    十进制整数转换为二进制整数采用"除2取余,逆序排列"法。具体做法是:用2去除十进制整数,可以得到一个商和余数;再用2去除商,又会得到一个商和余数,如此进行,直到商为零时为止,然后把先得到的余数作为二进制数的低位有效位,后得到的余数作为二进制数的高位有效位,依次排列起来。 

    1.2十进制小数转换为二进制小数   

    十进制小数转换成二进制小数采用"乘2取整,顺序排列"法。具体做法是:用2乘十进制小数,可以得到积,将积的整数部分取出,再用2乘余下的小数部分,又得到一个积,再将积的整数部分取出,如此进行,直到积中的小数部分为零,或者达到所要求的精度为止。  然后把取出的整数部分按顺序排列起来,先取的整数作为二进制小数的高位有效位,后取的整数作为低位有效位。

    比如8.25可以表示为1000.01

    

2.浮点数的二进制表示

浮点数分为float和double,分别占4,8个字节,即32,64位. 我仅以32位的float为例,并附带说double.

在IEEE754标准中,规定,float的32位这样分:

 

符号位(S)

1

 

阶码(E)

 8

 

尾数(M)

23

 

 

 

 这里应该注意三点:   A,阶码是用移码表示的,这里会有一个127的偏移量,它的127相当于0,小于127时为负,大于127时为正,比如:10000001表示指数为129-127=2,表示真值为2^2,而01111110则表示2^(-1).

                                     B, 尾数全都是小数点后面的数,

                                     C, 但尾数中省略了一个1,因此尾数全为0时,也是1.0...00;

接下来只要说明几个问题就明白了,以123.456为例,表示为二进制就是:N (2) = 1111011. 01110100101111001 ,这里,会右移6位,得到N (2) = 1.111011 01110100101111001*2^6; 这种形式就可以用于上图中的表示格式了.              

 

 

 符号位(S) 

          0 

 

阶码(E)  00000110

 

尾数(M) 11101101110100101111001

 

注意到,上面的阶码第一位为0表正,尾数比N(2)表示的第一位少了个1,这就是上面说的默认为第一位为1. 由于在将十进制转为二进制的过程中,常常不能正好转得相等, (当然,像4.0这样的就不会有损失,而1.0/3.0这样的必然损失),所以就产生了浮点数的精度问题, 实际上,小数点后的23位二进制数,能影响的十进制数的前8位,这是为什么呢?一般人在这时往往迷迷胡胡了,其实很简单,在上面表示的尾数中,是二进制的,小数点后有23位,最后一位的值为1时,它就是1/2^22=0.000000238实际取的时候肯定是0.0000002,也就是说,对于一个float型的浮点数,其有效的位数是从左到右数7位(包括缺省的1才是7位),当到达上面这个第8位时,就不可靠了,但我们的VC6可以输出最长的1.0/3.0为0.33333333333333331,这主要是编译器的问题了, 而并不是说浮点数小数点后的16位都有效. 如果不信的话,可以去试一下double类型的1.0/3.0, 得到的也将是小数点后17位.   

 

--------------------------------------

将20.163转换成754标准的32位浮点数

1.将十进制数转换成二进制数

十进制浮点数,整数部分转换成二进制,采用除2取余法,将余数从低到高排列,即为整数的二进制数;

小数部分转换成二进制,采用乘2取整法,将取整数顺序排列,即为小数的二进制数。

小数部分乘2直到小数部分为0,或取到想要的位数,或循环出现前。

整数部分

20/2=10    ....  0

10/2=5      ....  0

5/2=2        ....  1

2/2=1        ....  0

1/2=0         ..... 1

小数部分

0.163*2=0.326        0

0.326*2=0.652        0

0.652*2=1.304        1

0.304*2=0.608        0

0.608*2=1.216        1

0.216*2=0.432        0

0.432*2=0.864        0

0.864*2=1.728        1

0.728*2=1.456        1

0.456*2=0.912        0

不要求精度时,通常取到8~10位

20.163=10100.0010100110

2.移动小数点到第1、2位之间,得e的值

10100.0010100110=1.01000010100110 *2的4次方    e=4(小数点移动4位)

3.求出S、E、M的值

S=0,E=4+127=131,M=01000010100110

S由小数点的后一位可以看出,0为正数,1为负数。

0  1000001 01000010100110000000000

IEEE754标准中32位浮点数表示

S         E               M

S是符号位占1位,E是阶码占8位,M是尾数占23位。

 

 

当尾数的值不为0时,尾数的最高有效位应为1,这称为浮点数的规格化表示

这样形式的叫规格化



以上是关于详解浮点数的二进制表示的主要内容,如果未能解决你的问题,请参考以下文章

请问浮点数的尾数最前面的隐藏位是1还是0?

关于IEEE754中的浮点数的阶码的表示问题

某十六进制浮点数A3680000,将其表示成补码 ,字长32位,阶码8位(含1位阶符),尾数24位(含1 位数符),求该浮点数十进制的真值

将分数部分转换为二进制

C51浮点数显示浮点数表示方法

为啥python使用eval函数输出结果有很多尾数