此文解释了为何float的范围比int大(同样4字节),但有些int是float无法正确表达的(精度丢失)
java中的float和double的精度问题
1、背景知识
在java中没有细讲,只是讲了float占32位(bit),double占 64位。
对于计算机来说,用位数表示是合适的。但有人喜欢用字节(byte)表示。一个字节占8位。
1 byte = 8 bit.
所以float占4个字节,double占8个字节。
不过我还是喜欢用位数表示。这样更直接,也更容易理解计算机是怎么存储这些类型的。
对于精度和范围,还是参考一下c++吧。
2、存储知识
计算器存储浮点数的方法:(用科学计数法存储)
将要存的数先转换为小数(0.xxxxxx)x10的n次幂的形式进行存储。
例如:
3.1415 将被转换为:0.31415 x 10^1
100000 将被转换为:0.1 x 10^6
首先申明一点,先范围(有效数字位,包括整数位和小数位),再精度。
3、下面切入正题
=====================
在c++中单精度float类型与双精度double类型的问题
【"单精度用float表示,在计算机中使用4位字节(32位bit)来表示,具有7位有效数字"】
float类型存储的时候1个bit是符号位,8个bit是指数位,剩下的23个bit是有效数字位。
2的23次方是8388608,即7位有效数字,精度(10进制)。
一个单精度的浮点数在内存当中占用了32个bit位,按照浮点数的表示标准,最高位表示符号,这32位一部分用来表示阶码,一部分用来表示小数部分。
按照这个表示方法转化成10进制之后,它能表示的最高精度是7位有效数字。
比如
float a=3.14159;a在内存中实际上表示为0.314159乘以10的1次方(0是符号位),而分配给a的存储单元就分为两部分,一部分存0.314159,一部分存指数1,而且也都是转化为2进制来存。
==================
float ,1位符号位, 8位指数位,23位尾数位
double,1位符号位,11位指数位,52位尾数位
float尾数位23位,2^23=8.3E6,7位,所以不同的编译器规定不同,有些是7位,有些8位
double尾数52位,2^52=4.5E15,15位,所以double的有效位数是15位
后记:
数一下有效数字位数(整数位+小数位),7位以内的用float,15位以内的用double
但是还有一点小小的区别:
float f = (float) 62345678.912345; // => 6.234568E7 共 7 位
float f2 = (float) 12345678.912345; // => 1.2345679E7 共 8 位
(精度问题,float精度为7--8位,8位的情况是第一位是1,当是2时进位后面的精度丢失?)