java中的float和double的精度问题

Posted 2020-10-20 风沙星辰

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了java中的float和double的精度问题相关的知识，希望对你有一定的参考价值。

此文解释了为何float的范围比int大（同样4字节），但有些int是float无法正确表达的（精度丢失）

java中的float和double的精度问题

1、背景知识
在java中没有细讲，只是讲了float占32位（bit），double占 64位。
对于计算机来说，用位数表示是合适的。但有人喜欢用字节(byte)表示。一个字节占8位。
1 byte = 8 bit.
所以float占4个字节，double占8个字节。
不过我还是喜欢用位数表示。这样更直接，也更容易理解计算机是怎么存储这些类型的。

对于精度和范围，还是参考一下c++吧。

2、存储知识
计算器存储浮点数的方法：（用科学计数法存储）
将要存的数先转换为小数（0.xxxxxx）x10的n次幂的形式进行存储。
例如：
3.1415 将被转换为：0.31415 x 10^1
100000 将被转换为：0.1 x 10^6

首先申明一点，先范围（有效数字位，包括整数位和小数位），再精度。

3、下面切入正题
=====================
在c++中单精度float类型与双精度double类型的问题

【"单精度用float表示，在计算机中使用4位字节（32位bit）来表示，具有7位有效数字"】

float类型存储的时候1个bit是符号位，8个bit是指数位，剩下的23个bit是有效数字位。
2的23次方是8388608，即7位有效数字，精度（10进制）。

一个单精度的浮点数在内存当中占用了32个bit位，按照浮点数的表示标准，最高位表示符号，这32位一部分用来表示阶码，一部分用来表示小数部分。
按照这个表示方法转化成10进制之后，它能表示的最高精度是7位有效数字。

比如
float a=3.14159;a在内存中实际上表示为0.314159乘以10的1次方（0是符号位），而分配给a的存储单元就分为两部分，一部分存0.314159，一部分存指数1，而且也都是转化为2进制来存。

==================
float ，1位符号位， 8位指数位，23位尾数位
double，1位符号位，11位指数位，52位尾数位

float尾数位23位，2^23=8.3E6，7位，所以不同的编译器规定不同，有些是7位，有些8位
double尾数52位，2^52=4.5E15，15位，所以double的有效位数是15位

后记：
数一下有效数字位数（整数位+小数位），7位以内的用float，15位以内的用double
但是还有一点小小的区别：
float f = (float) 62345678.912345; // => 6.234568E7 共 7 位
float f2 = (float) 12345678.912345; // => 1.2345679E7 共 8 位

(精度问题，float精度为7--8位，8位的情况是第一位是1，当是2时进位后面的精度丢失?)

以上是关于java中的float和double的精度问题的主要内容，如果未能解决你的问题，请参考以下文章