在32位环境下, float占用32位,double占用64位,
目前C/C++编译器标准都遵照IEEE制定的浮点数表示法来进行float,double运算。这种结构是一种科学计数法,用符号、指数和
尾数来表示,底数定为2——即把一个浮点数表示为尾数乘以2的指数次方再添上符号。下面是具体的规格:
符号位 阶码 尾数 长度
float 1 8 23 32
double 1 11 52 64
下面分别举例说明:
将100分别转化为float型和double型的二进制表达。
100=(1+1/2+1/16)*2^6
转为float型为
100为正数,符号位为0,
阶码,一共8位,因为指数可以为负,为了便于计算,规定都先加上127,在这里6+127=133转为二进制为10000101
尾数转为1.1001,因为最高位的1 不写入内存,则尾数转为23位二进制为10010000000000000000000
合在一起就是01000010110010000000000000000000
转为double型为
100为正数,符号位为0,
阶码,一共11位,因为指数可以为负,为了便于计算,规定都先加上1023,在这里6+1023=1029转为二进制为10000000101
尾数转为1.1001,因为最高位的1 不写入内存,则尾数转为52位二进制为1001000000000000000000000000000000000000000000000000
合在一起就是0100000001011001000000000000000000000000000000000000000000000000
将float转为二进制字符串
- //str should have at least 33 byte.
- void floattostr(float* a, char* str){
- unsigned int c;
- c= ((unsigned int*)a)[0];
- for(int i=0;i<32;i++){
- str[31-i]=(char)(c&1)+‘0‘;
- c>>=1;
- }
- str[32] = ‘\0‘;
- }
将double转为二进制字符串
- //str should have at least 64 byte.
- void doubletostr(double* a, char* str){
- long long c;
- c= ((long long*)a)[0];
- for(int i=0;i<64;i++){
- str[63-i]=(char)(c&1)+‘0‘;
- c>>=1;
- }
- str[64] = ‘\0‘;
将32位二进制字符串转为float
- float strtofloat(char * str){
- unsigned int flt = 0;
- for(int i=0;i<31;i++){
- flt += (str[i]-‘0‘);
- flt <<= 1;
- }
- dbl += (str[31]-‘0‘);
- float * ret = (float*)&flt;
- return *ret;
- }
将64位二进制字符串转为double
- double strtodbl(char * str){
- long long dbl = 0;
- for(int i=0;i<63;i++){
- dbl += (str[i]-‘0‘);
- dbl <<= 1;
- }
- dbl +=(str[63]-‘0‘);
- double* db = (double*)&dbl;
- return *db;
- }