[牛人杂谈] 浮点数与字节数据转换详解

[复制链接]
2382|12
 楼主| 小明的同学 发表于 2019-2-24 09:23 | 显示全部楼层 |阅读模式
一、浮点数在内存中的表示
对于浮点类型的数据采用单精度类型(float)和双精度类型(double)来存储,float数据占用32bit,double数据占用64bit。不论是float还是double在存储方式上都是遵从IEEE的规范的,float遵从的是IEEE R32.24 ,而double 遵从的是R64.53。
无论是单精度还是双精度在存储中都分为三个部分:
    1. 符号位(Sign)            :      0代表正,1代表为负
    2. 指数位(Exponent):      用于存储科学计数法中的指数数据,并且采用移位存储
    3. 尾数部分(Mantissa):  尾数部分
其中float的存储方式如下图所示:
386115c71f1e50d3c1.png
而双精度的存储方式为:
452365c71f20037f65.png

R32.24和R64.53的存储方式都是用科学计数法来存储数据的。因此本文仅仅针对单精度浮点数进行分析,双精度同理可得。


399395c71f17ac5bd9.png
418705c71f18819569.png
 楼主| 小明的同学 发表于 2019-2-24 09:24 | 显示全部楼层
二、单精度浮点数的存储实现
单精度浮点数存储表示
首先来看单精度浮点型float。float占用4字节空间,也就是32位。从左向右数,第1位是符号位(0代表正数,1代表负数),接着是8位指数位,剩下的23位是数据位(实际上有效数字位是24位,因为第一位有效数字总是“1”,不必存储)。如下所示

31 30    23 22                    0
S  EEEEEEEE DDDDDDDDDDDDDDDDDDDDDDD
在这存储实数的四个字节中,将最高地址字节的最高位编号为31,最低地址字节的最低位编号为0,则实数各个部分在这32个二进制位中的分布是这样的:31位是实数符号位,30位是指数符号位,29—23是指数位,22—0位是有效数字位(注意第一位有效数字是不出现在内存中的,它总是“1” )。

单精度浮点数转换步骤
将一个float型转化为内存存储格式的步骤为:
(1)先将这个实数的绝对值化为二进制格式。
(2)将这个二进制格式实数的小数点左移或右移n位,直到小数点移动到第一个有效数字的右边。
(3)从小数点右边第一位开始数出二十三位数字放入第22到第0位。
(4)如果实数是正的,则在第31位放入“0”,否则放入“1”。
(5)如果n是左移得到的,说明指数是正的,第30位放入“1”。如果n是右移得到的或n=0,则第30位放入“0”。
(6)如果n是左移得到的,则将n减去1后化为二进制,并在左边加“0”补足七位,放入第29到第23位。如果n是右移得到的或n=0,则将n化为二进制后在左边加“0”补足七位,再各位求反,再放入第29到第23位。

以12.5为例进行说明:
(1)12.5实数绝对值二进制形式是 1100.1。
(2)向左移动3位,转换为科学计数法是1.1001E3,此时n=3。
(3)将小数点右边第一位开始输出23位放入第22到第0位,即数据位D为:

    DDDDDDDDDDDDDDDDDDDDDDD
    10010000000000000000000
1
2
(4)12.5为整数,因此第31位放入“0”,即S=0。
(5)n是左移得到的,指数为正,则第30位放入“1”。
(6) n减去1为2,转换为二进制,左边加“0”补足七位,放入第29到第23位。
此时,由(5)(6)得指数位E为:

    EEEEEEEE
    10000010
1
2
综上,得到12.5的二进制存储为:

31 30    23   22                    0
S  EEEEEEEE   DDDDDDDDDDDDDDDDDDDDDDD
0  10000010   10010000000000000000000

 楼主| 小明的同学 发表于 2019-2-24 09:25 | 显示全部楼层
验证 597045c71f256c891b.png
补充:
因为浮点数1.0是一个特殊值,这里特地在这里将解析流程从网上摘抄过来分析:
将实数1.0化为C++的float格式。
(1)将1.0化为二进制后是1.00000000000000000000000。
(2)这时不用移动小数点了,这就是我们在转化方法里说的n=0的情况。
(3)将小数点右边的二十三位有效数字00000000000000000000000放入第22到第0位。
(4)因为1.0是正的,所以在第31位里放入“0”。
(5)因为n=0,所以在第30位里放入“0”。
(6)因为n=0,所以将0补足七位得到0000000,各位求反得到1111111,放入第29到第23位。
完毕。所以实数1.0用C++的float格式表示是:

31 30    23   22                    0
S  EEEEEEEE   DDDDDDDDDDDDDDDDDDDDDDD
0  01111111   00000000000000000000000
1
2
3
其中最左边一位是第31位,最右边一位是第0位。


 楼主| 小明的同学 发表于 2019-2-24 09:25 | 显示全部楼层
三、存储字节数据转换为单精度浮点数
转换为单精度浮点数步骤
将一个内存存储的float二进制格式转化为十进制的步骤:
(1)将第22位到第0位的二进制数写出来,在最左边补一位“1”,得到二十四位有效数字。将小数点点在最左边那个“1”的右边。
(2)取出第29到第23位所表示的值n。当30位是“0”时将n各位求反。当30位是“1”时将n增1。
(3)将小数点左移n位(当30位是“0”时)或右移n位(当30位是“1”时),得到一个二进制表示的实数。
(4)将这个二进制实数化为十进制,并根据第31位是“0”还是“1”加上正号或负号即可。

同样以12.5的二进制为例:
(1) 在最左边补一位“1”,得到二十四位有效数字。将小数点点在最左边那个“1”右边。

    1.10010000000000000000000

(2) 取出第29到第23位所表示的值n。由于30位是“1”,所有将n增1为0000011(即n=3)
(3) 由于30位是“1”,将小数点右移3位,得到二进制实数为:

    1100. 10000000000000000000

(4) 转换为十进制数,由于31位为“0”,所有结果为12.5
 楼主| 小明的同学 发表于 2019-2-24 09:26 | 显示全部楼层
四、代码实现
  1. #include <stdio.h>


  2. /*
  3. *function:ftoc(float fvalue,unsigned char*arr)
  4. *decription:  浮点数转化成四个字节
  5. *input: 浮点数
  6. *output: 4个字节的字节数组
  7. */
  8. //例如12.5--0x41 48 00 00;转换完之后,arr[0]-00,arr[1]-00,arr[2]-48,arr[3]-41
  9. void ftoc(float fvalue,unsigned char*arr)
  10. {
  11.     unsigned char  *pf;
  12.     unsigned char *px;
  13.     unsigned char i;   //计数器
  14.     pf =(unsigned char *)&fvalue;            /*unsigned char型指针取得浮点数的首地址*/  
  15.     px = arr;                               /*字符数组arr准备存储浮点数的四个字节,px指针指向字节数组arr*/

  16.     for(i=0;i<4;i++)
  17.     {
  18.         *(px+i)=*(pf+i);     /*使用unsigned char型指针从低地址一个字节一个字节取出*/
  19.     }
  20. }

  21. /*
  22. *function:float ByteToFloat(unsigned char* byteArray)
  23. *decription:  将字节型转化成32bits浮点型
  24. *input:       长度为4的字节数组
  25. *output:
  26. */  
  27. float ByteToFloat(unsigned char* byteArray)  
  28. {  
  29.     return *((float*)byteArray);  
  30. }  

  31. int main(int argc, char *argv[])
  32. {

  33.     int i;
  34.     unsigned char byteArray[4];
  35.     ftoc(12.5,byteArray);

  36.     for(i=0;i<4;i++)
  37.         printf("%x  ",byteArray[i]);

  38.     float x=0;
  39.     x = ByteToFloat(byteArray);
  40.     printf("\n%f  ",x);


  41.     return 0;
  42. }


 楼主| 小明的同学 发表于 2019-2-24 09:28 | 显示全部楼层
大家可以讨论讨论,上面是网上找的。
xinpian101 发表于 2019-2-24 12:12 | 显示全部楼层
这种操作一般不要用,确实没有实际意义,还是提前规划好,用什么数据,就创建什么变量。
玛尼玛尼哄 发表于 2019-2-24 17:27 | 显示全部楼层
原来如此,之前没有了解过,另外问一下,浮点数有没有无符号概念。
zhuotuzi 发表于 2019-2-25 10:49 来自手机 | 显示全部楼层
没试过这种转换。
zhuomuniao110 发表于 2019-2-25 22:32 | 显示全部楼层
不建议大家这么使用。
gaoyang9992006 发表于 2019-2-26 20:58 | 显示全部楼层
一般都是同类的数之间转换,而文本转数字这种很少用。特别是多个文本转一个数。
gaoyang9992006 发表于 2019-2-26 20:59 | 显示全部楼层
这其中牵扯到数据存储的结构。因此你可以先定义一个数字,然后看看它相当于几个字节。
 楼主| 小明的同学 发表于 2019-3-3 15:20 | 显示全部楼层
多谢楼上的参与讨论。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

159

主题

1640

帖子

2

粉丝
快速回复 在线客服 返回列表 返回顶部