1)浮点存储形式
对于语法等知识一般都是建立在一定的规范之上的,不然不利于技术的兼容统一发展,但是在不同的领域由于有着不同的需求,可能遵循的规范有所差异,对于浮点数的规范目前大部分系统都采用的是IEEE 754标准。我们这里以4字节单精度浮点类型为例子为大家讲解一下浮点数的存储形式:(其他浮点数存储仅仅每部分数据大小不同)

对于浮点数的存储形式可以用2进制科学计数法表示:
(符号:+/-)1.(二进制尾数)*2^(指数=实际指数+偏移量)
对于这几个名词不是特别好解释,结合实际转化过程会更加好理解:(这里以float型浮点数:4.25为例子,如下转化示意图)

对于小数部分的二进制表示采用除二反取的方法获得;
23bit的尾数部分前面0001即为科学二进制的小数点后面部分,其他bit用0填充;
指数部分会添加一个偏移量127,这个仅仅是对于float类型;对于其他浮点类型由于表示的数据范围不同偏移也不同,比如double需要+1023的偏移。
由于我们举例4.25 > 1,那么我们实际指数 > 0;如果我们的浮点是0.025,这个时候实际指数为负数,大家可以尝试编码转化。
2)浮点精度问题
我们通过上面浮点数的存储方式可以知道8bit的指数最大可以表示255,最大值的指数就是255 - 127 = 128,2^128 = 3.402..e+38;(确实非常大!)
如果用我们的4byte无符号整形表示最大数据为2^32,看起来远远小于浮点表示;不过大家是否想过一个问题,根据数据二进制一一对应原则都是4byte的表示方法为什么有这么大差异,难道浮点数凭空创造了更多的数据吗?
非也非也,指数部分代表着浮点数的范围,尾数部分代表着浮点数的精度;我们从尾数的角度来看,浮点的二进制科学计数法小数点前始终是最高位,这也就意味指数越大,尾数部分所表示的数值越大,其精度越差。所以float与uint表示的数据个数都是一样的,整形表示的数据是均匀的,而浮点表示的数据在数值比较小的时候精度比较高,而数值比较大的时候就比较低了,同时也说明浮点表示仅仅是一种近似的表示方法,不能精确的表示数值,所以有时候大家在编程的过程中明明向float类型变量赋值了一个准确的数据,仿真一看数据成了一个近似值。
|