<br />**出处:http://www.limodev.cn/blog<br />作者联系方式:李先静 <xianjimli at hotmail dot com><br />昨天同事问了我一个问题,有两个循环语句:<br />for(i = n; i > 0; i–)<br />{<br />…<br />}<br />for(i = 0; i < n; i++)<br />{<br />…<br />}<br />为什么前者比后者快?<br />我当时的解释是:<br />i–操作本身会影响CPSR(当前程序状态寄存器),CPSR常见的标志有N(结果为负), Z(结果为0),C(有进位),O(有溢出)。i > 0,可以直接通过Z标志判断出来。<br />i++操作也会影响CPSR(当前程序状态寄存器),但只影响O(有溢出)标志,这对于i < n的判断没有任何帮助。所以还需要一条额外的比较指令,也就是说每个循环要多执行一条指令。<br />(这是五年前tjww告诉我的,当时他在AVR上写一个LCD驱动程序,使用后者LCD会闪烁,使用前者则没有问题。)<br />为了确认我的理解是正确的,做了个实验:<br />int loop_dec(int n)<br />{<br /> int i = 0;<br /> int v = 0;<br /><br /> for(i = n; i > 0; i--)<br /> v +=i;<br /><br /> return v;<br />}<br /><br />int loop_inc(int n)<br />{<br /> int i = 0;<br /> int v = 0;<br /><br /> for(i = 0; i < n; i++)<br /> v +=i;<br /><br /> return v;<br />}<br />用arm-linux-gcc编译,然后反汇编:<br />i--的循环条件:<br /> 4c: e51b3014 ldr r3, [fp, #-20]<br /> 50: e3530000 cmp r3, #0 ; 0x0<br /> 54: cafffff5 bgt 30 <br /><br />i++的循环条件:<br /> b8: e51b3018 ldr r3, [fp, #-24]<br /> bc: e1520003 cmp r2, r3<br /> c0: bafffff4 blt 98 <br />结果和我想象的并不一样,这是怎么回事呢?我想可能因为没有加优化选项,于是加上-O选项,结果变为:<br />i--的循环条件:<br /> 14: e2500001 subs r0, r0, #1 ; 0x1<br /> 18: 1afffffc bne 10 <br /><br />i++的循环条件:<br /> 3c: e2833001 add r3, r3, #1 ; 0x1<br /> 40: e1500003 cmp r0, r3<br /> 44: 1afffffb bne 38 <br />这下没错了,果然少一个cmp指令。<br /> |