打印
[ZLG-ARM]

一个有趣的问题-转

[复制链接]
1088|1
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
billen|  楼主 | 2009-6-4 16:42 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

**出处:http://www.limodev.cn/blog
作者联系方式:李先静 <xianjimli at hotmail dot com>
昨天同事问了我一个问题,有两个循环语句:
for(i = n; i > 0; i–)
{

}
for(i = 0; i < n; i++)
{

}
为什么前者比后者快?
我当时的解释是:
i–操作本身会影响CPSR(当前程序状态寄存器),CPSR常见的标志有N(结果为负), Z(结果为0),C(有进位),O(有溢出)。i > 0,可以直接通过Z标志判断出来。
i++操作也会影响CPSR(当前程序状态寄存器),但只影响O(有溢出)标志,这对于i < n的判断没有任何帮助。所以还需要一条额外的比较指令,也就是说每个循环要多执行一条指令。
(这是五年前tjww告诉我的,当时他在AVR上写一个LCD驱动程序,使用后者LCD会闪烁,使用前者则没有问题。)
为了确认我的理解是正确的,做了个实验:
int loop_dec(int n)
{
    int i = 0;
    int v = 0;

    for(i = n; i > 0; i--)
        v +=i;

    return v;
}

int loop_inc(int n)
{
    int i = 0;
    int v = 0;

    for(i = 0; i < n; i++)
        v +=i;

    return v;
}
用arm-linux-gcc编译,然后反汇编:
i--的循环条件:
  4c:   e51b3014        ldr     r3, [fp, #-20]
  50:   e3530000        cmp     r3, #0  ; 0x0
  54:   cafffff5        bgt     30 

i++的循环条件:
  b8:   e51b3018        ldr     r3, [fp, #-24]
  bc:   e1520003        cmp     r2, r3
  c0:   bafffff4        blt     98 
结果和我想象的并不一样,这是怎么回事呢?我想可能因为没有加优化选项,于是加上-O选项,结果变为:
i--的循环条件:
  14:   e2500001        subs    r0, r0, #1      ; 0x1
  18:   1afffffc        bne     10 

i++的循环条件:
  3c:   e2833001        add     r3, r3, #1      ; 0x1
  40:   e1500003        cmp     r0, r3
  44:   1afffffb        bne     38 
这下没错了,果然少一个cmp指令。
沙发
armpc| | 2009-6-4 17:34 | 只看该作者

确实挺有趣的,好

使用特权

评论回复
发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

37

主题

53

帖子

0

粉丝