打印
[应用相关]

汇编程序调用c函数为什么需要设置栈?

[复制链接]
487|14
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
plsbackup|  楼主 | 2024-12-22 15:32 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
首先了解栈的作用。关于这个,详细讲解要很长的篇幅,故此处只做简略介绍。总的来说,它的作用就是:保存现场/上下文,传递参数,保存临时变量

保存现场/上下文
现场/上下文相当于案发现场,总有一些案发现场,要记录下来,否则被别人破坏,便无法恢复。而此处说的现场,是指CPU运行时,用到的一些寄存器,比如r0,r1等,对于这些寄存器的值,如果不保存而直接跳转到子函数中执行,其很可能被破坏,因为其函数执行也要用到这些寄存器。因此,在函数调用之前,应该将这些寄存器等现场暂时保存(入栈push),等调用函数执行完毕后出栈(pop)再恢复现场。这样CPU就可以正确的继续执行了。

保存寄存器的值,一般用push指令,将对应的某些寄存器的值,一个个放到栈中,即所谓的压栈。然后待被调用的子函数执行完毕后再调用pop,把栈中的一个个的值,赋值给对应的那些你刚开始压栈时用到的寄存器,把对应的值从栈中弹出去,即所谓的出栈。

其中保存的寄存器中,也包括lr的值(因为用bl指令进行跳转的话,之前的pc值存在lr中),在子程序执行完毕后,再把栈中的lr值pop出来,赋值给pc,这样就实现了子函数的正确的返回。

传递参数
C语言函数调用时,会传给被调用函数一些参数,对于这些C语言级别参数,被编译器翻译成汇编语言时,要找个地方存放下来,并且让被调用函数能访问,否则没法传递。找个地方存放下来分2种情况。一是,本身传递的参数不多于4个,可以通过寄存器传送。因为在前面的保存现场动作中,已经保存好对应的寄存器的值,此时这些寄存器是空闲的,可以供我们使用存放参数。二是,参数多于4个,寄存器不够用,就得用栈。

临时变量保存在栈中
这些临时变量包括函数的非静态局部变量以及编译器自动生成的其他临时变量。

举例分析C语言函数调用如何使用栈

上面的解释有些抽象,此处再用例子简单说明一下,就容易明白了:
用arm-inux-objdump –d u-boot dump_u-boot.txt得到dump_u-boot.txt文件。该文件是包含了u-boot可执行汇编代码,从中我们可以看到相应C程序对应的汇编代码。

下面贴出两个函数的汇编代码,一个是clock_init,另一个是与clock_init在同一C源文件中的函数CopyCode2Ram:

代码语言:javascript
复制
33d0091c: CopyCode2Ram:
33d0091c: e92d4070  push   {r4, r5, r6, lr}
33d00920: e1a06000  mov r6, r0
33d00924: e1a05001  mov r5, r1
33d00928: e1a04002  mov r4, r2
33d0092c: ebffffef  bl  33d008f0 b BootFrmNORFlash
......
33d00984: ebffff14  bl  33d005dc nand_read_ll
......
33d009a8: e3a00000  mov r0, #0 ; 0x0
33d009ac: e8bd8070  pop {r4, r5, r6, pc}
33d009b0:clock_init:
33d009b0: e3a02313  mov r2, #1275068416   ;0x4c000000
33d009b4: e3a03005  mov r3, #5 ; 0x5
33d009b8: e5823014  str r3,
......
33d009f8: e1a0f00e  mov pc, lr
(1) 先分析clock_init对应的汇编代码,可以看到该函数第一行
:33d009b0: e3a02313 mov r2, #1275068416 ;0x4c000000
没有我们期望的push指令,即没有将一些寄存器的值放入栈。这是因为,clock_init用到的r2,r3等寄存器,和前面调用clock_init前用到的寄存器r0,没有冲突,故此处不用push保存,有个寄存器要注意,r14,即lr,前面调用clock_init时,用的bl指令,所以会自动把跳转时的pc值赋值给lr,所以也不需要push将PC值保存到栈。而clock_init对应的汇编代码最后一行: 33d009f8: e1a0f00e mov pc, lr 就是我们常见的mov pc,lr,把lr值,即之前保存的函数调用时的PC值,赋值给现在的PC,这样便实现了函数的正确返回,即返回到了函数调用时下一个指令的位置。CPU可以继续执行原先函数内剩下的代码。

(2) CopyCode2Ram对应汇编代码第一行:33d0091c: e92d4070 push {r4, r5, r6, lr}
就是我们所期望的,用push保存r4,r5,r6,lr,是因为此函数还包括其他函数调用
:33d0092c: ebffffef bl 33d008f0 b BootFrmNORFlash……
33d00984: ebffff14 bl 33d005dc nand_read_ll
……
也用到bl指令,会改变我们最开始进入clock_init时的lr值,所以也要push暂时保存起来。

而对应地,CopyCode2Ram最后一行:33d009ac: e8bd8070 pop {r4, r5, r6,pc}是把之前push的值给pop出来,还给对应的寄存器,其中最后一个是将开始push的lr的值pop出来赋给PC,实现了函数的返回。另外我们注意到,CopyCode2Ram的倒数第二行:33d009a8: e3a00000 movr0, #0 ; 0x0 是把0赋值给r0寄存器,就是我们说的返回值的传递,此处的返回值为0,也对应着C代码中的“ return 0”。

当然也可以用其他暂时空闲没有用到的寄存器来传递返回值。

对于使用哪个寄存器来传递返回值,是根据ARM的APCS寄存器的使用约定而设计的,最好按照其约定的来处理,不要随便改变它。这样程序将更加规范。

使用特权

评论回复
沙发
Clyde011| | 2024-12-23 07:57 | 只看该作者
楼主写得很详细,我补充一点,其实栈的使用和函数调用的复杂度成正比,简单函数可能连栈都不用。

使用特权

评论回复
板凳
公羊子丹| | 2024-12-23 07:57 | 只看该作者
看了你的例子,发现栈确实挺重要的,不然跳转来跳转去寄存器都乱套了。

使用特权

评论回复
地板
周半梅| | 2024-12-23 07:58 | 只看该作者
ARM的APCS规范真的很重要,遵循它能省掉很多莫名其妙的错误,特别是多模块调用的时候。

使用特权

评论回复
5
帛灿灿| | 2024-12-23 07:58 | 只看该作者
楼主提到的保存寄存器的部分,我觉得很关键,不保存的话上下文信息丢失,问题很难排查。

使用特权

评论回复
6
童雨竹| | 2024-12-23 07:58 | 只看该作者
其实现在写C程序,编译器已经帮我们处理好这些栈的细节了,只有写汇编时才需要特别注意。

使用特权

评论回复
7
万图| | 2024-12-23 07:59 | 只看该作者
学到了一点新知识!之前一直以为栈只是用来存局部变量的,没想到还涉及到这么多寄存器的保存和恢复。

使用特权

评论回复
8
Wordsworth| | 2024-12-23 07:59 | 只看该作者
ARM架构真是越看越有趣,尤其是栈的机制,完全是为效率和灵活性设计的,挺佩服的。

使用特权

评论回复
9
Pulitzer| | 2024-12-23 07:59 | 只看该作者
看到例子里通过栈实现函数返回,才明白pop到PC是怎么工作的,ARM的指令集设计得真巧妙。

使用特权

评论回复
10
Bblythe| | 2024-12-23 07:59 | 只看该作者
以前遇到过一次返回值传递错误的问题,后来才发现是栈没用对,看来还是要熟悉APCS的规则。

使用特权

评论回复
11
Uriah| | 2024-12-23 08:00 | 只看该作者
楼主的讲解让我明白了栈的三个作用,通俗易懂,尤其是“案发现场”的比喻太形象了!

使用特权

评论回复
12
和下土| | 2024-12-30 23:36 | 只看该作者
函数调用结束后,通过栈恢复这些寄存器的值,从而保证了程序可以正确恢复执行。

使用特权

评论回复
13
和下土| | 2024-12-30 23:36 | 只看该作者
假设有一个函数调用过程,CPU 会将当前的寄存器包括 pc推入栈中,跳转到被调用函数。被调用函数执行完后,再通过弹栈操作恢复原先的寄存器值并返回。

使用特权

评论回复
发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

31

主题

3235

帖子

0

粉丝