打印
[技术问答]

函数调用过程栈帧变化详解

[复制链接]
773|2
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
1988020566|  楼主 | 2024-7-20 20:34 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
函数调用另一个词语表示叫作过程。一个过程调用包括将数据(以过程参数和返回值的形式)和控制从代码的一部分传递到另一部分。另外,它还必须在进入时为过程的局部变量分配空间,并在退出时释放这些空间。

大多数机器,包括IA32,只提供转移控制到过程和从过程中转移出控制这种简单的指令。数据传递、局部变量的分配和释放通过操纵程序栈来实现。

在了解本文章之前,您需要先对程序的进程空间有所了解,即对进程如何使用内存?如果你知道这些,下面的内 容将是很easy的事情了。为了您的回顾还是将简单的分布图贴出来,便于您的回顾。

我们先来了解一个概念,栈帧(stack frame),机器用栈来传递过程参数,存储返回信息,保存寄存器用于以后恢复,以及本地存储。为单个过程(函数调用)分配的那部分栈称为栈帧。栈帧其实 是两个指针寄存器,寄存器%ebp为帧指针(指向该栈帧的最底部),而寄存器%esp为栈指针(指向该栈帧的最顶部),当程序运行时,栈指针可以移动(大多数的信息的访问都是通过帧指针的,换句话说,就是如果该栈存在,%ebp帧指针是不移动的,访问栈里面的元素可以用-4(%ebp)或者8(%ebp)访问%ebp指针下面或者上面的元素)。总之简单 一句话,栈帧的主要作用是用来控制和保存一个过程的所有信息的。栈帧结构如下所示:


此处注意:这里面有一个错误,即:“保存的寄存器、局部变量和临时值”处应该是ebp-4。
栈是从高地址向低地址存储。所以越是低的地址,越是靠后入栈。
如果你已经对这个图已经非常了解了,那么就没有必要再看下去了。因为下面的内容都是对这幅图的讲解。
  假设过程P(调用者)调用过程Q(被调用者),则Q的参数放在P的栈帧中。另外,当P调用Q时,P中的返回地址被压入栈中,形成P的栈帧的末尾 (返回地址就是当程序从Q返回时应该继续执行的地方)。Q的栈帧从保存的帧指针的值开始,后面到新的栈指针之间就是该过程的部分了。
  过程实例讲解:
下面以这个程序为例进行简要说明函数调用的基本过程。


int swap_add(int* xp,int* yp) {    int x = *xp;    int y = *yp;    *xp = y;    *yp = x;    return x+y;}int caller(){    int arg1 = 534;    int arg2 = 1057;    int sum = swap_add(&arg1,&arg2);    int diff = arg1 - arg2;        return sum * diff;}



经过汇编之后caller部分的代码如下:

caller:    pushl %ebp   //保存%ebp     movl %esp,%ebp    //设置新的帧指针为旧的栈指针    subl $24,%esp  //分配24子节的栈空间    movl $534,-4(%ebp) //设置arg1=534    movl $1057,-8(%ebp) //设置arg2=1057    leal -8(%ebp),%eax //计算&arg2    movl %eax,4(%esp) //将&arg2存入栈中    leal -4(%ebp),%eax //计算&arg1    movl %eax,(%esp) //将&arg1存入栈中    call swap_add //调用swap_add-------------------》过程调用


这段代码先保存了%ebp的一个副本,将新的过程(该函数的ebp)的ebp设置为栈帧的开始位置。然后将栈指针减去24,从而在栈上分配了24字 节的空间(你应该思考一下为什么是24字节),然后是初始化两个局部变量,计算两个局部变量的地址并存入栈中,形成了函数swap_add的参数。将这些 参数存储到相对于栈指针偏移量为0和+4的地方,留待稍后的swap_add调用访问。然后调用swap_add.
接下的代码是swap_add的函数部分:


swap_add:    pushl %ebp //save old %ebp    movl %esp,%ebp  //set %ebp as frame pointer    pushl %ebx     //save %ebx         movl 8(%ebp),%edx   //Get xp    movl 12(%ebp),%ecx   //Get yp    movl (%edx),%ebx   //Get x    movl (%ecx),%eax    //Get u    movl %eax,(%edx)    //Store y as xp    movl %ebx,(%ecx)      //Sotre x as yp    addl %ebx,%eax         //return value = x + y         popl %ebx        //restore  %ebx    popl %ebp        //restore %ebp    ret        //从过程调用中返回, 将控制转移回caller

代码分为3部分 建立部分:初始化栈帧;主体部分:执行过程的实体计算;结束部分:回复栈帧的状态,以及过程返回。这一部分的代码比较简单,就不在一一介绍,根据以上的3 部分,划分的已经很清晰了。(说明一点程序在执行到swap_add的代码之前,也就是在执行call语句已经把返回地址压入栈中)值得注意的是最后一部 分的popl %ebx   popl %ebp。它的作用是恢复了之前存储的栈帧指针的值,也就是调用程序的原始栈帧指针。从而程序就可以得到返回(有些细心的人会问那返回值咋么办?呵呵,返 回值是存入了%eax中,在接下来的调用程序caller中直接访问该寄存器就可以了)。

正如前面所讲的那样,栈向低地址方向增长,而栈指针%esp指向栈顶元素,可以利用pushl将数据存入栈中并利用popl指令从栈中取出。将栈指针的值减小适当的值可以分配没有指定初始值的数据的空间,例如:subl $24,%esp。类似的,通过增加栈指针来释放空间。
下面就是返回之后继续执行的部分代码了:


movl -4(%ebp),%edxsubl -8(%ebp),%edximull %edx,%eax   //为了计算diff, leave          //为返回准备栈,GCC 产生的代码有时候会使用leave指令来释放栈帧,
         //而有时会使用一个或者两个popl指令。两个方法都可行。ret             //从过程调用中返回

为了计算diff,从栈中取出arg1,和arg2的值,并将寄存器%eax当做swap_add的返回值。
整个过程的栈变化如下所示:



使用特权

评论回复
沙发
734774645| | 2024-7-23 23:26 | 只看该作者
这个过程比较难懂。

使用特权

评论回复
板凳
guijial511| | 2024-7-24 08:08 | 只看该作者
程序运行中的堆和栈理解清楚了

使用特权

评论回复
发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

398

主题

10568

帖子

6

粉丝