嵌入式之c内存管理浅析
朱有鹏
1、内存管理之栈
1.1、栈的应用举例:局部变量、函数调用
C语言中的局部变量是用栈来实现的。
我们在C中定义一个局部变量时(int a),编译器会在栈中分配一段空间(4字节)给这个局部变量用,这个过程是分配时栈顶指针会移动出4个字节空间给局部变量a用的意思就是,将这4字节的栈内存的内存地址和我们定义的局部变量名a给关联起来,对应的栈操作为入栈,就是将数据存入变量a中。需要知道的是注意,这里栈指针的移动和内存分配是自动完成的,不需要我们参与。
然后等我们函数退出的时候,局部变量要灭亡。对应的操作是弹栈(出栈)。出栈时也是栈顶指针移动将栈空间中与a关联的那4个字节空间释放,这个动作也是自动的,不需要人为干预,所以我们在写代码的时候,一定不要从被调函数返回一个局部变量的地址给主调函数,因为在函数执行完后局部变量就释放了,这个地址里面的内容有可能被新的内容填充,这时如果你在主调函数里面使用它,就很有可能造成数据错误。
栈除了保存局部变量,栈对于函数调用来说也是至关重要的,栈保存着函数调用所需的所有维护信息。我们都知道,函数调用时,程序跳到被调函数内部,执行完后返回到当前位置接着执行。这就好比你去一个陌生地方探险,我们的目的是去寻求刺激,但是我们最后还是希望可以平安回家。在旅行前就必须做一些准备(比如多带水,带指南针等等)。
我们的函数在调用时,跳到被调函数之前也是要做诸多准备的。对于函数来说,最起码它要找到回家的路,也就是被调函数的下一行代码的地址(为返回做准备),以及当前相关的局部变量值,寄存器的值等等重要信息。之所以保存这些信息是怕在被调函数运行时,里面也会用到和主调函数使用一样的寄存器。而造成主调函数正在使用的寄存器数据破坏,在函数返回时,堆栈里面的数据弹出,即使寄存器被用过也没关系,弹出数据会使寄存器里面的值覆盖为调用以前,从而复原调用以前的现场。这些值保存在哪里呢?就保存在堆栈里。在函数调用时,将这些东西压入堆栈,在被调函数执行完,堆栈再弹出这些值。
栈的优点:以栈方式管理内存,好处是方便,分配和最后回收都不用程序员操心,C语言自动完成。
分析一个细节:C语言中,定义局部变量时如果未初始化,则值是随机的,为什么?
定义局部变量,其实就是在栈中通过移动栈指针来给程序提供一个内存空间和这个局部变量名绑定。因为这段内存空间在栈上,而栈内存是反复使用的(脏的,上次用完没清零的),所以说使用栈来实现的局部变量定义时如果不初始化,里面的值就是一个垃圾值。由此我们扩展一下,其实不仅仅是局部变量,所有的变量在定义时只是在内存中分配一块空间,并没有对这块空间进行任何的初始化。如果这块内存以前被用过,里面的数据还在,但对于我们来说是没有任何意义的垃圾值,而且有时候会因为这些数据,对我们的编程造成错误。所以我们一定要初始化变量,用有用的数据覆盖掉以前的数据。可能你会疑问,之前使用的内存空间已经被操作系统回收了,那里面为什么还有数据,这是因为操作系统仅仅只是释放了这些内存,告诉其它程序可以用了,并不会删除里面的数据。
(这句话去掉)不知道你的答案是什么,正确答案是1,以前的解释是调用的子函数里面的变量在运行完就会释放,所以不会保存。
那么,我们如何实现局部变量的初始化,C语言又会做些什么手脚呢?
C语言是通过一个小手段来实现局部变量的初始化的。
int a = 15; // 局部变量定义时初始化
C语言编译器会自动把这行转成:
int a; // 局部变量定义
a = 15; // 普通的赋值语句
1.2、栈的约束(预定栈大小不灵活,怕溢出)
首先,栈是有大小的。所以栈内存大小不好设置。如果太小怕溢出,太大怕浪费内存。(这个缺点有点像数组),其次,栈的溢出危害很大,一定要避免。所以我们在C语言中定义局部变量时不能定义太多或者太大(譬如不能定义局部变量时 int a[10000]; 使用递归来解决问题时一定要注意递归收敛)。
2、内存管理之堆
2.1、什么是堆
堆(heap)也是一种动态内存管理方式。内存管理对操作系统来说是一件非常复杂的事情,因为首先内存容量很大,其次内存需求在时间和大小块上没有规律(操作系统上运行着的几十、几百、几千个进程随时都会申请或者释放内存,申请或者释放的内存块大小随意)。
堆这种内存管理方式特点就是自由(随时申请、释放;大小块随意)。我们前面就讲过这俩个API(malloc和free)。那时候我们只是讲了用这俩个接口我们可以申请和释放内存,但并没有说是从什么地方申请,以及通过什么申请。其实它们申请释放的内存是来源于堆内存。
的,然后向使用者(用户进程)提供API(malloc和free)来使用堆内存,我们什么时候使用堆内存?需要内存容量比较大时,需要反复使用及释放时(动态特性),很多数据结构(譬如链表)的实现都要使用堆内存。
2.2、堆管理内存的特点(大块内存、手工分配&使用&释放)
特点一:容量不限,动态分配。(常规使用的需求容量都能满足。)当然也并不是完全不限,因为它毕竟建立在内存的基础上,所以在申请堆内存的时候一定要注意malloc函数的返回值,如果返回值是NULL,就是申请空间失败。而所谓动态就是指程序在运行中取得内存空间,而不是编译时就确定好固定大小的内存空间。
特点二:申请和释放都需要手工进行,手工进行的含义就是需要程序员写代码明确进行申请(malloc)及释放(free)。如果程序员申请内存但使用后并不释放,这段内存就丢失了(在堆管理器的记录中,这段内存仍然属于你这个进程,但是进程会认为这段内存已经被占用,再用的时候又会去申请新的内存块),称为内存泄漏。在C/C++语言中,内存泄漏是最严重的程序bug,这也是别人认为Java/C#等语言比C/C++优秀的地方。
2.3、C语言操作堆内存的接口(malloc free)
堆内存释放时最简单,直接调用free释放即可。 void free(void *ptr);
堆内存申请时,有3个可选择的的兄弟函数:malloc, calloc, realloc。Malloc和他俩个兄弟calloc和realloc相比,他的俩个兄弟比自己在功能上更加强大,他的二弟calloc会将返回的内存初始化为0,而他的三弟realloc可以修改原先已经分配的内存块的大小。而malloc只是单纯的从内存中申请固定大小的内存。
void *malloc(size_t size);
void *calloc(size_t nmemb, size_t size);// nmemb个单元,
//每个单元size字节
void *realloc(void *ptr, size_t size); // 改变原来申请的
//空间的大小的
譬如要申请10个int元素的内存:
malloc(40); malloc(10*sizeof(int));
calloc(10, 4); calloc(10, sizeof(int));
数组定义时必须同时给出数组元素个数(数组的大小),而且一旦定义再无法更改。在Java等高级语言中,有一些语法技巧好像可以更改数组大小,但其实这只是一种障眼法。它的工作原理是:先新创建一个新需求大小的数组,然后将原数组的所有元素复制进新的数组,然后释放掉原数组,最后返回新的数组给用户。堆内存申请时必须给定大小,然后一旦申请完成则空间大小不变,如果要变只能通过realloc接口。realloc的实现原理类似于上面说的Java中的可变大小的数组的方式。
2.4、堆的优势和劣势(管理大块内存、灵活、容易内存泄漏)
优势:灵活;
劣势:需要程序员去处理各种细节,所以容易出错,这依赖于程序员的水平。
局部变量存在于栈(stack)中,全局变量存在于静态数据区中,动态申请数据存在于堆(heap)中。
2.5、静态存储区
我们现在知道非静态局部变量存储在栈中,但程序中不仅仅只有非静态局部变量,还有静态局部变量和全局变量。静态局部变量和全局变量存储在静态存储区。编译器在编译程序时就确定了静态存储区的大小,静态存储区随着程序运行而分配空间,直到程序运行结束才释放内存空间,这也正是我们通过定义静态变量或者全局变量的目的。相比于栈和堆对内存的操作,相对来说比较简单,就是在编译期分配一块确定大小的内存,用来存储数据。
局部变量存在于栈(stack)中,全局变量和静态局部变量存在于静态存储区中,动态申请数据存在于堆(heap)中。这里我们做个比喻,栈、堆、静态存储区比作程序中的三国天下。他们的地盘就是内存,他们对各自地盘的施政(对内存的管理)方针也各不相同。
|