[技术问答]

Keil C51编译/链接/优化 转

[复制链接]
82|0
手机看帖
扫描二维码
随时随地手机跟帖
burgessmaggie|  楼主 | 2023-5-26 07:00 | 显示全部楼层 |阅读模式
Keil C51编译/链接/优化一、C51编译库及代码优化技术

如下图所示:可以根据优化等级的需要选择相应的库文件。
通过Keil ->Target 下 Memory Model / code Rom size 来进行配置

SMALL:所有变量都被定义在8051单片机的片内RAM中,对这种变量的访问速度最快。另外,堆栈也必须位于片内RAM中,而堆栈的长度是很重要的,实际栈长取决与不同函数的嵌套深度。采用SMALL编译模式与定义变量时指定data存储器类型具有相同效果。COMPACT:所有变量被定义在分页寻址的片外XRAM中,每一页片外XRAM的长度为256字节:即所有变量存储在片外XRAM的某一页中。这时对变量的访问是通过寄存器间接寻址(MOVX @R0,MOVX @R1)进行的,变量的低8位地址由R0和R1确定,变量的高8位地址由P2口确定。采用这种模式时,必须适当改变配置文件STARTUP.A51中的参数:PDATASTART和PDATALEN;同时还必须对uVision2的“Options选项/BL51 Locator 标签页/Pdata框”中键入合适的地址参数,以确保P2口能输出所需要的高8位地址。采用COMPACT编译模式与定义变量时指定pdata存储器类型具有相同效果。LARGE:所有变量被定义在片外XRAM中(最大可达64KB),使用数据指针DPTR来间接访问变量(MOVX @DPTR),这种编译模式对数据访问的效率最低,而且将增加程序的代码长度。采用LARGE编译模式与定义变量时指定xdata存储器类型具有相同效果。1.1 代码优化

C51可将即使有经验的程序员编制的代码进行优化,总共有9个优化级,C51的所有优化方法如下:
0级(Constan folding)的优化包括:

a、常数折叠:只要有可能,编译器就执行将表达式化为常数数字的计算,其中包括运行地址的计算。b、 简单访问优化:对8051系统的内部数据和位地址进行访问优化。c、 跳转优化:编译器总是将跳转延至最终目标上,因此跳转到跳转之间的命令被删除。

1级(Dead code elimination)的优化包括:

a、 死码消除:无用的代码段被消除。b、 跳转否决:根据一个测试回溯,条件跳转被仔细检查,以决定是否能够简化或删除。

2级(Data overlaying)的优化包括:

a、数据覆盖:适于静态覆盖的数据和位段被鉴别并标记出来。连接定位器BL51通过对全局数据流的分析,选择可静态覆盖的段。

3级(Peephole optimization)的优化包括:

a、“窥孔”优化:将冗余的MOV命令去掉,包括不必要的从存储器装入对象及装入常数的操作。另外如果能节省存储空间或者程序执行时间,复杂操作将由简单操作所代替。

4级(Register variables)的优化包括:

a、寄存器变量:使自动变量和函数参数尽可能位于工作寄存器中,只要有可能,将不为这些变量保留数据存储器空间。b、扩展访问优化:来自IDATA、XDATA、PDATA和CODE区域的变量直接包含在操作之中,因此大多数时候没有必要将其装入中间寄存器。c、局部公共子式消除:如果表达式中有一个重复执行的计算,第一次计算的结果被保存,只要有可能,将被用作后续的计算,因此可从代码中消除繁杂的计算。d、CASE/SWITCH语句优化:将CASE/SWITCH语句作为跳转表或跳转串优化。

5级(Common subexpression elimination)的优化包括:

a、全局公共子式消除:只要有可能,函数内部相同的子表达式只计算一次。中间结果存入一个寄存器以代替新的计算。b、简单循环优化:以常量占据一段内存的循环再运行时被优化。

6级(Loop rotation)的优化包括:

a、回路循环:如果程序代码能更快更有效地执行,程序回路将进行循环。

7级(Extended Index Access optimizing)的优化包括:

a、扩展入口优化:在适合时对寄存器变量使用DPTR数据指针,指针和数组访问被优化以减小程序代码和提高执行速度。

8级(Reuse Common Entry Code)的优化包括:

a、公共尾部合并:对同一个函数有多处调用时,一些设置代码可被重复使用,从而减小程序代码长度。

9级(Common Block Subroutines)的优化包括:

a、公共子程序块:检测重复使用的指令序列,并将它们转换为子程序。C51甚至会重新安排代码以获得更多的重复使用指令序列。

二、C51与ASM混合编程技术2.1 混合编程意义

通常用C51来编写主程序。然而,在一些时序要求严格的采用汇编程序设计具有更高的效率,因此要求在C程序中调用一些用汇编语言编写的子程序。

方法一、直接在函数体内的每个汇编语句前加?“asm”预编译指。

void Test1(void){    asm    MOV R1,#0AH    asm    LOOP: INC A    asm    DJNZ R0,LOOP    return;}

方法二、把asm作为关键字后续汇编用大括号括起来

void Test2(void){    asm    {        MOV R1,#0AH        LOOP: INC A        DJNZ R0,LOOP    }    return;}

方法三、在C模块内通过语句“#pragma”嵌入汇编代码

void Test3 (void){    #pragma asm        MOV R1,#0AH        LOOP: INC A        DJNZ R0,LOOP    #pragma endasm    return;}三、C51中常见符号的命名规则


3.1、C51函数名与汇编程序名的转换规则
C51程序模块编译成目标文件后,其中的函数名依据其定义的性质不同会转换为不同的函数名,因此在C51和汇编程序的相互调用时要求汇编程序必须服从这种函数名的转换规则。

3.2、C51函数及其相关段的命名规则
一个C51源程序模块被编译后,其中的每一个函数以“?PR?函数名?模块名”为名的命名规则被分配到一个独立的CODE段。
注意:如果添加了“OVERLAYABLE”标志,故可被L51连接/定位器作覆盖分析

四、C51函数的参数传递规则

参数的传递通过内部的R1-R7 来实现,最多可以传递三个参数。

具体使用如下:

五、 Data Overlay

大多数C编译器函数参数和局部变量存储在硬件栈的一部分称为堆栈帧。这种方式好处是速度快, 对于栈空间大的架构来说很实用。
但是,8051 栈空间只有256byte, 这种方式显然不合适,太浪费8051的栈空间。
因此,C51的 C编译器使用LX51链接器将函数参数和局部变量存储在固定的内存位置(fix memory)使用定义明确的名称(以便函数参数易于传递和访问)。

LX51链接器通过分析程序的结构,创建一个Call-tree, 使本地变量和函数参数放置在可覆盖的数据段中。这种技术非常好用,可以提供和传统的堆栈帧相同访问的效果。

Call Tree 结构图:


使用特权

评论回复
发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

11

主题

1039

帖子

0

粉丝