打印

提高DSP代码运行性能的研究

[复制链接]
1707|22
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
Orchids|  楼主 | 2018-9-18 12:36 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
提高DSP代码运行性能的研究



1 引言

        随着微控制器技术的发展,以TI公司TMS320C2000系列为代表的DCS型数字信号处理器DSP应用广泛。该类型DSP内部集成Flash存储器,可将二进制代码同化到其内部的Flash存储器直接运行。这种运行方式在传统嵌入式应用设计中很有效,但在一些算法比较复杂、系统响应要求快速、通讯任务比较繁重的嵌入式应用中,这种运行方式会导致控制系统响应迟缓、通讯异常、I/O操作缓慢等问题。针对这些情况,提出一种新的解决方案,来提高DSP代码运行性能。



2 问题分析及设计方案

       由于应用程序在Flash中运行速度远低于在RAM中,因此在复杂嵌入式应用中会出现控制系统响应迟缓、通讯异常、I/O操作缓慢等问题。为了避免这些问题,只能让程序在RAM中运行。TI公司的TMS320C2000系列DSP有2种工作模式:微处理器模式和微控制器模式。当DSP处于微控制器模式时,在RAM中程序运行速度达到峰值,但掉电后程序丢失,系统无法重新自动运行,因此这种程序运行方式仅适用于仿真调试阶段。因此,DSP必须工作在微处理器模式下,使用片内Flash作为运行程序的存储和运行介质,才能保证系统上电后自动运行。但其程序运行效率低。因此必须把这2种工作模式相结合:首先将应用程序固化到片内Flash存储器,当系统上电后由专门设计的装载器(Bootloader) 负责将应用程序南Flash搬移到RAM,然后Bootloader将DSP控制权交给应用程序,从而实现DSP运行速度最高和上电后应用程序自动运行,解决了因程序在不同介质的不同效率所导致的系统响应迟缓、通讯异常、I/O操作缓慢等问题。

以TMS320LF2407 DSP为例进行说明:该DSP具有独立的数据存储空间和数据总线,以及程序存储空间和程序总线。只有程序空间的程序才能被DSP视为是可执行程序,数据空间上的程序将被DSP视为操作数据,因此将应用程序直接从片内Flash拷贝到数据空间的RAM后应用程序是不能运行的。若使拷贝后的应用程序能够被 DSP视为可执行程序还必须做一些辅助工作。

通过对TMS320LF2407的存储映射结构分析可发现:程序空间和数据空间的扩展区域有部分地址可配置成相同存储介质(Flash或者RAM),通过某种办法可以实现共享,也就是说DSP可以将从Flash中拷贝到共享RAM的应用程序视为可执行代码。



3 设计方案实施

3.1 TMS320LF2407存储空间配置及CMD文件编写

为实现程序空间与数据空间共享RAM的存储器配置方案,首先要熟悉C语言7个存储段对存储介质的要求,其具体要求如表1所示。



从表1可以看出:“.bss”、“.sysmem”、“.stack”段的存储介质必须是RAM,且使用数据空间地址;而“.text”、“. swtich”、“.cinit”段的存储介质可以是RAM或ROM,但必须使用程序空间地址。“.text”是用来存放应用程序的可执行代码的专用段,它既可运行在RAM中,也可在Flash中,该段的运行介质决定应用程序是否能够达到最大性能。根据DSP命令链接文件(CMD文件)对汇编段的管理方式可知,“.text”可配置成装载与运行分离的工作模式。这种模式可以使应用程序存储在Flash中,运行在RAM中从而实现DSP上电后全速运行。

其次由于存储空间使用装载与运行分离的配置模式,因此必须重新设计链接文件(CMD文件)。在设计新的CMD文件之前,首先介绍常用的分离配置链接命令指示器:“.label”定义一个可重定位代码段标签,该标签表明代码段内部地址都是相对的,在链接时重新定义该段分配的首地址。相应的段地址为“首地址+ 段内偏移地址”。利用该汇编指示器可提供代码装载地址。“.global”汇编指示器定义全局符号,该符号表示全局地址,链接器利用该汇编指示器定义的运行时全局地址,为程序提供在RAM中运行时的人口地址。“.”汇编指示器表示当前代码的运行地址,它用来帮助计算运行代码的长度。在CMD文件中定义可执行代码的运行时首地址标签_fun_run和代码长度标签_fun_len;在存储空间配置时定义COPYCODE段用来装载应用程序的可执行代码:在存储空间配置时定义DATA0段做为应用程序可执行代码段的运行介质。



具体存储空间配置及CMD文件编写代码如下:







3.2 Bootloader装载器软件及硬件设计

设计Bootloader装载器时应注意两点:首先关闭看门狗,否则可能因为搬移时间过长导致DSP被不断复位,系统无法正常工作;必须定义 Bootloader装载器的入口标签_c_int0和出口标签wfc_int0,实现Bootloader装载完成搬移工作后顺利进入用户应用程序。

考虑到DSP上电工作顺序:从系统复位指令处跳转至运行时支持代码;创建C语言运行环境;用户程序入口 main();完成用户初始化及应用代码。因此负责从Flash将应用程序代码拷贝到RAM的Bootloader装载器必须在恰当的时间工作,否则应用程序不能上电自动运行。由DSP上电工作顺序可以发现,系统上电复位时的复位地址是,固定的但跳转指令所指的地址是由用户指定的,也就是说,可以让该复位跳转指令指向所设计的Bootloader装载器的首地址完成代码搬移工作(其工作原理见图1),然后Bootloader装载器将DSP的控制权交给运行支持库,完成C语言环境建立并进入用户程序入口main()开始用户程序。为此必须对运行支持库做如下修改:

从运行支持库rts.rc源文件中提取boot.asm.将boot.asm的入口地址_c_int0修改为wfc_int0地址,重新编译boot. asm生成boot.obj文件,把boot.obj归档到C语言运行支持库rts.2xx.1ib。将修改后的运行支持库添加到工程中,实现Boot- loader装载器先于运行支持库代码执行。





Bootloader装载器利用装载地址、运行地址以及链接器提供的代码长度等信息,使用读表指令“TBLR”将代码从程序空间拷贝到数据空间,然后跳转到运行支持库入口地址开始执行程序。DSP的这种搬移指令特点仅适合将数据表从程序空间拷贝到数据空间,要实现全部设计功能必须配合相应的硬件设计,由 TMS320LF2407DSP的存储器映射结构可以看出程序空间与数据空间是物理分离的,即有3个独立的空间片选信号PS、DS、CS。为实现RAM共享,首先必须将PS和DS信号进行“与“操作,然后将其输出信号作为共享RAM的片选信号,实现程序空间与数据空间的统一编址。根据 TMS320LF2407DSP的存储器映射结构,具体的存储空间配置如下:0x0000~0x7FFF片上RAM、外设寄存器和保留的地址区,该区域必须作为数据地址使用;利用图2所示的硬件结构实现0x8000~0xFFFF区域程序空间和数据空间共享RAM。共享RAM配置如下:数据区 0x8000~0xBFFF;程序区0xC000~0xFFFF。





这里的硬件结构配合Bootloader装载器和特别设计的CMD文件实现了DSP运行速度最大和上电后代码自动运行,解决了在复杂应用情况下控制系统响应迟缓、通讯异常等问题。

具体Bootloader装载器设计代码如下:




4 测试结果

      该方案在某型防空武器火力控制分系统的实践中表现良好。通过提高DSP程序运行效率成功解决了因控制系统实时多任务所导致的通讯异常问题,避免了不必要的硬件升级。经实验对比发现:当系统有5个毫秒级实时任务同时工作时,采用Flash运行方式的 TTCAN通讯接口每毫秒最多可发送2帧数据,而采用本设计方案每毫秒最多可发送6帧数据,代码运行效率提高了3倍。



5 结束语

      该设计方案不仅成功解决了程序在Flash中运行效率低所导致的各种异常问题,同时还避免了不必要的处理器升级所带来的成本和开发风险。其设计思想可以推广到其他类似的应用中,从而最大限度的利用现有硬件基础提高嵌入式系统的性能。


相关帖子

沙发
Orchids|  楼主 | 2018-9-18 12:37 | 只看该作者
提高DSP代码运行性能的研究

文档1.pdf

198.22 KB

使用特权

评论回复
板凳
沧海一笑| | 2018-9-18 16:53 | 只看该作者
学习了。

使用特权

评论回复
地板
51xlf| | 2018-9-20 21:09 | 只看该作者
谢谢分享。                  

使用特权

评论回复
5
i1mcu| | 2018-9-20 21:10 | 只看该作者
任务比较繁重

使用特权

评论回复
6
pmp| | 2018-9-20 21:10 | 只看该作者
主要是代码的优化问题。

使用特权

评论回复
7
mmbs| | 2018-9-20 21:11 | 只看该作者
在RAM中运行。

使用特权

评论回复
8
1988020566| | 2018-9-20 21:11 | 只看该作者
还有硬件呢

使用特权

评论回复
9
lzbf| | 2018-9-20 21:11 | 只看该作者
主要看DSP的执行速度

使用特权

评论回复
10
houjiakai| | 2018-9-20 21:12 | 只看该作者

使用特权

评论回复
11
youtome| | 2018-9-20 21:12 | 只看该作者
TMS320C2000功能非常强大。

使用特权

评论回复
12
cemaj| | 2018-9-20 21:12 | 只看该作者
怎么不使用DSP5000呢?

使用特权

评论回复
13
kmzuaz| | 2018-9-20 21:13 | 只看该作者
现在一些算法比较复杂

使用特权

评论回复
14
houjiakai| | 2018-9-20 21:13 | 只看该作者
谢谢楼主分享资料。

使用特权

评论回复
15
51xlf| | 2018-9-20 21:13 | 只看该作者
可以使用汇编语言的。

使用特权

评论回复
16
lzbf| | 2018-9-20 21:13 | 只看该作者
推荐使用C6000的DSP芯片吧。

使用特权

评论回复
17
i1mcu| | 2018-9-20 21:13 | 只看该作者
DSP现在的运行效率很高。

使用特权

评论回复
18
1988020566| | 2018-9-20 21:13 | 只看该作者
硬件才是关键。

使用特权

评论回复
19
pmp| | 2018-9-20 21:13 | 只看该作者
楼主的有什么好的意见吗

使用特权

评论回复
20
mmbs| | 2018-9-20 21:13 | 只看该作者
主要还是运行的效率。

使用特权

评论回复
发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

697

主题

993

帖子

4

粉丝