打印

使用profile和cachetune提高cache命中率

[复制链接]
445|0
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
傲视群熊|  楼主 | 2017-4-12 09:49 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
以前调试时发现CCS在不用版本下编译的.out文件大小完全不同,更有甚者在CCS3.1下可以顺利编译的程序CCS2.2竟然报错,仔细检查发现有部分指令CCS2.2不支持,所以我更推荐高版本的CCS。
今天把编码平台移植到CCS3.3后编码速度有所下降,估计是cache命中率的影响。所以调整了一个下午的cache命中率,调整过程如下
1、首先开启profile,在CCS的主菜单中选择profile选项,点击setup,出现如下界面,我比较懒,通常选择所有选项,这样就不用详细区分每一项的含义了。
2、选择profile->view,出现下面的界面,这个里面显示了当前程序的stall cycle和L1P、l1D的命中率,这个数据指导了cache调整的大方向。
3、开启cachetune软件,在profile->tuning->cachetune中,调出cachetune界面 4、设置合适的断点,在需要进行剖析的函数入口和出口处设置断点。
5、运行程序,在程序入口断点处点击图一中的小闹钟图形,开启profile功能,出口处再点


[img][/img]
[img][/img]
今天把编码平台移植到CCS3.3后编码速度有所下降,估计是cache命中率的影响。所以调整了一个下午的cache命中率,调整过程如下
1、首先开启profile,在CCS的主菜单中选择profile选项,点击setup,出现如下界面,我比较懒,通常选择所有选项,这样就不用详细区分每一项的含义了。
2、选择profile->view,出现下面的界面,这个里面显示了当前程序的stall cycle和L1P、l1D的命中率,这个数据指导了cache调整的大方向。
3、开启cachetune软件,在profile->tuning->cachetune中,调出cachetune界面 4、设置合适的断点,在需要进行剖析的函数入口和出口处设置断点。
5、运行程序,在程序入口断点处点击图一中的小闹钟图形,开启profile功能,出口处再点
击一个那个小闹钟,关闭profile,可以看到profile的结果,根据这个结果选择是否进入cachetune环节。  
6、由于程序命中率比较低,所以进入cachetune界面,首先通过上方的放大缩小将cachetune界面调整到一个方便观看的尺度。红色表达miss,绿色是hit,将鼠标放大红色的部分上,鼠标会出现一个变形,点击可以进入miss的函数,按照cachetune的提示调整程序,减少miss。
  

相关帖子

发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

51

主题

84

帖子

1

粉丝