打印
[STM32F4]

关于STM32F407 FLASH零等待读取加速问题

[复制链接]
1408|9
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
本帖最后由 liushiqi 于 2019-7-16 17:13 编辑

在参考手册FLASH 模块中,ART加速器中有这么一句话,凭借ART加速可以使CPU运行168MHZ时的性能相当于零等待。
然后我用KEIL软件连上板子与示波器根据手册中给出的设置,我们电压时3.3V,配置时钟频率为168,所以选择5个等待周期,开启预取和缓存。

目的:为了验证开启加速功能时,在168MHZ能否达到零等待。
方法:运行52800条单周期,顺序指令。用的是“MOV R0 #0” "MOV R0 #1",给R0寄存器赋值,从0到20,复制了60次,为了减少指令书写,采用BL跳转自身40次。一共是52800条(包含跳转指令),跳转40次,跳转可忽略,相当于全部顺序执行。MOV在M4中是32位指令。
在第一条指令前拉高管脚,最后一条指令后拉低管脚,开启预取和缓存,设置5个等待周期。然后在示波器中截取管脚拉高的时间,计算出实际值。
计算出理论零等待时间:应该是52800/168=314微秒。
但是得到的实际值是570微秒。远远达不到零等待时间,这是为什么,哪里出了问题。请大神赐教。非常感谢!



使用特权

评论回复
沙发
liushiqi|  楼主 | 2019-7-16 17:13 | 只看该作者
困扰了我很久,又没有RTL代码,无法仿真出实际怎么运行的。

使用特权

评论回复
板凳
kingkits| | 2019-7-17 12:58 | 只看该作者
人家是自动加速的,但效率没你想象的那么高,建议去研究一下DSP的指令架构

使用特权

评论回复
地板
liushiqi|  楼主 | 2019-7-19 08:30 | 只看该作者
kingkits 发表于 2019-7-17 12:58
人家是自动加速的,但效率没你想象的那么高,建议去研究一下DSP的指令架构 ...

我也觉得效率没那么高,但是他自己参考手册写的加速性能相当于零等待。这不是吹牛呢么

使用特权

评论回复
5
liushiqi|  楼主 | 2019-7-19 08:36 | 只看该作者
kingkits 发表于 2019-7-17 12:58
人家是自动加速的,但效率没你想象的那么高,建议去研究一下DSP的指令架构 ...


他这个自适应应该指的是开启后自动加速,开关加速还是可控的

973825d3110417c01a.png (75.85 KB )

973825d3110417c01a.png

使用特权

评论回复
6
guanjiaer| | 2019-8-9 11:39 | 只看该作者
非常感谢楼主分享

使用特权

评论回复
7
heimaojingzhang| | 2019-8-9 11:48 | 只看该作者
感谢楼主分享

使用特权

评论回复
8
keaibukelian| | 2019-8-9 11:51 | 只看该作者
感谢楼主分享

使用特权

评论回复
9
liushiqi|  楼主 | 2019-8-22 09:42 | 只看该作者
经过一段时间的研究,这个问题已经解决了。此测试方法可行,附上测试数据。希望能帮到大家。  

结论:ST的加速效果在一些特点明显的程序中(针对预取的顺序程序,针对cache的循环程序)加速效果显著能达到零等待性能。但是在大量跳转的程序中虽然达不到零等待,但是加速效果依然显著。

对于之前测量中存在的问题,应该是因为在频率过高时,指令数太少,受限于器材的限制,在示波器上显示不出明显效果,。当我把指令数加到10W条或者频率降低后,问题被解决。

使用特权

评论回复
10
liushiqi|  楼主 | 2019-8-22 09:44 | 只看该作者
还有什么问题,欢迎大家提出,一起探讨。

使用特权

评论回复
发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

1

主题

6

帖子

0

粉丝