本帖最后由 xiaofei558008 于 2021-6-1 21:05 编辑
各位大侠,
看了标题是不是觉得我有点飘了,550MHz MCU 都算不过来?
确实,最近搞了个摄像头项目,需要比较高的实时处理速度和低功耗的需求;
目前已经将算法在480MHz的H7上从26ms压缩到8.1ms;预设是10ms@550MHz处理完毕,看着现在已经完成了;
但老板说要做到极致,功耗也要极致,现在问题来了,芯片功耗在550MHz(约为7ms)功耗还是蛮大的,芯片功耗大意味着使用时间相对来说变短,电池就要变大,体积重量和充电时间都会变大;
如何才能将现有的算法在H7上提速;
1、算法有double型数据,开启双精度FPU;
2、开启I-Cache和D-Cache
3、代码已经尝试放在RAM里面跑,但效果不明显,约优化了600us;
4、ITCM 和 DTCM已经用上,但没有完全放的下变量/代码;
比较好奇【RAM shared between ITCM and AXI】是如何使用呢,有谁用过吗?
查阅了网上各位大神的做法和个编译的性能对比测试,可以用arm_math.h替换math.h等;
编译器目前是IAR8.41版本,优化速度开到最高;
各位大侠有好的类似大计算量的经验可以分享吗?
小弟不胜感激~~
|