phlips的dsp介绍philips的1700,不是最新型号。主频500M。
优化特点:
.128个通用寄存器,比TI的更通用,不分组。强烈推荐。
.5并行。我们经常可以优化到完全的5并行。
.其他通用的dsp特点。
实际测试和TI的同样频率C64比运算效能几乎是 1700:C64 = 0.8:1。
强悍且好用 |
blackfin系列其实并不是完全意思的dsp,它是adi和intel联合开发的通用处理器,所以相对比较弱。
优化特点:
. 3指令并行。在纯数字运算的时候可以做到。但是寄存器太少,经常有寄存器竞争,容易打断流水线。
. 其他通用dsp的特点。
不得不说下blackfin系列的短板:
.寄存器太少,容易产生竞争打断流水
.并行度不够。
.跳转比较费时,且无分支预测(这个arm做的好),无条件执行指令
同主频 blackfin:C64 = 1:4甚至更多
先申明我还没用过这款芯片,得到的文档也不详细,没看到指令集。但是我做了多年的arm算法优化,就这么猜猜吧
A8的好处是有个neon协处理器。
A8本身最大的特点是双发射,2个alu,类似10年前的intel 586-100.还有就是分支预测做的不错。
重点介绍 NEON协处理器:
.几乎是一个完整的dsp,且有浮点运算单元。据说也是单指令周期,SIMD。
.不知道是否有0开销循环功能。
.不知道regisger file多大,个人估计应该不会太大,和blackfin持平
.从图上看是6指令并行(不算浮点单元)。
最大的感觉就是neon的流水线排列非常的怪,很难优化到最佳,容易被打断,达不到单指令周期的目的。这个结论只是看文档得来的,从来没见过这种流水线,只好这样猜测。感觉优化难度是所有芯片里最难的。
总体性能感觉要强于blackfin,我估计 A8:blackfin = 1:1.2
总结一下1. A8远远弱于主流的正规DSP。没有代替的可能性。主流DSP都是65nm工艺的。
2. A8强于古老产品比如TI的C54,C28等,但是成本上不见得有优势,毕竟人家卖了那么多年,整体经营成本早就回收了。A8的65nm工艺也是要投很多钱的,虽然出来的die比较小。
3. A8和5年前的blackfin系列基本持平,但是成本上也不具备优势。blacfin系列现在是90nm工艺。
4. 32位单片机上cortex没有优势,它只能提供阉割后的M3,根本没法和blackfin,C28等拼性能,除非ADI自己不争气(不过ADI一向不争气,哈哈哈)。cortex单片机唯一的优势是16位的thumb指令集。
A8唯一的优势就是手持设备,但是收到x86的强烈竞争,3年内肯定会看到很恐怖的x86单片机 |
日本汽车 迎合消费者需要。 低价,省油、配件维修等便宜等等。
CORTEX-M3就是这样,例如STM32,零售最便宜的为17元RMB.这个TI C28X的DSC是做不到的。而且功耗更低,外设更丰富。
而且FLASH、RAM的容量比C28X的更大,代码密度更高(THUMB-2)。而C28X的确实纯爷们【32位代码】,开发工具超便宜。
最要命的是CORTEX-M3的算法能力一点都不比C28X逊色!
一般算法FIR、IIR、FFT等都有库提供。自己做虚拟浮点算法库照样不怕浮点算法太慢。
A8目前的产家不多,象ST还未出A8的芯片。而且像NXP,ATMEL,SANSUMG等也没有CORTEX-A8的授权!因此CORTEX-A8还未成气候与TI/ADI的DSP扳手。可惜!
CORTEX-A8的性能足够在消费类产品上应付的。600MHZ的CORTEX-A8性能应该非常不错了。
CORTEX-A8就好比是日本的丰田车或本田车。而且TI的DSP就好比是奔驰车! |