发一个可能被骂的问题

[复制链接]
4710|20
 楼主| wujing198 发表于 2009-3-3 20:55 | 显示全部楼层 |阅读模式
看到netjob一直在被大家围攻,觉得问这个问题可能有点虚,不过还是顶着雨伞把问题问出来了。<br />现在由于某些特殊的原因,需要把DSP+ARM架构改成ARM+ARM架构。采用ARM926内核的处理器。<br />询问各位一下ARM926做数字信号处理大概能和TI哪个档次的DSP相当?<br />采用这种架构是基于特殊的考虑的,现在需要确定数字信号的处理速度是否能跟上。
hitajian 发表于 2009-3-4 16:14 | 显示全部楼层

和你的算法复杂度有关系.

另外你的内核用的是&nbsp;ARM926EJ-S吗?&nbsp;<br />这应该是属于ARMv5TE的版本,因为加入了额外的DSP类型的指令,处理一些运算会方便很多,比如饱和算数指令和乘累加.<br />当然,即使处理器有指令的支持,在编程上也需要发挥出这些指令的优势来才可以.
xwj 发表于 2009-3-4 16:45 | 显示全部楼层

ARM926EJ-S一般也就200MIPS左右

而现在最快的DSP是13000多MIPS<br />至于浮点处理,那就更不用说了<br /><br />DSP强调的是数字运算,比如视频编解码、基带通讯等运算密集度非常高的场合;<br />ARM强调的是性价比高,外设丰富,开发简单,各有各的优缺点;<br />而且,随着市场的发展,ARMy和DSP之间都在相互渗透,吸收彼此的长处。比如ARM增加部分DSP类型的指令,DSP增加更多的外设等,以其获得更高的死缠竞争力。<br /><br />高端DSP的运算速度除了硬核外,是别的芯片无法取代的<br />比如做的D1尺寸的H.264视频编码(压缩),现在的高端DSP做到实时压缩是没一点问题的,而用电脑来压缩的话,只有用到主频3G多的4核处理器,才能达到1:1的速度。<br /><br /><br />当然,你没有运算速度要求的话,当然是什么性价比好就选什么啦,什么东西能最便宜的达到要求肯定就选什么<br />比如很多带有硬件核的专用ASIC<br /><br /><br /><br />顺便转一文:<br />DSP市场化拓展&nbsp;<br /><br />当前虽然DSP无论是作为一种成熟的技术还是一种成熟的产品均已成为数字信息时代的主流,但是其市场化拓展还存在这巨大的空间。DSP的三大要素即性能、价格和功耗与其市场拓展息息相关。挑战更高的性能,尽可能降低价格和功耗,永远是DSP追求的目标。&nbsp;<br /><br />下面将每十年DSP性能、规模、工艺、价格的变动和及应用概括如下:&nbsp;<br /><br />年代&nbsp;1980&nbsp;1990&nbsp;2000&nbsp;2010&nbsp;<br />速度(MIPS)&nbsp;5&nbsp;40&nbsp;5000&nbsp;50000&nbsp;<br />RAM(字节)&nbsp;256&nbsp;2K&nbsp;32K&nbsp;1M&nbsp;<br />规模(门)&nbsp;50K&nbsp;500K&nbsp;5M&nbsp;50M&nbsp;<br />工艺(微米)&nbsp;3&nbsp;0.8&nbsp;0.1&nbsp;0.02&nbsp;<br />价格(美元)&nbsp;$150.00&nbsp;$15.00&nbsp;$5.00&nbsp;$0.15&nbsp;<br /><br /><br />目标应用&nbsp;工业仪器军事&nbsp;调制解调器硬盘驱动器数字答录机蜂窝电话等&nbsp;多媒体网关数字相机智能电话数字广播等&nbsp;新一代手机流媒体设备数字电视机等等…&nbsp;<br /><br />可以看出在各个时代,DSP性能随集成度的增加而提高,而价格却一直在下降。DSP突出的性能价格比趋势似乎也在很好地演绎着Moore定律。从不断扩大的目标应用来看,DSP在数字信息产品的市场地位越来越重要。&nbsp;<br /><br />针对DSP功耗的变动趋势,存在一个Gene定律,如下图所示:&nbsp;<br /><br /><img src="http://www1.ti.com.cn/customer/article/2004/images/1221_01a.jpg"><br /><br /><br />不难看到DSP每MIPS的功耗在1982年为250mW,而到1992就迅速下降为12.5mW,到2000年仅为0.1mW。2004年将挑战0.01mW,而预计2010年将达到0.001mW。概括起来就是DSP功耗性能比没隔5年将降低10倍。&nbsp;<br /><br />当&nbsp;今DSP之所以可以在嵌入式应用方面挑战微处理器CPU,在数字控制方面可挑战单片机MCU,还在于DSP结构体系已实现多样性。DSP既有追求高性能并&nbsp;行结构,也有追求低功耗的省点核心;DSP中不仅可以集成闪存、数据转换器和多种接口,还可以集成CPU核心、视频和音频接口。&nbsp;<br /><br />软件可&nbsp;编程性始终是DSP市场拓展的关键。目前DSP开发工作中的80%以上已是软件工作。数字信息产品中需要应用到许许多多新的技术和标准,其中不少需要经过&nbsp;不断完善。DSP首先可以构建一个强大灵活的硬件平台和软件基础,然后集成各种软件,其中可以包括标准算法、驱动、协议和应用等等。DSP软件还易于维护&nbsp;和升级,大量工作可以在线实现。&nbsp;<br /><br />DSP的应用已经涵盖了工业、通信、娱乐、个人医疗、教育、环境控制、安全等领域,我们期待着更多更好的应用。将来的人们对具有DSP核心的数字信息产品大概会情有独衷,因为&nbsp;DSP会创造更多的价值。&nbsp;<br />From:&nbsp;TI&nbsp;News<br />&nbsp;<br />最后更新&nbsp;(&nbsp;周六,&nbsp;2008年&nbsp;07月&nbsp;05日&nbsp;16:39&nbsp;)&nbsp;&nbsp;<br /><br /><br /><br /> 相关链接:<a href='http://www.dspsolution.com/joomla/index.php?view=article&catid=1:latest-news&id=93:dsp&tmpl=component&print=1&page='>http://www.dspsolution.com/joomla/index.php?view=article&catid=1:latest-news&id=93:dsp&tmpl=component&print=1&page=</a>
xwj 发表于 2009-3-4 16:52 | 显示全部楼层

其实很多时候dsp提供的是高的性能功耗比

换句话说,在6000这样的功耗条件下,比如小于2w,没有哪个cpu能够提供比肩6000的运算性能,<br />dsp更多的时候是提供一种嵌入式的高性能计算能力,而且随着cpu设计的发展,现在这种分界也越来越模糊了,通用cpu也需要高性能的专用指令,在性能上,通用cpu是不会比dsp落后的,但是这是有代价的,我想现在看不到不用散热器的cpu吧,但是dsp用散热器的少之又少吧,但是在极端追求性能的几个方向上,都是不用dsp的,比如并行巨型机,都是用通用cpu搭建的,而高速信号处理,基本都是用asic或者fpga并行计算的。应该说dsp发展是比较受限制的,除非能够有新的突破点<br /><br /><br />通用cpu、DSP、FPGA、ASIC等,用途、结构差别很大,实际上是没法比较的!<br /><br />同样是PC,AMD、Intel速度上都没办法严格比较,更何况DSP和CPU了。<br /><br />现在,<br />CPU和DSP的界限逐渐模糊<br />FPGA和CPU界限也在模糊<br /><br />CPU、DSP、FPGA等类型种类繁多,不同的应用要选择不同的方案,没有哪个东西一定是最快的,但却一定会有最适合自己用的!<br /><br />在自己的系统中永远只有最合适的,没有最快的(开发速度与开发难度必需要均衡)<br /><br />所以,不要管别人的芯片谁最快,选好自己最合用的才是王道。<br />
 楼主| wujing198 发表于 2009-3-4 18:23 | 显示全部楼层

不能用DSP

是由于特殊的原因。可以用DSP的话,我也不会问这个问题。<br />做工程就是这样,选择是受多方面限制的。
宇宙飞船 发表于 2009-3-4 19:51 | 显示全部楼层

算法速度的优化是至关重要!

例如某些指令,对于8位机16M时钟下只要2.3us&nbsp;小于3us.若换成16M的ARM,速度就就更惊人!若上到160M的时钟,很多事情都能就此解决!<br />
 楼主| wujing198 发表于 2009-3-4 20:25 | 显示全部楼层

恩~

感谢楼上。
宇宙飞船 发表于 2009-3-5 02:43 | 显示全部楼层

16M时钟的8位机128点的FFT,IFFT

C语言编写的约14ms,汇编的约4.6ms&nbsp;,若换成32位机,同一时钟速度立马变成原来10倍以上,若时钟160M,32位机128点的FFT,50微秒内就能完成!
bjc125 发表于 2009-3-5 17:37 | 显示全部楼层

路过 学习中

  
yxwsz 发表于 2009-3-6 23:26 | 显示全部楼层

RE

&quot;数字信号处理&quot;是什么信号处理?&nbsp;如果是处理语音压缩、解压,200MHZ的ARM926EJS完全没有问题;&nbsp;&nbsp;如果要处理图像压缩、解压,那就会有问题了;<br /><br />所以需要考虑的问题有两个:1&nbsp;是算法的复杂度问题,做什么样的处理;&nbsp;2&nbsp;是算法优化的问题,优化过的算法和没有优化的算法效能差别非常大(926EJS是有DSP扩展指令)。
 楼主| wujing198 发表于 2009-3-7 13:57 | 显示全部楼层

主要是语音

图像、视频暂不考虑了。<br />就是用200M的926EJS
xwj 发表于 2009-3-7 14:06 | 显示全部楼层

只处理音频的话随便找个够用的就行了,确实没必要非用DSP

还是那句话:<br />不要管别人的芯片谁最快,选好自己最合用的才是王道。
computer00 发表于 2009-3-7 14:35 | 显示全部楼层

提供一些数据给楼主参考:

下面是圈圈在AT91SAM7S64上(主时钟为48MHz)自己用C语言写的FFT计算运行时的仿真数据,<br />FFT耗时(包括位倒序和FFT运算)<br />1024点——&nbsp;约58ms<br />512点——&nbsp;约22ms<br />256点——&nbsp;约11ms<br />128点——&nbsp;约4.4ms<br />&nbsp;64点——&nbsp;约1.8ms<br /><br /><br />而以前在ADI的BF533上(主时钟为600M)也做过FFT运算,我记得1024点的FFT,好象是只用了37us。<br /><br />如果换算成相同的频率,大概差了100倍。当然这也与圈圈写的代码差劲有关系,<br />就算给圈圈打个1折也还差很远哦~~~~
alex74 发表于 2009-3-7 20:18 | 显示全部楼层

如果换TI的6系列,比ADI还能提高4倍,很恐怖

  
 楼主| wujing198 发表于 2009-3-7 23:17 | 显示全部楼层

主要是做音频编解码

不会做那么恐怖的FFT的,呵呵。
zhousd 发表于 2009-3-8 01:02 | 显示全部楼层

碰到门外汉了,你说怎个编解法,说出来听听,

大牛们若果心情好,会把你指点到晕头转向的。。。。
 楼主| wujing198 发表于 2009-3-9 09:25 | 显示全部楼层

主要是G.72X

729、726等等,VoIP的一些编解码。原来用TI的54系列DSP做过一下,实现起来当然很简单啦。<br />现在要换成ARM,以前没用过。
xwj 发表于 2009-3-9 09:31 | 显示全部楼层

ARM926EJ-S的性能不考虑DSP指令的话应该和54系列差不多,

考虑其内部做的部分DSP指令,应该还能更快些:-)<br />所以还是能够满足要求的,具体就看你的优化了。<br /><br /><br />可以参照3楼的表格,ARM926EJ-S应该比200MHz的PXA255要快一些。<br /><br />
 楼主| wujing198 发表于 2009-3-9 12:14 | 显示全部楼层

谢谢xwj

今天已经确认方案了,等做完了以后我总结一下发上来仅供大家参考。
alex74 发表于 2009-3-9 13:11 | 显示全部楼层

。。。

xwj&nbsp;发表于&nbsp;2009-3-9&nbsp;09:31&nbsp;DSP&nbsp;技术&nbsp;←返回版面&nbsp;&nbsp;&nbsp;&nbsp;<br /><br />18楼:&nbsp;ARM926EJ-S的性能不考虑DSP指令的话应该和54系列差不多,&nbsp;<br /><br />考虑其内部做的部分DSP指令,应该还能更快些:-)<br />所以还是能够满足要求的,具体就看你的优化了。<br /><br /><br />可以参照3楼的表格,ARM926EJ-S应该比200MHz的PXA255要快一些。&nbsp;<br />----------------------------<br />pxa有wireless&nbsp;mmx,很快的。<br />&nbsp;<br />
您需要登录后才可以回帖 登录 | 注册

本版积分规则

8

主题

293

帖子

1

粉丝
快速回复 在线客服 返回列表 返回顶部