xilinx FPGA设计经验小谈

[复制链接]
 楼主| drentsi 发表于 2011-12-12 20:06 | 显示全部楼层 |阅读模式
简单总结:
1.衡量FPGA的性能以及是否满足实际需求,按 性能=逻辑数X速度+BRAM数X系数来计算,BRAM系数比较麻烦,一般只按 性能=逻辑数X速度 来计算。这是一个非常重要的概念,另一重意思就是 面积与速度的积对于一个项目而言是个定数。原始设计速度为100M,完成同样的事,速度跑到400M时理论上资源可以少到1/4。

2.仔细计算好流水线,尽量提高编译报告的速度。速度可以换面积,同时也可以提高稳定性。编译报告的速度越高越好。一般而言在Spartan系列,应达到150MHz以上,Virtex-5系列应达到400MHz以上。无论实现什么功能,这些指标都是可以实现的。举个例子,virtex-5,-1等级,1级逻辑速度为530MHz,2级逻辑为430MHz,只要尽量控制在2级逻辑,400MHz是没多大问题的。两级逻辑最多可以有6X6=36个输入量,太复杂的逻辑编译器不好优化,一般控制在12个输入量以下就可以了。

3.提高资源利用率,对于LUT-6型的器件,一个关键衡量参数就是编译后报告的
Number of fully used LUT-FF pairs: ,这个参数,一般在50%左右,设计合理的一般可以达到60%以上。小于40%就是设计有问题,需要更改设计思路。这个值越高,一般报告的速度也越高,同时也会越省面积(参考第1条)。一个设计不合理的项目,假如这个值为20%,那么可以认为,完成同样一件事,资源可以少到1/3(按60%计算),同时速度可以提升到3倍。

4.节省资源的一个重要方法是并串转换、时分复用。

5.提升性能未必要并行处理,因为合理设计的流水线会显著的提升性能。

6.如无乘法及很宽的加法,尽量不要用DSP48,呵呵,反其道而行之,因为用这些部件的连线延迟会是影响速度的主要因素,同时也会造成布线困难。
philoman 发表于 2011-12-12 23:26 | 显示全部楼层
楼主刚完工一个pj有感而发?
lelee007 发表于 2011-12-13 00:04 | 显示全部楼层
呵呵,都很经典
edacsoft 发表于 2011-12-13 09:34 | 显示全部楼层
LZ啥都好,就是不回信
哈哈
GoldSunMonkey 发表于 2011-12-13 13:38 | 显示全部楼层
LZ啥都好,就是不回信
哈哈
edacsoft 发表于 2011-12-13 09:34

我是啥都不好,就是爱回信
GoldSunMonkey 发表于 2011-12-13 13:39 | 显示全部楼层
2# philoman 肯定
GoldSunMonkey 发表于 2011-12-13 13:39 | 显示全部楼层
3# lelee007 是呀是呀
jack_shine 发表于 2011-12-13 16:16 | 显示全部楼层
路过学习:)
GoldSunMonkey 发表于 2011-12-13 16:39 | 显示全部楼层
edacsoft 发表于 2011-12-13 17:33 | 显示全部楼层
我是啥都不好,就是爱回信
GoldSunMonkey 发表于 2011-12-13 13:38

really?
我给你发短息也没见回啊
Oxygen.Chu 发表于 2011-12-13 19:47 | 显示全部楼层
2.仔细计算好流水线,尽量提高编译报告的速度。速度可以换面积,同时也可以提高稳定性。编译报告的速度越高越好。一般而言在Spartan系列,应达到150MHz以上,Virtex-5系列应达到400MHz以上。无论实现什么功能,这些指标都是可以实现的。举个例子,virtex-5,-1等级,1级逻辑速度为530MHz,2级逻辑为430MHz,只要尽量控制在2级逻辑,400MHz是没多大问题的。两级逻辑最多可以有6X6=36个输入量,太复杂的逻辑编译器不好优化,一般控制在12个输入量以下就可以了。

-------------------------------------------------------------

楼主的经验很不错,不过在V4/V5里面想要达到400MHz~500MHz并非那么容易。实际上我见过的全国大部分的FPGA设计而言,逻辑延迟(Logic Delay)并不是造成Timing Issue的主要问题所在;反而是布线延迟(Routing Delay)慢慢地开始主宰整个Fmax指标。

90nm是业界普遍同意的拐点:该节点之前,Logic Delay会占主要部分;而之后,Routing Delay则越来越显示出问题来。因此现代的综合器逐渐开始采用物理感知引擎(Physically-aware Engine)来替代线载模型(Wire-load Model)来对布线延迟进行预测。

除此之外,Xilinx芯片的ASMBL架构对Fmax也有较大的影响,特别是当cascading特别长的时候。

有几个大型设计,能够全芯片运行在400MHz~500MHz这样的Fmax下?

评分

参与人数 1威望 +6 收起 理由
GoldSunMonkey + 6 谢谢分享~

查看全部评分

GoldSunMonkey 发表于 2011-12-13 20:12 | 显示全部楼层
哈哈~谢谢氧气
Oxygen.Chu 发表于 2011-12-14 11:09 | 显示全部楼层
猴哥,不客气哈~
俺是专门来捧你的场的,嘿嘿:)
21IC之星 发表于 2011-12-14 11:18 | 显示全部楼层
捧个场  :lol
GoldSunMonkey 发表于 2011-12-14 11:56 | 显示全部楼层
猴哥,不客气哈~
俺是专门来捧你的场的,嘿嘿:)
Oxygen.Chu 发表于 2011-12-14 11:09

谢谢啦~
GoldSunMonkey 发表于 2011-12-14 11:57 | 显示全部楼层
14# 21IC之星 嘿嘿~
bairan168 发表于 2011-12-15 16:12 | 显示全部楼层
算我一个撒
GoldSunMonkey 发表于 2011-12-15 20:53 | 显示全部楼层
;P好
hjjnet 发表于 2011-12-18 22:05 | 显示全部楼层
赞一个先
GoldSunMonkey 发表于 2011-12-18 22:10 | 显示全部楼层
:)必须赞~
您需要登录后才可以回帖 登录 | 注册

本版积分规则

个人签名:学习,思考。

144

主题

1720

帖子

43

粉丝
快速回复 在线客服 返回列表 返回顶部