打印

嵌入式微处理器IP core设计与分析(转)

[复制链接]
1863|4
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
中国无芯|  楼主 | 2012-1-28 19:47 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
摘要: 本文在对传统微控制器进行系统分析的基础上, 提出了一种较好的改进设计方法。回避了传统微控制器基于累加器的ALU结构及算术逻辑指令; 并在指令执行时序上尽量减少指令执行所需的时钟周期。通过仿真验证证明该设计方法提高了指令的执行效率和微控制器的运行效率, 同时避免了通常采用并行处理设计中多级流水线设计带来的内部复杂的控制逻辑设计。
  在嵌入式系统的设计中, IP技术为SoC的设计提供了有效途径, 是SoC的技术支撑。当然, 在国内开发出具有自主知识产权的IP模块还面临着许多问题, 如核心算法的优化、不同层次模块的建立、模块的可重用问题以及IP模块的标准化问题等。对于嵌入式处理器IP 核, 面对的挑战就是如何选择一个满足其应用需求的处理器。现已有数百种嵌入式处理器, 每组都具备一组不同的外设、存储器接口和性能特性, 用户很难做出一个合理的选择。本文设计的微处理器的指令集与标准8051单片机完全兼容, 这样有利于开发人员的使用。
  1 总体设计方案的拟定
  1.1 提出改进方案
  首先在对典型八位微处理器进行了详尽地剖析的基础上, 指出在传统典型微处理器内核中制约微处理器整体性能的主要因素, 然后提出以下改进方案:
  (1) 微处理器的内核结构上, 将乘、除法单元各自独立出来来完成算术逻辑指令中的乘、除法运算。这样可以回避传统典型微处理器基于累加器的ALU结构及算术逻辑指令, 从而提高逻辑指令的执行效率。
  (2) 在指令系统上, 通过采用类RISC的指令系统和硬布线直接产生控制信号的方式来简化指令译码器的设计。同时为内核添加指令缓冲区、采用指令流水线技术、多管道并行执行指令。
  (3) 指令时序上, 设计中尽量减少指令执行所需的时钟周期, 提高微处理器的运行效率。
  1.2 总体设计思路
  根据IP core通用的设计方法, 本文采用了标准的自顶向下的设计方法。就是根据系统级的内容,把系统划分为单元, 然后再把每个单元划分为下一层次的单元, 这样一直划分下去, 直到最底层的单元可以用硬件描述语言进行设计, 如图1所示; 接着在完成各个模块设计的基础上完成系统级设计;然后进行整个系统的仿真验证; 最后选用特定的FPGA芯片进行综合、布局布线以及功能后仿真。
图1 微处理器系统级划分图
  2 各子模块的设计
  2.1 ALU模块
  算术逻辑单元(ALU) 是微控制器的核心部件, ALU的设计依赖于指令系统, ALU采用什么样的结构、设置那些功能都是建立在对系统指令集分析的基础上来完成。
  根据算术运算类指令可知, ALU单元主要要完成的功能有: 带/不带进位加/减法、乘法、除法、十进制调整、逻辑运算以及布尔操作的实现。整个操作的完成是通过多路选择器控制来完成。因此, 我们可以对整个ALU系统进行如图2划分, 然后对各个子模块进行设计。
图2 ALU系统划分框图

相关帖子

沙发
中国无芯|  楼主 | 2012-1-28 19:47 | 只看该作者
  2.2 控制通路的设计
  本文中的控制通路由译码器模块和控制器模块两部分组成。这部分的设计是在对指令系统进行正确分析的基础上来完成。
  设计控制通路有两种主要的方法。微程序控制(或微序列控制) 方式使用存储器查表方式来输出控制信号, 而硬连线控制使用时序逻辑和组合逻辑来产生控制信号。硬件直接实现的控制单元一般用有限状态机实现, 通常有较高的运算速度;但是通用性差, 每个电路都必须专门设计控制单元。每一种方法都有一些变形形式。由于本文中微处理器的控制相对简单, 所以在设计中采用了硬连线控制方法。
(1) 控制器模块的状态机实现
  根据本文中多数输出要保持一个完整的时钟周期, 此时钟周期内输出不能受时钟信号的影响,所以采用Moore型有限状态机来完成控制器模块的设计。整个控制模块的设计通过主状态机和子状态机两步来完成。注状态机模型如图3所示。
图3 控制单元的主状态机模型
  以中断处理子状态机设计为例, 对子状态机的设计进行说明, 状态转换图如图4所示。
图4 中断处理状态机状态转换图
  (2) 存储器模块的设计
  存储器是数字系统的重要组成部分, 数据处理单元的处理结果需要存储, 许多处理单元的初始化数据也需要存放在存储器中。本文的存储器结构, 采用的是将程序存储器和数据存储器分开寻址的哈佛结构。同时又将数据存储器分为内部数据存储器和外部数据存储器两部分来设计。
  (3) 中断系统设计
  本文中的中断系统在控制通路来完成, 共提供了5个中断源, 同时通过对中断优先级寄存器IP中的某位的置位或清除, 可以把每个中断源分别编程为高优先级或低优先级。如表1所示。
表1 中断源表
  (4) 定时器/计数器模块的设计
  定时器/计数器是微处理器中重要的外围模块,它主要是完成作为定时器和事件计数器的功能。
  在作为定时器工作时, 每一个机器周期使定时寄存器加1计数。在作为事件计数器工作时, 是对外部输入负跳变信号做加法计数, 规定在每个机器周期的某一状态采样此信号, 在前一个周期采样到"1", 后一个周期采样到"0" 时计数加1, 而在检测到跳变信号后的那个周期的下一个状态时,新的计数值装入计数寄存器。

使用特权

评论回复
板凳
中国无芯|  楼主 | 2012-1-28 19:48 | 只看该作者
  3 系统综合、仿真验证与性能分析
  在整个微处理器IP核的设计过程中, 利用可编程逻辑器件进行电路验证对于保证设计的正确性和投片成功十分重要。在FPGA的设计流程中包括三种基本的验证方法: HDL、RTL级描述仿真, 门级仿真和布线后的时序仿真。具体验证流程如图5所示。仿真的目的就是要确认设计的正确性。如果出错的话, 则通过分析仿真器的输出波形, 找出出错的原因, 并对原设计进行修改。
图5 系统验证流图
3.1 仿真验证
  验证方法: 首先编写各种测试代码; 然后转化为vhdl文件, 再写入ROM模块; 最后在仿真环境中运行IP核, 完成对整个系统的全指令集测试。一般内部RAM和寄存器的值无法直接检测, 可以通过多条指令将其输出到IP核的四个输出端口供检查。本文采用Model Tech公司的仿真工具Moledsim来进行功能仿真和时序仿真。
  图6是对基本子程序调用指令的测试仿真时序。包括子程序调用、传送、加法以及返回等指令。根据测试指令集, 如果程序执行正确, 那么在程序执行完后, 输出端口P0口就会出现21H。
图6 基本子程序调用指令的测试仿真波形图
  测试指令集: MOV A, #20H; ACALL DELEY;MOV P0, A; DELAY: INC A; MOV P0, A。
  3.2 综合及综合结果分析
  本文中的综合及优化都是由综合工具SynplifyPro来完成的。利用Synplify Pro工具提供的逻辑综合与适配工具和设计的约束条件, 可以方便的实现本文各模块的逻辑综合和布局布线。
  对于本文中的八位微处理器来说, 由于它是一个非常复杂的数字逻辑电路, 不仅包含大量的组合逻辑电路, 而且包含了时序复杂的时序逻辑电路。通过逻辑综合估计整个系统超过一百万门,因此要用大容量的可编程逻辑器件来做电路验证。
  通过比较各种可编程逻辑器件的性能和结构特点(见表2), 决定采用器件Xilinx Virtex2 XC2V1000bg575-6来完成本文的电路验证。
表2 Virtex2系列器件性能和结构特点表
  综合结果分析主要是利用结构视图、综合报告分析综合结果是否满足时序要求, 分析综合的频率、面积等信息。
  3.3 性能分析
  本文的器件资源的占用情况如表3.(由于内部存储器要占用很多的资源, 故此表列出的是缩减内部内存后器件的资源占用情况)。
表3 器件资源占用情况表
  将经过FPGA验证的MCU核与传统的微处理器做比较, 可以看出, 由于所设计的微处理器核是采用硬布线逻辑产生控制信号, 所以其工作时钟频率要大大优于传统的微处理器。FPGA验证的结果是, 工作时钟频率大于60MHz, 是传统微控制器工作时钟频率的五倍; 在每MHz时钟频率的指令执行效率指标上, 所设计微处理器核的性能约为传统微控制器的12倍。这得益于微控制器内核采用类RISC指令结构, 及设计指令执行周期的大大减小。
  4 结束语
  由于整个微控制器内核都是采用可综合的VHDL语言描述, 这使得该内核具有很好的可移植性、可重复利用性和实用性。也可以适当地拓宽数据总线的宽度, 以减少内存访问的次数, 从而提高指令执行效率。此外, 还可借助EDA工具,方便地与AD/DA转换器LCD显示驱动器、串行通信接口等外围功能模块综合成各种嵌入式控制系统

使用特权

评论回复
地板
秋天落叶| | 2012-1-28 22:39 | 只看该作者
这个难度应该不小

使用特权

评论回复
5
nongfuxu| | 2012-1-29 10:29 | 只看该作者
路过此贴。
没有微软的英特尔成就不了现在的INSIDE

使用特权

评论回复
发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

0

主题

103

帖子

1

粉丝