一般来说,系统总是由多个子系统组成,而子系统又是由更小的子系统组成,直到细分到电阻器、电容器、电感、晶体管、集成电路、机械零件等小元件的复杂组合,其中任何一个元件发生故障都会成为系统出现故障的原因。因此,硬件可靠性设计在保证元器件可靠性的基础上,既要考虑单一控制单元的可靠性设计,更要考虑整个控制系统的可靠性设计。
影响硬件可靠性的因素元件失效 元件失效有三种:
元件本身的缺陷,如硅裂、漏气等
加工过程、环境条件的变化加速了元件、组件的失效
工艺问题,如焊接不牢、筛选不严等
设计不当 在计算机控制系统中,许多元器件发生的故障并不是元件本身的问题,而是系统设计不合理或元器件使用不当所造成。 在设计过程中,如何正确使用各种型号的元器件或集成电路,是提高硬件可靠性不可忽视的重要因素。
电气性能 元器件的电气性能是指元器件所能承受的电压、电流、电容、功率等的能力,在使用时要注意元器件的电气性能,不能超限使用。环境条件 计算机控制系统的工作环境有时相当恶劣,由于环境因素的影响,不少系统的实验室试验情况虽然良好,但安装到现场并长期运行就频出故障。其原因是多方面的,包括温度、干扰、电源、现场空气等对硬件的影响。因此,设计系统时,应考虑环境条件对硬件参数的影响,元件设备须经老化试验处理。组装工艺 在硬件设计中,组装工艺直接影响硬件系统的可靠性。由于工艺原因引起的故障很难定位排除,一个焊点的虚焊或似接非接很可能导致整个系统在工作过程中不时地出现工作不正常现象。另外,设计印制电路板时应考虑元器件的布局、引线的走向、引线的分类排序等。提高硬件可靠性的一般方法 在计算机控制系统的整体设计中,如何提高系统硬件的可靠性是整个系统设计的关键,系统硬件设计时常需采用必要的可靠性措施:电路设计 据统计,影响计算机控制系统可靠性的因素约45%来自系统设计。为了保证系统的可靠性,在对其电路设计时应考虑最极端的情况。 各种电子元器件的特性不可能是一个恒定值,总是在其额定(典型)参数的某个范围内;同时,电源、电压也有一个波动范围。最坏的设计方法是考虑所有元件的公差,并取其最不利的数值核算电路每一个规定的特性。如果这一组参数值能保证电路正常工作,那么在公差范围内的其他所有元件值都能使电路可靠地工作。 在设计应用系统电路时,还要根据元器件的失效特征及其使用场所采取相应的措施,对容易产生短路的部件以串联方式复制,对容易产生开路的部分以并联方式复制。元器件选择 在确定元器件参数之后,还要确定元器件的型号,这主要取决于电路所允许的公差范围。由于制造工艺所限,有些元器件参数的公差范围可能较大,如电容器电容量等。另外,元件或器件的额定工作条件包括多个方面(如电流、电压、频率、机械参数以及环境温度等),设计时要考虑参数裕量,并在运行时尽量保证接近元器件的设计工作温度。结构设计 结构可靠性设计是硬件可靠性设计的最后阶段。结构设计时,首先应注意元器件及部件的安装方式,其次是控制系统工作环境的条件(如通风、除湿、防尘等)。噪声抑制 噪声对模拟电路的影响会直接影响系统精度,噪声对数字电路也会造成误动作。因此,在工程设计中必须采用噪声抑制和屏蔽措施。对于模拟应用系统,可在电源端增加一些低通滤波电路来抑制由电源引入的干扰;对于数字系统,通常采用滤波器和接地系统;同时,在整体结构布局时应注意元器件的位置和信号线的走向。对于电磁干扰、电场干扰可采用电磁屏蔽、静电屏蔽来隔离噪声,也可采用接地、去耦电容等措施来减少噪声的影响。冗余设计 硬件冗余设计可以在元件级、子系统级或系统级上进行,必然增加硬件和成本。因此,设计时应仔细权衡采用硬件冗余的利弊关系。在计算机控制系统中,主要采用控制单元冗余和控制系统冗余来提高系统硬件可靠性。单元可靠性设计 控制与接口单元是指能独立完成某些测控功能的功能模块,其可靠性设计主要包括微处理器系统的冗余设计、输入输出通道干扰的抑制、电源系统干扰的抑制、控制单元运行状态的监视等。I/O通道干扰的抑制 模拟量输入通道常态干扰的频率通常高于被测信号的频率,因此可考虑采用滤波网络对模拟量输入信号进行滤波。可采用各种形式的金属屏蔽层做好信号传送线路的屏蔽工作,将信号线与外界电磁场有效地隔离开来;在系统既有模拟电路又有数字电路时,数字地与模拟地要分开,最后只在一点相连,以防相互干扰。I/O通道一般应采用光电耦合器进行电气隔离,既可避免构成地环路,还可有效地抑制噪声。另外,在输入输出通道上应采用一定的过压保护电路。电源系统干扰的抑制 同一电源网路上有较多大功率设备时,在控制单元与供电电源之间可加入三相隔离变压器,以防止电网干扰侵入控制系统。在整机的电源线入口处,可通过增加电源滤波器来防止其他电子设备与本系统之间产生相互干扰。在机内独立的印刷板上应安装小型电源滤波器,以防止板与板之间的相互干扰。 由于开关电源具有较强的抗工频电压波动和频率波动能力,同时能隔离从电源线进入的传导干扰,适当场合可选用开关电源。必要时,系统输入输出通道和其他设备可考虑采用独立的供电电源,实行电源分组供电。另外,逻辑电路板上的直流电源线和接地线要注意合理布线。控制单元运行状态监视 可使用看门狗定时器(WDT)监视控制单元的运行状态。WDT的输出直接连到CPU的中断请求端或控制单元的复位端,WDT的每次“定时到”溢出脉冲信号均能引起CPU的中断或复位。WDT受CPU控制,可对其重新设置时间常数或刷新。 定时器重新开始计时,只要程序正常运行就不会产生定时中断或系统复位。一旦程序执行出错或发生程序乱飞、死机现象,看门狗定时器就会产生溢出脉冲信号,引起定时中断或复位,从而使控制单元重新启动或进入中断服务程序进行纠错处理。控制单元的掉电保护 对付电网瞬间断电或电压突然下降的有效方法就是掉电保护,对计算机测控系统可外加不间断电源(UPS),对测控系统中的控制单元可增加掉电保护电路,并慎重设计。掉电信号由硬件电路检测,加到控制单元CPU的外部中断输入端。软件中断将掉电中断规定为高级中断,使控制单元CPU能及时对掉电做出反应。在掉电中断子程序中,首先进行现场保护,保存当时重要的状态参数。当电源恢复正常时,CPU重新复位,恢复现场并继续未完成的工作。控制单元冗余设计 |