本帖最后由 cjseng 于 2013-5-16 14:32 编辑
gx_huang 发表于 2013-5-16 13:40 
秀才遇到兵,有理说不清。
有些产品,必须可靠,比如工控,安全相关产品,无人值守的。
有些产品,要求可 ...
对,就是要确保可靠,所以,我认为死机是一种常态,死机是经常发生的,我们要做的是如何确保死机之后还能自动恢复。
我有个朋友,做的是超速抓拍设备,装在高速公路上,是无人值守的,用的是俄罗斯的雷达,但是这个雷达会不定期死机。客户要我帮他解决这个问题,我就是给他做了一个简单的电路,每天凌晨00:00时断开电源一分钟再接通,这样就解决了这个问题。
还有个朋友,是做监控工程的,他遇到一个问题就是硬盘录像机会不定期死机,我也给他做了个电路,电路监控硬盘录像机的指示灯,指示灯长时间不闪了,就认为死机,就给他断电重启。
再举个例子,我自己做的交通信号机,硬件上就是双机备份,主机死掉了立刻切换到从机,同时主机重启,重启成功后切换回主机控制,三次重启不成功,则不再尝试重启,接下来一直由从机控制。从机控制时,指挥中心的系统软件将会失去应答信号,从而知道主机出现故障。
当然,设计的时候要考虑抗干扰、提高产品可靠性,这属于预防灾害,但是不能光靠预防,说不定有的时候考虑欠妥,还有遗漏的地方,实际上遗漏总是难免的,所以还要重视灾后重建。
|