很是郁闷,大家分析一下,到底是哪部分出了问题!

[复制链接]
3179|12
 楼主| 老狼 发表于 2007-3-22 15:51 | 显示全部楼层 |阅读模式
该台设备运行一年以上,一直很正常,最近运行过程中发现结果都是错的,原本考虑是硬件出了问题,在实验室测试发现,如果是某一个通道出了问题(只要不是启动电压回路),则该条线路不能正确指示,其它线路正常,所以怀疑是公共通道出了问题(就是&nbsp;高速开关,&nbsp;ad,或者是at4008),造成装置不能正常动作,at4008的工作灯闪烁正常,应该没有出问题。而且,at4008放狗了!复位芯片用的时MAX6135.<br />现场调试<br />1:没有动设备,没有重新上电,直接用仿真器通过JTAG口进行仿真,看到采样数据各通道都相同,均为&nbsp;0x5bxx,&nbsp;这种情况一样也发生过(以前出现过带电热插拔核心板时,ad芯片发热的时候,可能会出现各通道的采样数据相同),但是用手摸ad芯片,发现没有发热,怀疑是40008的数据总线出了问题,重新复位ARM,发现工作灯闪烁正常,说明ARM的程序由flash,加载到ram的过程是能够正常完成的,可以认为40008外部数据总线未发生异常。则问题可能是模拟通道部分。<br />2:将ARM板拔下,重新插入新的板卡,再采样,发现采样数据各通道都正常了,说明应该是ARM板出了问题,再一次插入有问题的ARM板,发现这个ARM板上的AD7665发热严重,只能拔下,等AD7665温度降到正常后,再一次插入,发现AD7665发热严重,又拔下,怀疑该7665有问题。<br />3:用新的arm板插入设备,用仿真器观察每条通道的数据情况,发现都正常了,调试到此结束。<br /><br />回公司后<br />1:将有问题的ARM板,连同现场换下来的运放板,插入设备,发现个通道的数据都正常了。莫名其妙,能够正常动作。<br />2:将有问题的ARM板&nbsp;插入,拔下&nbsp;几十次,均未发现AD7665发热现象。<br /><br />很是郁闷,大家分析一下,到底是哪部分出了问题!<br />
 楼主| 老狼 发表于 2007-3-23 11:42 | 显示全部楼层

没人回复 ,顶一下!

  
 楼主| 老狼 发表于 2007-3-23 14:09 | 显示全部楼层

今天我又有了点想法!

我想问一下,如果看门狗复位了,或者是通过JTAG复位,AT40008的具体状态,除了PC和CPSR外的所有寄存器都不确定。<br />会不会出现复位后,数据总线没有复位,虽然程序中对数据总线部分寄存器的又进行了操作,但是无法解释:重新复位ARM,发现工作灯闪烁正常,说明ARM的程序由flash,加载到ram的过程是能够正常完成的,可以认为40008外部数据总线未发生异常。<br />今天我又有了点想法!<br />1:工作灯闪烁正常,这部分是在定时中断中完成的,不太合理,应该在定时中断中置位,主程序中取反,这样就会像外置看门狗一样,可以同时监视主程序和定时中断程序。<br />2:ARM应该加外置的看门狗,内狗的操作方式不太好,只是不断的刷新一个寄存器,很容易照成死锁,起不到看门狗的作用。<br />3:系统的设计没有加电源管理芯片,昨天看了zlg公司的一篇**,讲电源管理芯片的,看来这部分的认识还不够。我只是在程序中加了软件陷阱,想通过程序跑飞的捕捉,来达到复位的目的。<br />4:假设ad7665的工作状态不正常,一直处于数据输出状态,并且如果ad7665的CS端没有选通时,这时数据总线没有数据,那么ARM的程序由flash,加载到ram的过程是能够正常完成的,ad7665的操作一直没有被重新写入,当断电后,将ARM板拔下,重新插入板卡,再采样,ad7665的状态被成功的由不正常状态拉回来了,于是,采样数据各通道都正常了,是不是能解释这种现象呢?<br />当然也可能是数据总线上的其他器件出了问题,但是肯定不是RAM&nbsp;OR&nbsp;flash.
 楼主| 老狼 发表于 2007-3-23 15:22 | 显示全部楼层

目前为止,这种故障就这么一台!

但是我的设备要求五年以上无故障运行,出事这台才一年多时间,我给其他用户打电话了,最长的运行快2年时间了,也没出事,隐患必须干掉,否则,5年后,谁还买我们公司的产品!<br />钱都到手,更应该对用户负责!<br /><br />常走夜路中能碰到鬼,但是总的看看鬼是啥样的吧!<br /><br />其实这种问题,如果要解决,也由简单的方法,我可以让设备3-5天复位一次(玩狠的,用继电器让设备断一次电),就像服务器那样,这种事就像鬼子进村一样,悄悄的干,但是这样是不是太不负责认了。而且,如果这样干一辈子,就是一个半瓶子,有啥意思!<br />
wangkj 发表于 2007-3-23 21:03 | 显示全部楼层

告诉你个秘密

号称24*7的最牛的路由器,也是偷偷的重新启动!<br />一般选择在最少使用的时候。<br />这是华为的一个老工程师告诉我们的。<br /><br />连续5年不停机,太猛了。对软件硬件的要求都很高啊。<br /><br />我觉得你的现象可能是现场的干扰。不知道你们作没作干扰测试。<br />或者器件脏了或者有水气,到实验室干了,有没问题了。<br /><br />这种问题,确实很难查。
 楼主| 老狼 发表于 2007-3-23 23:23 | 显示全部楼层

wangkj

每次有机会接触到国外的设备(大公司),我都会偷偷的拆开看看,感慨呀,差距太大了,我们的设备只是完成功能,其他的方面就谈不上。可惜没有机会拿到全套的软硬件资料,好好研究一下!<br /><br />干扰测试----形式实验作过了!<br /><br />
 楼主| 老狼 发表于 2007-3-23 23:29 | 显示全部楼层

看的人多,帮忙的太少!!!

太不仗义了吧!!&quot;仗义!&quot;-----&quot;假仗义!&quot;<br />
浪淘沙 发表于 2007-3-23 23:35 | 显示全部楼层

好的产品设计是靠多年的积累

我们接触的很多高质量客户,他们在产品设计中有很多严格的设计规范,这些都是由以前经验的总结得来;同时他们也有许多制度上的措施,保证产品的质量和可靠性。
xwj 发表于 2007-3-23 23:48 | 显示全部楼层

来人,把楼主拉出去杖打壹佰大板!

够“杖义”了吧?
 楼主| 老狼 发表于 2007-3-24 22:17 | 显示全部楼层

没有新的进展!

已经搞得鼻青脸肿了,再拉出去杖打壹佰大板!也太没有人性了!<br />希望大家能提点有建设性的意见!
wangkj 发表于 2007-3-24 23:21 | 显示全部楼层

不是干那行的确实给你帮不上忙。

我们从来没有过这种7*24小时的要求。
 楼主| 老狼 发表于 2007-3-30 15:30 | 显示全部楼层

这里有做产品可靠性分析的么?

很想交流一下!<br />感觉论坛里做产品的很少。<br />to&nbsp;wangkj:<br />&nbsp;&nbsp;&nbsp;你新搞的那个旋转LED的东西没有&nbsp;7*24小时的要求么?
mohanwei 发表于 2007-3-31 16:50 | 显示全部楼层

可靠性……从何谈起啊……

很多公司一个产品就几个甚至只有1个人干,硬件软件PCB全包,什么都只能都是自己说了算,只求“有”……<br /><br />等到你足够“牛”了,也就是该拍拍屁股的时候了
您需要登录后才可以回帖 登录 | 注册

本版积分规则

55

主题

956

帖子

3

粉丝
快速回复 在线客服 返回列表 返回顶部