打印

很是郁闷,大家分析一下,到底是哪部分出了问题!

[复制链接]
2214|12
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
老狼|  楼主 | 2007-3-22 15:51 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
该台设备运行一年以上,一直很正常,最近运行过程中发现结果都是错的,原本考虑是硬件出了问题,在实验室测试发现,如果是某一个通道出了问题(只要不是启动电压回路),则该条线路不能正确指示,其它线路正常,所以怀疑是公共通道出了问题(就是 高速开关, ad,或者是at4008),造成装置不能正常动作,at4008的工作灯闪烁正常,应该没有出问题。而且,at4008放狗了!复位芯片用的时MAX6135.
现场调试
1:没有动设备,没有重新上电,直接用仿真器通过JTAG口进行仿真,看到采样数据各通道都相同,均为 0x5bxx, 这种情况一样也发生过(以前出现过带电热插拔核心板时,ad芯片发热的时候,可能会出现各通道的采样数据相同),但是用手摸ad芯片,发现没有发热,怀疑是40008的数据总线出了问题,重新复位ARM,发现工作灯闪烁正常,说明ARM的程序由flash,加载到ram的过程是能够正常完成的,可以认为40008外部数据总线未发生异常。则问题可能是模拟通道部分。
2:将ARM板拔下,重新插入新的板卡,再采样,发现采样数据各通道都正常了,说明应该是ARM板出了问题,再一次插入有问题的ARM板,发现这个ARM板上的AD7665发热严重,只能拔下,等AD7665温度降到正常后,再一次插入,发现AD7665发热严重,又拔下,怀疑该7665有问题。
3:用新的arm板插入设备,用仿真器观察每条通道的数据情况,发现都正常了,调试到此结束。

回公司后
1:将有问题的ARM板,连同现场换下来的运放板,插入设备,发现个通道的数据都正常了。莫名其妙,能够正常动作。
2:将有问题的ARM板 插入,拔下 几十次,均未发现AD7665发热现象。

很是郁闷,大家分析一下,到底是哪部分出了问题!

相关帖子

沙发
老狼|  楼主 | 2007-3-23 11:42 | 只看该作者

没人回复 ,顶一下!

使用特权

评论回复
板凳
老狼|  楼主 | 2007-3-23 14:09 | 只看该作者

今天我又有了点想法!

我想问一下,如果看门狗复位了,或者是通过JTAG复位,AT40008的具体状态,除了PC和CPSR外的所有寄存器都不确定。
会不会出现复位后,数据总线没有复位,虽然程序中对数据总线部分寄存器的又进行了操作,但是无法解释:重新复位ARM,发现工作灯闪烁正常,说明ARM的程序由flash,加载到ram的过程是能够正常完成的,可以认为40008外部数据总线未发生异常。
今天我又有了点想法!
1:工作灯闪烁正常,这部分是在定时中断中完成的,不太合理,应该在定时中断中置位,主程序中取反,这样就会像外置看门狗一样,可以同时监视主程序和定时中断程序。
2:ARM应该加外置的看门狗,内狗的操作方式不太好,只是不断的刷新一个寄存器,很容易照成死锁,起不到看门狗的作用。
3:系统的设计没有加电源管理芯片,昨天看了zlg公司的一篇**,讲电源管理芯片的,看来这部分的认识还不够。我只是在程序中加了软件陷阱,想通过程序跑飞的捕捉,来达到复位的目的。
4:假设ad7665的工作状态不正常,一直处于数据输出状态,并且如果ad7665的CS端没有选通时,这时数据总线没有数据,那么ARM的程序由flash,加载到ram的过程是能够正常完成的,ad7665的操作一直没有被重新写入,当断电后,将ARM板拔下,重新插入板卡,再采样,ad7665的状态被成功的由不正常状态拉回来了,于是,采样数据各通道都正常了,是不是能解释这种现象呢?
当然也可能是数据总线上的其他器件出了问题,但是肯定不是RAM OR flash.

使用特权

评论回复
地板
老狼|  楼主 | 2007-3-23 15:22 | 只看该作者

目前为止,这种故障就这么一台!

但是我的设备要求五年以上无故障运行,出事这台才一年多时间,我给其他用户打电话了,最长的运行快2年时间了,也没出事,隐患必须干掉,否则,5年后,谁还买我们公司的产品!
钱都到手,更应该对用户负责!

常走夜路中能碰到鬼,但是总的看看鬼是啥样的吧!

其实这种问题,如果要解决,也由简单的方法,我可以让设备3-5天复位一次(玩狠的,用继电器让设备断一次电),就像服务器那样,这种事就像鬼子进村一样,悄悄的干,但是这样是不是太不负责认了。而且,如果这样干一辈子,就是一个半瓶子,有啥意思!

使用特权

评论回复
5
wangkj| | 2007-3-23 21:03 | 只看该作者

告诉你个秘密

号称24*7的最牛的路由器,也是偷偷的重新启动!
一般选择在最少使用的时候。
这是华为的一个老工程师告诉我们的。

连续5年不停机,太猛了。对软件硬件的要求都很高啊。

我觉得你的现象可能是现场的干扰。不知道你们作没作干扰测试。
或者器件脏了或者有水气,到实验室干了,有没问题了。

这种问题,确实很难查。

使用特权

评论回复
6
老狼|  楼主 | 2007-3-23 23:23 | 只看该作者

wangkj

每次有机会接触到国外的设备(大公司),我都会偷偷的拆开看看,感慨呀,差距太大了,我们的设备只是完成功能,其他的方面就谈不上。可惜没有机会拿到全套的软硬件资料,好好研究一下!

干扰测试----形式实验作过了!

使用特权

评论回复
7
老狼|  楼主 | 2007-3-23 23:29 | 只看该作者

看的人多,帮忙的太少!!!

太不仗义了吧!!"仗义!"-----"假仗义!"

使用特权

评论回复
8
浪淘沙| | 2007-3-23 23:35 | 只看该作者

好的产品设计是靠多年的积累

我们接触的很多高质量客户,他们在产品设计中有很多严格的设计规范,这些都是由以前经验的总结得来;同时他们也有许多制度上的措施,保证产品的质量和可靠性。

使用特权

评论回复
9
xwj| | 2007-3-23 23:48 | 只看该作者

来人,把楼主拉出去杖打壹佰大板!

够“杖义”了吧?

使用特权

评论回复
10
老狼|  楼主 | 2007-3-24 22:17 | 只看该作者

没有新的进展!

已经搞得鼻青脸肿了,再拉出去杖打壹佰大板!也太没有人性了!
希望大家能提点有建设性的意见!

使用特权

评论回复
11
wangkj| | 2007-3-24 23:21 | 只看该作者

不是干那行的确实给你帮不上忙。

我们从来没有过这种7*24小时的要求。

使用特权

评论回复
12
老狼|  楼主 | 2007-3-30 15:30 | 只看该作者

这里有做产品可靠性分析的么?

很想交流一下!
感觉论坛里做产品的很少。
to wangkj:
   你新搞的那个旋转LED的东西没有 7*24小时的要求么?

使用特权

评论回复
13
mohanwei| | 2007-3-31 16:50 | 只看该作者

可靠性……从何谈起啊……

很多公司一个产品就几个甚至只有1个人干,硬件软件PCB全包,什么都只能都是自己说了算,只求“有”……

等到你足够“牛”了,也就是该拍拍屁股的时候了

使用特权

评论回复
发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

55

主题

956

帖子

3

粉丝