打印

请问如何解决在高温的情况下死机的问题

[复制链接]
4477|22
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
livence|  楼主 | 2007-5-8 13:58 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
请问各位资深同行:我在调试一个系统时,仿真板平时在常温下工作时候,基本上不会出现死机的情况。可是一到高温测试的场合,很快就会出现死机的情况。初步看下来是SDRAM会出错,判定可能是SDRAM的问题;现在sdram的时钟是调到168MHz(但是SDRAM是-60的,型号是三星的K4S281632I-60),请问在这种情况下如何避免高温死机的情况?

相关帖子

沙发
chunyang| | 2007-5-8 14:06 | 只看该作者

只能更换合适的器件

另外要看一下电源在高温下的品质。

使用特权

评论回复
板凳
livence|  楼主 | 2007-5-8 14:31 | 只看该作者

谢谢你的回答

具体情况是这样的:我这次测试的仿真板是我第二次做的板,是高温的情况下会死机的版本;但是我第一次做的板,即这次的前一批,高温测试是不会死机的(相同的软件),器件也是相同的,这个让我有点捉不住头脑了。两个版本的PCB在其他的地方没有什么大的不同,不同的是在SDRAM和主芯片的连接上面。
由于第一板布线时,SDRAM的CLK信号线从主芯片出来经过了两个过孔,再到SDRAM芯片(RC网络是在负载端的);这种情况下不死机。但是我拿仿真板去做EMC试验时,板的电磁干扰比较大,故在第二版的时候,我更改了一下走线的方法,CLK信号从主芯片出来,直接到SDRAM的芯片脚,没有过孔(RC网络是在源端的);而两个版本的地址和数据线都是有两个过孔串入连接的;
这也是我怀疑是SDRAM的问题的原因所在。

使用特权

评论回复
地板
crazyin| | 2007-5-8 16:04 | 只看该作者

器件不同的批次是否相同?

使用特权

评论回复
5
chunyang| | 2007-5-8 16:19 | 只看该作者

跟PCB关系不大

要在同样电路、同样批次的元件下比对,不过既有此现象,也不能说明上次的设计或元件没有问题,只是临界值不同,这更要重视。

使用特权

评论回复
6
awey| | 2007-5-8 16:51 | 只看该作者

多高的温度?

有可能是干扰造成的,恒温箱的加热器的电源启停对电源有干扰

使用特权

评论回复
7
hzcook| | 2007-5-8 16:59 | 只看该作者

示波器看到SDRAM,CLK波形如何?

示波器看到SDRAM,CLK波形如何?
可以用软件降一定的频率,再做实验.看是否出同样现象?

使用特权

评论回复
8
livence|  楼主 | 2007-5-8 18:01 | 只看该作者

不好意思,刚才出去了一下,谢谢朋友们的回答

    我觉得元器件的批次不同应该问题也不大吧,因为我拿过现在的器件换到第一批的一块板子上面去,做高温试验(我做的高温试验的温度是50度),它照样不死机,将原来的器件吹下来换到第二版的板子上,它照样死机。我说的器件都是关键器件:主芯片和SDRAM两片。
    还有恒温箱我是这样处理的,先把恒温箱打开,调到50度,再把机器放进去,在下次把机器拿出来之前,恒温箱是不会关电的,甚至恒温箱始终是不会关电的,我有这个条件。
    还有用示波器看SDRAM的CLK的波形,基本上接近于一个正弦波的形状。
    关于降频处理,我也做过了。由于要符合USB的12MHz的倍频要求,我下一次降频只能是168-12=156MHz,在这个频率下,做过高温测试,不会死机。但是在这个频率下的坏处就是,系统很卡,软件跑起来,很为难。因为开始如果我们能跑156MHz的话,我就不会冒着风险去超频了。
   还有chunyang兄的关于“...只是临界值不同,这更要重视”的观点,我对于这个临界值的保证感觉是没有什么把握

使用特权

评论回复
9
chunyang| | 2007-5-8 19:04 | 只看该作者

数字信号接近正弦波说明器件的带宽已经极限了

这是个很重要的信息。如果你的电路前后相同,一定要比较一下该点波形,如果类似,说明前者已处于临界,只是因局部电磁环境问题(PCB决定的)没有暴露,但不能说没有隐患,都是这样必须换更快速的芯片。

使用特权

评论回复
10
livence|  楼主 | 2007-5-8 19:25 | 只看该作者

多谢版主指导

    我还有个问题想问问,就是SDRAM的clk信号它到底应该是怎样的一个波形,是一般的数字信号的只有0和1的方波,还是本来就是一个正弦波(直接从锁相环出来的)?我看了一下第一板的CLK信号,也大概是一个正弦波的样子
    还有awey兄,不好意思,我刚才对恒温箱的启停的概念搞错了,不过我现在也无法知道它的电源启停对我的板子有什么影响...
    不过照版主的意思,像我这般超频2M的使用难度是比较大的吧,有没有什么可能呀? 

使用特权

评论回复
11
chunyang| | 2007-5-8 19:47 | 只看该作者

CLK信号应该是方波

至于锁相环输出波形要看锁相环的种类,这样用必须是方波输出的。超频2M应该问题不大,但信号的时序和质量要有保证。

使用特权

评论回复
12
平常人| | 2007-5-8 22:08 | 只看该作者

系统稳定性和可靠性有隐患

不好意思,对器件特性在系统稳定性中的作用不太在行,不便评论PCB、超频与温度的关系,但从软件的角度讲,系统稳定性和可靠性方面有隐患。

时钟频率从168MHz降到156MHz,你的软件系统就超负荷了,仅仅减少了(12/168)=7%左右,即在168MHz时CPU的利用率已经达到了95%左右,相信你的系统不是简单的同步系统,必然有中断、等待、甚至多线程结构,而且是要求有某种实时相应的系统(否则降频只会导致较慢运行不会造成功能障碍),这样的软件应在CPU的能力上有10%-15%以上的冗余才能稳定运行,保证功能正确;这个数值是我个人的经验值,暂时还没有详细的理论分析。

使用特权

评论回复
13
awey| | 2007-5-8 22:23 | 只看该作者

一般晶振上的波形是正弦波

而时钟信号理论上应该是方波才对。

看看是CLK的信号源的问题还是CLK上的负载过大引起的?

使用特权

评论回复
14
computer00| | 2007-5-8 22:53 | 只看该作者

楼主的时钟信号都160MHz了,如果要看到比较好的方波,

应该要能看到5次谐波,这样对示波器的带宽要求都上G了,如果楼主的示波器性能没有这么高,
看到像正弦波很正常的.有时甚至连示波器的探头都负荷不了,用X10会有所改善.

使用特权

评论回复
15
livence|  楼主 | 2007-5-8 23:35 | 只看该作者

汗。。。都是夜猫子,谢谢大家

    to平常人:你所说的我还不是很了解彻底,明天我找软件工程师讨论讨论,再跟你学习探讨。
    至于那个时钟形状的问题,反正我头脑里的印象时钟应该是方波,可是限于目前的条件,看到的只是正弦波,况且还是会抖动的。还有测量工具的问题,我手头有的一个标称是200MHz的示波器,提供示波器的公司的FAE说是可以测量到200MHz的周期信号的(当然它的采样率是蛮高的,肯定上G了),但是测下来还是读不准频率,不知道怎么回事(不过那个公司的测试人员帮我测的时候,拿的探头,太不像话了,居然拿以前卖给我们的40MHz的示波器上的探头,不过他很肯定的告诉我说,这个探头是没问题的)

使用特权

评论回复
16
dengquan| | 2007-5-9 12:08 | 只看该作者

回答的声音

我门单位的高电压控制单元曾经出现过高温度死机的情况,开始的时候我们以为与集成电路有关系,以后我在高温老化室实验了7天,终于确认了是晶体的厂家型号的问题,改进以后就好了。需要说明的是:晶体的上面具有菱形标志。但是这个晶体使用在其他的地方没有问题。因此我个人认为是硬件的设计上余量不足所引起的。希望对你有用!谢谢!

使用特权

评论回复
17
livence|  楼主 | 2007-5-9 12:47 | 只看该作者

了解

    谢谢!!我知道大概是硬件设计余量不足得缘故,前面已有同行提出,关键是我现在都不知道怎样去找出或者调整或者给出这个余量了...
    我就是来请教各位前辈的

使用特权

评论回复
18
cds_666| | 2007-5-9 13:11 | 只看该作者

比较频繁的中断程序尽量精简

比较频繁的中断程序尽量精简,能不放到中断程序的尽量不放进中断程序。

使用特权

评论回复
19
livence|  楼主 | 2007-5-10 15:04 | 只看该作者

re:关于时钟形状的问题

回复关于时钟波形
 chunyang 发表于 2007-5-8 19:47 技术交流 ←返回版面    

11楼: CLK信号应该是方波 

至于锁相环输出波形要看锁相环的种类,这样用必须是方波输出的。超频2M应该问题不大,但信号的时序和质量要有保证。




签名:

 awey 发表于 2007-5-8 22:23 技术交流 ←返回版面    

13楼: 一般晶振上的波形是正弦波 

而时钟信号理论上应该是方波才对。

看看是CLK的信号源的问题还是CLK上的负载过大引起的? 
 
----------------------------------
 
    今天我问了一下我这个主芯片的生产商的FAE,他说从芯片时钟端输出的SDRAM时钟波形是正弦波,不是方波 

 
 

使用特权

评论回复
20
杨真人| | 2007-5-10 16:24 | 只看该作者

楼主设计PCB时有没有考虑到信号完整性?

也许这个问题被忽略了。当温度升高,器件工作点不同了,信号完整性的重要程度被抬高了。时序和波形的不理想造成数据读写错误。

使用特权

评论回复
发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

1

主题

8

帖子

1

粉丝