ARM芯片采用内存存压力测试工具memtester死机:芯片是MARVELL 的CN9131。配一条SODIM内存,内存本身是2666的,16G容量。实际跑2400. 如果仅仅跑memtester,跑多久都没事。但是如果CPU 4个核都跑满100%,16G内存跑14G测试,八块板子有一块测试14小时突然死了(串口没有反应了,正常是不断刷memtester信息的)。其余的跑了一天了没事,还在继续跑着。
查出问题的板子核电:0.862V(数据手册0.82~0.88),芯片最大需求不到10A,电源设计是按照20A设计的(JW5087芯片)。W5087限流电阻设置也是按照最大设置的6.49k。核电的PG信号关联复位(如果异常,应该复位才对)。 内存电1.2V很准。测量电源纹波质量都很好,也很稳定。25MHZ时钟晶体正常,波形良好,复位信号高。板子CPU散热器有风扇,模散热器微微有点温。测试是常温下测试,整个板子没有特别烫的器件。系统是麒麟系统。
因此基本排除过温导致的问题,也不大可能是电流不够导致的。内存也不像:内存如果报错,一般会有串口报错信息然后挂掉。
由于测量时间很长才复现,又是突然就挂了,都没有办法设置调试信息。
后续排除方向迷茫了,有经验的朋友帮忙分析一下。 |