打印
[嵌入式Linux]

ARM芯片CN9130采用内存存压力测试工具memtester死机

[复制链接]
2514|3
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
ysdx|  楼主 | 2023-11-3 17:47 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
ARM芯片采用内存存压力测试工具memtester死机:芯片是MARVELL 的CN9131。配一条SODIM内存,内存本身是2666的,16G容量。实际跑2400. 如果仅仅跑memtester,跑多久都没事。但是如果CPU 4个核都跑满100%,16G内存跑14G测试,八块板子有一块测试14小时突然死了(串口没有反应了,正常是不断刷memtester信息的)。其余的跑了一天了没事,还在继续跑着。
查出问题的板子核电:0.862V(数据手册0.82~0.88),芯片最大需求不到10A,电源设计是按照20A设计的(JW5087芯片)。W5087限流电阻设置也是按照最大设置的6.49k。核电的PG信号关联复位(如果异常,应该复位才对)。 内存电1.2V很准。测量电源纹波质量都很好,也很稳定。25MHZ时钟晶体正常,波形良好,复位信号高。板子CPU散热器有风扇,模散热器微微有点温。测试是常温下测试,整个板子没有特别烫的器件。系统是麒麟系统。
因此基本排除过温导致的问题,也不大可能是电流不够导致的。内存也不像:内存如果报错,一般会有串口报错信息然后挂掉。
由于测量时间很长才复现,又是突然就挂了,都没有办法设置调试信息。
后续排除方向迷茫了,有经验的朋友帮忙分析一下。

使用特权

评论回复
沙发
zhanglinux| | 2023-11-6 23:03 | 只看该作者
赞!!!!!!!!!!!!!!

使用特权

评论回复
板凳
ysdx|  楼主 | 2023-11-7 17:09 | 只看该作者
跑到现在,几天了,就第一台出了问题,其余的都正常。由于是客户发现这个问题,我们拿几套板子测试定位。都不知道下一步如何办了。

使用特权

评论回复
地板
ysdx|  楼主 | 2023-11-15 17:44 | 只看该作者
都跑一周多了,再没有出问题。第一个出问题的重跑也没有出。这玩意郁闷死了。

使用特权

评论回复
发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

338

主题

1055

帖子

21

粉丝