事情发生的过程是这样的
有一天突然收到亚马逊amazon的邮件说我的web服务cpu over max , memory 也over max 了 ,这一刻,我的内心是崩溃的 , 心里设想了一万种意外和不可能是程序问题的理由 . 事实是太天真了,不是程序问题才怪 . 临时处理方式是重启服务 ,毕竟内存和cpu使用率爆棚还是需要很长时间的 , 这段时间可以排查到底是因为什么 .
一些可能导致OOM即内存溢出的原因
1和2设置过小的问题
逐个比较好解决 , 合理增大设置或增大硬件物理内存即可 ,这里可能要说的是metaspace如果不设置会有一个默认值 , 会很小 , 但是它会在不够用的时候自动增大 ,直逼最大物理内存 .(此变更可以某种程度是可以避免OOM)具体请百度或Google本人不再赘述 .
3 代码中创建了很多大对象 , 且一直因为被引用不能被回收
第一步,使用jmap -heap pid查看堆使用情况
第二步, 使用jmap -histo:live pid 查看实例数和实例所占内存大小
第三步, 统计所有实例所占内存大小
jmap -histo:live 17863|awk ‘{if(NR>3)a+=$3}END{print a}’
233455600
这个单位是byte , 换算后222.64061MB
大对象倒是没有 , 但是[C代表字符的数组占用了大多数的内存空间 , 虽然现在讲示例时它占得少 ,实际当内存接近90%时 ,字符数组还是在第一位 .([B表示布尔数组]) , 结论是不存在特别多的大对象占用了内存空间 , 字符数组虽然也占了很多内存但不是导致内存溢出的主要原因.
jvm内存过高及那些对象导致内存过高,那些对象不会被gc回收
原文:https://www.cnblogs.com/albertzhangyu/p/9718033.html