JVM技术专题内存问题分析和故障排查规划指南「实战篇」

Posted 浩宇の天尚

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了JVM技术专题内存问题分析和故障排查规划指南「实战篇」相关的知识,希望对你有一定的参考价值。

使用dstat和top查看内存使用最高的应用

使用dstat

查到内存占用最高的是java应用,使用2253M内存,但是这台服务器跑了好几个java,具体哪个进程使用top看下资源情况

使用top

可以看到java应用整体内存使用率超过了70%,其中pid为16494的进程 一个应用占了28.7的内存

定位线程问题

使用ps查看16494的线程情况

命令:ps p 16494 -L -o pcpu,pmem,pid,tid,time,tname,cmd

看到16494这个pid的应用产生了很多线程。

查看内存使用的堆栈

使用jstack查看

我们挑选了TID=17417的线程进行分析

在分析前需要将17417这个id转换为16进制,方便查找信息

[root@localhost ~]# printf "%x\\n" 17417
4409

16进制为4409

将pid为16494的应用打印到日志中

[root@localhost ~]# jstack -l 16494 > jstack.log

查看内存堆栈信息

[root@localhost ~]# vim jstack.log

在日志信息中查找刚刚转换的4409

可以看到这个线程状态为WAITING

通过查看日志发现有大量的 waiting on condition

parking to wait for <0x0000000085dce510>

存在大量线程等待被唤醒,占用大量内存

代码优化

将相应日志发送给相应开发,优化线程

补充:分析java线程占用cpu或者内存高的代码

  1. 通过top查看占用cpu或者内存高的进程截图如下【备注输入大写P以cpu从大到小排序,大写M以内存大小排序】

  1. 通过对应的cpu找到PID也就是进程对应的pid,然后找到java进程106854这个进程id

  2. 通过命令top -Hp PID 例如top -Hp 106854

就可以列出该进程下的所有线程id

  1. 输出大写的P查看线程占用cpu最高的或者通过大写M查看内存占用最高的

然后找到109391这个线程id

  1. 使用命令printf “%x\\n” 109391输出对应的十六进制码,1ab4f这个码是为了过滤线程id查到对应的代码

  1. 使用命令jstack PID| grep 1ab4f 【备注PID是进程的id,1ab4f是这个进程下的一个线程占用最高的cpu十六进制码】

  1. 通过上面的输出发现kafka,所以会联想到,kafka一直监听消息,所以消耗cpu,正常现象

  2. 如果出现自己写的类,说明需要修改代码逻辑了

以上是关于JVM技术专题内存问题分析和故障排查规划指南「实战篇」的主要内容,如果未能解决你的问题,请参考以下文章

JVM技术专题网络问题分析和故障排查规划指南「实战篇」

JVM故障问题排查心得「内存优化技术」Java虚拟机内存优化实战案例分析指南

JVM技术专题服务发生OOM故障定位方案「实战篇」

JVM故障问题排查心得「虚拟机线程问题」实战分析JVM线程导致CPU过载过高的问题排查方案

Redis故障排查「连接失败问题排查和解决」带你总体分析和整理Redis的问题故障实战开发指南及方案

JVM故障问题排查心得「线程诊断系列」通过jstack线程状态分析虚拟机线程问题指南