Java应用线上问题排查的常用工具和方法

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Java应用线上问题排查的常用工具和方法相关的知识,希望对你有一定的参考价值。


  在长期排查线上问题的过程中,总结了一些工具的用法和排查问题的思路,这里跟大家分享一下,在遇到类似的问题时,希望能给予一些帮助。

  首先讲讲工具, jvm 自带的一些工具是必须熟练掌握的,例如jstack, jmap, jstat等,它们可以帮我们去深入了解JVM正在做的事情,主要的适用领域有这些:

1、jstack

  jstack可以告诉你当前所有JVM线程正在做什么,包括用户线程和虚拟机线程,你可以用它来查看线程栈,并且结合Lock信息来检测是否发生了死锁和死锁的线程。

  没事儿jstack一下,知道你的小伙伴正在做什么。

  另外在用top -H看到占用CPU非常高的pid时,可以转换成16进制后在jstack dump出来的文件中搜索,看看到底是什么线程占用了CPU。

2、jstat

  stat,顾名思义就是提供一些统计信息,它可以告诉你当前的GC情况,包括GC次数、时间,具体的GC还可以结合gc.log文件去分析。

  一般来说,我们用jstat去查看GC情况,判断是否存在YGC或FGC频繁的情况,再去看gc.log和jamp dump内存,MAT分析来定位问题(后面会有一个case针对这种场景)。

  常用的用法是jstat -gcutil pid time_interval

3、jmap

  排查GC问题必然会用到的工具,jmap可以告诉你当前JVM内存堆中的对象分布及其关系,当你dump堆之后可以用MAT分析,看看有哪些大对象,或者哪些类的实例特别多。

  常用用法:

  强制FGC:-histo:live

  dump堆:-dump:[live],format=b,file=dump.bin

  查看各代内存占用情况:-heap

  然后我们来介绍一些开源的工具,来增强JVM工具本身的作用。

 

4、top

  这个是 linux 自带的命令,查看系统资源消耗情况,可以看看CPU、内存、SWAP、I/O的消耗情况,需要特别注意的有几个值:

  ni,这个值如果特别高说明线程上下文切换开销较大,看看是不是开了太多的线程导致的

  res,这个代表了进程实际占用的内存

  swap,内存不足就会占用swap空间,这个时候一般应用的性能会急剧下降,需要特别关注

 

以上是关于Java应用线上问题排查的常用工具和方法的主要内容,如果未能解决你的问题,请参考以下文章

整理:Java 线上问题排查思路与工具使用

性能问题排查

让 Bug 无处藏身,Java 线上问题排查思路常用工具

Java应用线上问题排查思路

Java应用线上问题排查思路

java:线上问题排查常用手段