Linux程序性能分析和火焰图
Posted SolidMango
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux程序性能分析和火焰图相关的知识,希望对你有一定的参考价值。
Linux程序性能分析和火焰图
Linux程序的性能分析工具数量比较多,涉及到整个操作系统的方方面面,可能是开源的原因吧,相对于Windows来说丰富太多。其中应用分析性能方面Dtrace, SystemTap, Perf_events应该算是这方面的集大成者。Dtrace目前只在较高的内核版本有支持,记得是4.8以后, SystemTap则是需要在Red Hat的官方网站下载OS版本对应的调试符号和对应的调试版本内核,配置起来需要花费一定的时间,只有Perf_events使用起来比较方面,但是客观来说,实力也是最弱的,但应对日一些简单的场景也足够了。本文以Perf_events进行示范,算是对这方面感兴趣的朋友开个头,抛砖引玉一下。
Perf_events简称perf是 Linux 系统原生提供的性能分析工具,会返回 CPU 正在执行的函数名以及调用栈(stack)。通常,它的执行频率是 99Hz(每秒99次),如果99次都返回同一个函数名,那就说明 CPU 这一秒钟都在执行同一个函数,可能存在性能问题。
命令如下:
# perf record -F 99 -p 15533 -g -- sleep 30
上面的命令中,perf record表示记录,-F 99表示每秒99次,-p 15533是进程号,即对哪个进程进行分析,也可以对线程进行分析, -g表示记录调用栈,sleep 30则是持续30秒。运行后会产生一个庞大的文本文件。如果一台服务器有16个 CPU,每秒抽样99次,持续30秒,就得到 47,520 个调用栈,长达几十万甚至上百万行。为了便于阅读,perf record命令可以统计每个调用栈出现的百分比,然后从高到低排列。
命令如下:
# perf report -n --stdio
由于文本显示方式对于初学者不是十分直观,于是有了火焰图, 首先对刚才生成的perf.data进行如下两步处理。
# perf script -i perf.data &> perf.unfold
# ./stackcollapse-perf.pl perf.unfold &> perf.folded
然后生成火焰图
#./flamegraph.pl perf.folded > perf.svg
具体的火焰图生成工具可以去如下路径下载:
https://github.com/brendangregg/FlameGraph
关于火焰图
火焰图是基于 perf 结果产生的 SVG 图片,用来展示 CPU 的调用栈。y 轴表示调用栈,每一层都是一个函数。调用栈越深,火焰就越高,顶部就是正在执行的函数,下方都是它的父函数。x 轴表示抽样数,如果一个函数在 x 轴占据的宽度越宽,就表示它被抽到的次数多,即执行的时间长。注意,x 轴不代表时间,而是所有的调用栈合并后,按字母顺序排列的。火焰图就是看顶层的哪个函数占据的宽度最大。只要有"平顶"(plateaus),就表示该函数可能存在性能问题。颜色没有特殊含义,因为火焰图表示的是 CPU 的繁忙程度,所以一般选择暖色调。火焰图是 SVG 图片,可以与用户互动。
--鼠标悬浮
火焰的每一层都会标注函数名,鼠标悬浮时会显示完整的函数名、抽样抽中的次数、占据总抽样次数的百分比。
--点击放大
在某一层点击,火焰图会水平放大,该层会占据所有宽度,显示详细信息。左上角会同时显示"Reset Zoom",点击该链接,图片就会恢复原样。
--搜索
按下 Ctrl + F 会显示一个搜索框,用户可以输入关键词或正则表达式,所有符合条件的函数名会高亮显示。
小结
本文对linux应用性能分析工具perf的使用进行了完整的介绍,并对如何生成火焰图的命令进行了示范,火焰图的应用场景很多,不仅可以处理perf的输出数据还可以处理Dtrace命令的输出,功能强悍,希望本文对大家有所帮助。
以上是关于Linux程序性能分析和火焰图的主要内容,如果未能解决你的问题,请参考以下文章