14.性能优化答疑二
Posted lhxw
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了14.性能优化答疑二相关的知识,希望对你有一定的参考价值。
一、使用perf 工具,看到的是十六进制地址而不是函数名。
查看perf最后欧,就会看到警告信息:
Failed to open /opt/bitnami/php/lib/php/extensions/opcache.so, continuing without symbols
这说明,perf 找不到待分析进程依赖的库。当然,实际上这个案例中有很多依赖库都找不到,只不过,perf 工具本身只在最后一行显示警告信息,所以你只能看到这一条警告。
这个问题,其实也是在分析 Docker 容器应用时,我们经常碰到的一个问题,因为容器应用依赖的库都在镜像里面。
针对这种情况,我总结了下面四个解决方法。
第一个方法,在容器外面构建相同路径的依赖库。这种方法从原理上可行,但是我并不推荐,一方面是因为找出这些依赖库比较麻烦,更重要的是,构建这些路径,会污染容器主机的环境。
第二个方法,在容器内部运行 perf。不过,这需要容器运行在特权模式下,但实际的应用程序往往只以普通容器的方式运行。所以,容器内部一般没有权限执行 perf 分析。
比方说,如果你在普通容器内部运行 perf record ,你将会看到下面这个错误提示:
$ perf_4.9 record -a -g perf_event_open(..., PERF_FLAG_FD_CLOEXEC) failed with unexpected error 1 (Operation not permitted) perf_event_open(..., 0) failed unexpectedly with error 1 (Operation not permitted)
当然,其实你还可以通过配置 /proc/sys/kernel/perf_event_paranoid (比如改成 -1),来允许非特权用户执行 perf 事件分析。
不过还是那句话,为了安全起见,这种方法我也不推荐。
第三个方法,指定符号路径为容器文件系统的路径。比如对于第 05 讲的应用,你可以执行下面这个命令:
$ mkdir /tmp/foo $ PID=$(docker inspect --format {{.State.Pid}} phpfpm) $ bindfs /proc/$PID/root /tmp/foo $ perf report --symfs /tmp/foo
# 使用完成后不要忘记解除绑定
$ umount /tmp/foo/
不过这里要注意,bindfs 这个工具需要你额外安装。bindfs 的基本功能是实现目录绑定(类似于 mount --bind),这里需要你安装的是 1.13.10 版本(这也是它的最新发布版)。
如果你安装的是旧版本,你可以到 GitHub上面下载源码,然后编译安装。
第四个方法,在容器外面把分析纪录保存下来,再去容器里查看结果。这样,库和符号的路径也就都对了。
比如,你可以这么做。先运行 perf record -g -p < pid>,执行一会儿(比如 15 秒)后,按 Ctrl+C 停止。
然后,把生成的 perf.data 文件,拷贝到容器里面来分析:
$ docker cp perf.data phpfpm:/tmp
$ docker exec -i -t phpfpm bash
接下来,在容器的 bash 中继续运行下面的命令,安装 perf 并使用 perf report 查看报告:
$ cd /tmp/ $ apt-get update && apt-get install -y linux-tools linux-perf procps $ perf_4.9 report
不过,这里也有两点需要你注意。
首先是 perf 工具的版本问题。在最后一步中,我们运行的工具是容器内部安装的版本 perf_4.9,而不是普通的 perf 命令。这是因为, perf 命令实际上是一个软连接,会跟内核的版本进行匹配,但镜像里安装的 perf 版本跟虚拟机的内核版本有可能并不一致。
另外,php-fpm 镜像是基于 Debian 系统的,所以安装 perf 工具的命令,跟 Ubuntu 也并不完全一样。比如, Ubuntu 上的安装方法是下面这样:
$ apt-get install -y linux-tools-common linux-tools-generic linux-tools-$(uname -r))
而在 php-fpm 容器里,你应该执行下面的命令来安装 perf:
$ apt-get install -y linux-perf
当你按照前面这几种方法操作后,你就可以在容器内部看到 sqrt 的堆栈:
二、使用perf工具分析Java
两个问题,其实是上一个 perf 问题的延伸。 像是 Java 这种通过 JVM 来运行的应用程序,运行堆栈用的都是 JVM 内置的函数和堆栈管理。所以,从系统层面你只能看到 JVM 的函数堆栈,而不能直接得到 Java 应用程序的堆栈。
perf_events 实际上已经支持了 JIT,但还需要一个 /tmp/perf-PID.map 文件,来进行符号翻译。当然,开源项目 perf-map-agent 可以帮你生成这个符号表。
此外,为了生成全部调用栈,你还需要开启 JDK 的选项 -XX:+PreserveFramePointer。因为这里涉及到大量的 Java 知识,我就不再详细展开了。如果你的应用刚好基于 Java ,那么你可以参考 NETFLIX 的技术博客 Java in Flames (链接为 https://medium.com/netflix-techblog/java-in-flames-e763b3d32166),来查看详细的使用步骤。
说到这里,我也想强调一个问题,那就是学习性能优化时,不要一开始就把自己限定在具体的某个编程语言或者性能工具中,纠结于语言或工具的细节出不来。
掌握整体的分析思路,才是我们首先要做的。因为,性能优化的原理和思路,在任何编程语言中都是相通的。
三、为什么 perf 的报告中,很多符号都不显示调用栈
perf record -g 命令手机信息,收集多次,每次都是command列为swapper的左侧有加号,而app或其他的没有加号,在symbol列看到sys_read,new_sync_read,blkdev_read_iter等信息。(Ubunt系统)。
perf report是可视化展示perf.data工具,在运行时,看到以下界面:
清楚看到只有swapper调用栈,其他所有符号都不能看到堆栈。发现性能工具无法理解时查看手册,man perf-report,找到 -g 说明:
通过这个说明可以看到,-g 选项等同于 --call-graph,它的参数是后面那些被逗号隔开的选项,意思分别是输出类型、最小阈值、输出限制、排序方法、排序关键词、分支以及值的类型。
我们可以看到,这里默认的参数是 graph,0.5,caller,function,percent,具体含义文档中都有详细讲解,这里我就不再重复了。
现在再回过头来看我们的问题,堆栈显示不全,相关的参数当然就是最小阈值 threshold。通过手册中对 threshold 的说明,我们知道,当一个事件发生比例高于这个阈值时,它的调用栈才会显示出来。
threshold 的默认值为 0.5%,也就是说,事件比例超过 0.5% 时,调用栈才能被显示。再观察我们案例应用 app 的事件比例,只有 0.34%,低于 0.5%,所以看不到 app 的调用栈就很正常了。
这种情况下,你只需要给 perf report 设置一个小于 0.34% 的阈值,就可以显示我们想看到的调用图了。比如执行下面的命令:
$ perf report -g graph,0.3
你就可以得到下面这个新的输出界面,展开 app 后,就可以看到它的调用栈了。
四、perf report 报告。
在perf展开的分析详情中,有children和self都有90%多的swapper进程,进而去围绕这个进程展开,忽略只占用0.6%的app进程?
看到swapper,先想到的是SWAP分区,swapper跟SWAP没有任何关系,它只是系统初始化时 的init进程,之后就成了一个最低优先级空闲任务。当CPU上没有任何任务运行时,就会执行swapper,被称为“空闲任务”。
在perf report界面中,展开它的调用栈,看到swapper时钟事件都消耗费在了do_idle上,也就是在执行空闲任务:
所以,分析图,直接忽略前面99%的符号,转而分析后面只有0.3%的app。其实在多任务系统中,次数的事件,不一定就是性能瓶颈。
所以在只观察一个大数值,并不能说明什么问题,具体有没有瓶颈还要观测多个方面的多个指标,交叉验证。
另外,关于Children和Self的含义,手册有详细说明:
- Self 是最后一列的符号(可以理解为函数)本身所占比例;
- Children 是这个符号调用的其他符号(理解为子函数,包括直接调用和间接调用)占用的比列之和。
perf,需要在内核中跟踪内核栈的各种事件,不可避免带来一定的性能损失,虽然对大部分应用没有太大影响,但特定某些应用(像对时钟周期特别敏感的应用),可能就是灾难。
在使用性能工具时,要考虑工具本身对系统的影响,就要了解工具的原理:
- perf 这种动态追踪工具,会带来性能损失。
- vmstat、pidstat这些直接读取proc 文件的系统来获取指标的工具,不会带来性能损失。
五、性能优化书籍和参考资料推荐。
Brendan Gregg 是一位当之无愧的性能优化大师,他的性能工具图谱很多文章中都会看到:Linux性能篇一。
Brendan Gregg 的性能优化书籍《Systems Performance:Enterprise and the Cloud》。中文版的名字是:《性能之巅:洞悉系统、企业与云计算》。虽然在2013年出版,但依然是经典,分析思路鸡性能工具依然适合现在。
Brendan Gregg 的个人网站:http://www.brendangregg.com/ ,特别是 Linux Performance 这一页包含很多Linux性能优化资料,比如:
- Linux性能工具图谱
- 性能分析参考资料
- 性能优化演讲视频
但很多内容涉及到内核知识,对于初学者不太友好,要循序渐进一遍遍阅读。
以上是关于14.性能优化答疑二的主要内容,如果未能解决你的问题,请参考以下文章