技术分享 | 使用 Perf 和火焰图分析软件

ぐ巨炮叔叔 提交于 2019-12-10 17:28:48

作者:Agustín 翻译:孟维克 原文:https://www.percona.com/blog/2019/11/20/profiling-software-using-perf-and-flame-graphs/

在这篇博文中,我们将探讨如何一起使用perf和火焰图。它们用于生成我们选择的软件正在调用的函数的图形。在此我们使用Percona分支版本,但是它可以扩展到任何可以进行解析堆栈跟踪的软件。

在继续之前,请注意,与任何分析工具一样,除非您知道自己在做什么,否则不要在生产环境运行。

安装需要的软件包

为了简单,为使用CentOS7版本,但是对于基于Debian的发行版来说,它们应该是相同的(步骤中的唯一区别是用apt-get install linux-tools-$(uname -r)代替yum命令)。

安装perf

SHELL> sudo yum install -y perf

获得火焰图软件包

SHELL> mkdir -p ~/src
SHELL> cd ~/src
SHELL> git clone https://github.com/brendangregg/FlameGraph

全部安装完毕!让我们继续

抓取采集样本

火焰图是一种可视化数据的方式,所以我们需要一些可以作为基础的样本。可以用三种方式做到这一点(请注意,这里我们使用-p选项仅抓取我们感兴趣的进程的数据,但是如果需要,我们可以抓取所有正在运行的进程的数据)

1.仅抓取设定时间(这里是10秒)

SHELL> sudo perf record -a -F 99 -g -p $(pgrep -x mysqld) -- sleep 10

2.抓取直到我们发出中断讯号(CTRL+C)

SHELL> sudo perf record -a -F 99 -g -p $(pgrep -x mysqld)

3.抓取整个进程的生命周期

# 注意,如果我们中断了这个variant,我们同样杀死了上面的子进程
SHELL> sudo perf record -a -F 99 -g -- /sbin/mysqld \
--defaults-file=/etc/percona-server.conf.d/mysqld.cnf --user=mysql

或者

SHELL> sudo perf record -a -F 99 -g -p $(pgrep -x mysqld) -- mysql -e "SELECT * FROM db.table"

在第三个场景的第一种情况下,我们被迫抓取了所有进程的数据,因为实现不可能直到进程ID号(PID)(通过执行该命令,我们实际上正在启动MySQL服务)。当您希望从进程启动时就开始获取数据,这种类型的命令非常有用,否则是不可能的。

在第二个场景下,我们在正在运行的MySQL服务上执行一个查询,因此我们可以使用*-p*选项抓取这个进程的数据。例如,如果您希望抓取作业正在运行的时的数据,这就非常方便。

准备样本

初始化抓取完成后,我们需要将收集到的数据“可读”。这是必要的,因为通过perf record生成的是二进制格式。因此,我们将执行:

SHELL> sudo perf script > perf.script

默认情况下它读取perf.dataperf record也默认输出到这个文件。它可以分别使用*-i选项和-o*选项来覆盖写入。

现在我们能读取生成的文本文件,因为已经是易读的形式。然而,当您做到这时,你很快就会意识到我们为什么要将这些数据聚合为更易懂的形式。

生成火焰图

我们可以将第一个命令的输出作为第二个命令的输出,在一行命令中完成以下工作。因为我们没有将火焰图的git文件夹加入到PATH变量中,因此要使用完整路径。

SHELL> ~/src/FlameGraph/stackcollapse-perf.pl perf.script | ~/src/FlameGraph/flamegraph.pl > flamegraph.svg

现在我们在任何浏览器打开.svg文件并开始分析富含信息的图形。

看起来如何

作为示例,我将使用第2种抓取数据的方法的完整命令、输出和生成火焰图的屏幕截图帖在如下。我们执行INSERT INTO...SELECT语句,我们可以分析执行过程。

SHELL> time sudo perf record -a -F 99 -g \
-p $(pgrep -x mysqld) \
-- mysql test -e "INSERT INTO joinit SELECT NULL, uuid(), time(now()),  (FLOOR( 1 + RAND( ) *60 )) FROM joinit;"
Warning:
PID/TID switch overriding SYSTEM
[ perf record: Woken up 7 times to write data ]
[ perf record: Captured and wrote 1.909 MB perf.data (8214 samples) ]

real 1m24.366s
user 0m0.133s
sys 0m0.378s
SHELL> sudo perf script | \ 
~/src/FlameGraph/stackcollapse-perf.pl perf.script | \
~/src/FlameGraph/flamegraph.pl > mysql_select_into_flamegraph.svg

敏锐的读者会注意到,我们在这里更进一步,通过一个管道(|)合并了步骤2和步骤3,避免向perf.script文件写入和读取数据。此外,还有时间输出,我们可以对工具生成的数据量进行估计(1分25秒生成约2Mb数据);当然这取决于许多因素,所以要谨慎对待,并在自己的环境中进行测试。

生成的火焰图如下:

enter image description here

优化的一个明显的候选对象是write_record:如果我们使这个函数变的更快,那么就有很大潜力来减少整体执行时间(左下角的蓝色方框表示,我们可以看到60%的样本是在这个代码路径中获取的)。在下面的最后一个章节中,我们将提供一篇博客,该文章详细解释了如何解释火焰图,但是现在,您只需要知道移动鼠标在各个函数名上,它将动态地更改左下角显示的信息。您也可以通过以下指南更好理解它:

enter image description here

总结

对于支持工程师,在许多情况下,我们使用此工具来深入了解MySQL正在执行的内容及执行的时间。这样,我们就可以更好地了解特定负载背后的操作,并采取相应的措施。这个软件用于优化或故障排查,它是我们工具箱中非常强大的工具!众所周知,人类处理图像比处理文本更擅长,而在我看来,该工具十分出色。

相关连接

Interpreting Flame Graphs (scroll down to the “Flame Graph Interpretation” section) https://queue.acm.org/detail.cfm?id=2927301

Flame Graphs 201, Percona分享会 https://www.percona.com/resources/webinars/flame-graphs-201

Brendan Gregg ,火焰图作者 http://www.brendangregg.com/flamegraphs.html

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!