系统性能监控：

确定系统运行的整体状态，基本定位问题所在

uptime命令

[root@localhost ~]# uptime
23:19:38 up 244 days, 3:39, 34 users, load average: 7.36, 7.81, 7.79

ps,获取服务器有多少逻辑核心：grep 'model name' /proc/cpuinfo | wc -l，一般情况下load average除以逻辑核心数 < 0.7 认为CPU压力不大

系统时间
时间从开机到现在的运行时间
连接数：每一个终端算一个连接
1,5,15分钟内的系统平均负载：运行队列中的平均进程数。

top命令

第一行同uptime
CPU、内存情况
每个进程占CPU的情况

可以知道哪个程序占用CPU最多

vmstat命令

可以统计系统的CPU，内存，swap，io等情况

CPU占用率很高，上下文切换频繁、说明系统中有线程正在频繁切换。

vmstat 1 4 指定采样频率和采样次数，每1秒采集1次，采集4次

[root@localhost ~]# vmstat 1 4
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
8 0 0 638328 31104 46136032 0 0 17 85 0 0 3 3 94 0 0
7 0 0 636872 31112 46136076 0 0 128 1416 46076 129603 11 10 79 0 0
7 0 0 636504 31112 46136308 0 0 0 996 45864 122568 11 10 79 0 0
13 0 0 635540 31112 46136380 0 0 0 2972 48854 127109 11 12 77 0 0

cs和us代表上下文切换。

pidstat命令

细致观察进程
需要安装： yum install -y sysstat
监控CPU
监控IO
监控内存

pidstat -p 58 -u 1 3

-p表示指定进程，进程id为58
-u指定采样CPU，每1秒采样一次，采集3次

[root@localhost ~]# pidstat -p 146603 -u 1 3
Linux 3.10.0-514.el7.x86_64 (localhost.localdomain) 08/06/2018 _x86_64_ (32 CPU)
11:34:26 PM UID PID %usr %system %guest %CPU CPU Command
11:34:27 PM 992 146603 0.00 0.00 0.00 0.00 11 ssh
11:34:28 PM 992 146603 0.00 0.00 0.00 0.00 11 ssh
11:34:29 PM 992 146603 0.00 0.00 0.00 0.00 11 ssh
Average: 992 146603 0.00 0.00 0.00 0.00 - ssh

pidstat -p 58 -u 1 3 -t
-t参数：查看进程中线程的使用情况

pidstat -p 58 -d 1 3 -t
-d 查看磁盘io的情况

Java自带的工具

查看java程序运行细节，进一步定位问题

jps

列出java进程，类似于ps命令
-q可以指定jps只输出进程id，不输出类的短名称
-m参数可以用于输出传递给java进程（主函数）的参数
-l可以用于输出主函数的完整路径
-v可以显示传递给jvm的参数

支持远程监控（需要开启安全授权）

jps 192.168.1.10

安全授权

在远程机器%JAVA_HOME%/bin/目录下存储jstatd.all.policy文件，内容如下：

grant codebase "file:${java.home}/../lib/tools.jar" {
    permission java.security.AllPermission;
};

然后在进入jstatd.all.policy所在目录下，通过如下的命令启动RMI服务：

./jstatd -J-Djava.security.policy=jstatd.all.policy

或者

./jstatd -J-Djava.security.policy=jstatd.all.policy -J-Djava.rmi.server.hostname=192.168.22.249

jstat

jstat -gcutil 9统计gc信息：

说明：

图中显示，FGC一共有3次，用时547毫秒，平均一次gc占用时间为547/3=182毫秒，结合JVM运行时长来看这个full gc是否合理，比如这个数据是jvm启动了一天之后的数据，即一天3次full gc，且每次182毫秒，对于平均响应时间为1s的应用来说这完全没有问题；如果是1小时3次，应用的响应时间为几十毫秒，这个就有影响了，GC的时间消耗是否合理是相对的。

字段说明

S0 年轻代中第1个幸存区已使用的占当前容量百分比

S1 年轻代中第2个幸存区已使用的占当前容量百分比

E 年轻代中Eden已经使用的占当前容量的百分比

O old代中Eden已经使用的占当前容量的百分比

P perm代中Eden已经使用的占当前容量的百分比

YGC JVM启动到采样时年轻代gc次数

YGCT JVM启动到采样时年轻代gc所用时间

FGC JVM启动到采样时old代（full gc）gc次数

FGCT JVM启动到采样时old代（full gc）gc所用时间

GCT JVM启动到采样时gc用的总时间

支持远程监控(需开启安全授权)

jstat -gcutil 1198@192.168.1.10

jinfo

可以用来查看正在运行的java应用程序的扩展参数，甚至支持在运行时，修改部分参数。
-flag <name> 打印指定JVM的参数值
-flag [+|-] <name> 设置指定JVM参数的布尔值
-flag <name>=<value>:设置指定JVM参数的值

显示了新生代对象晋升到老年代对象的最大年龄：
[root@localhost ~]# jinfo -flag MaxTenuringThreshold 2972
输出：-XX:MaxTenuringThreshold=15

显示是否打印GC详细信息：
[root@localhost ~]# jinfo -flag PrintGCDetails 23415
-XX:-PrintGCDetails (-号代表false)

运行时修改参数，控制是否输出GC日志（不用重启进程）
[root@localhost ~]# jinfo -flag +PrintGCDetails 23415
[root@localhost ~]# jinfo -flag PrintGCDetails 23415
-XX:+PrintGCDetails

jmap

3.1、生成java应用程序的堆快照和对象的统计信息
jmap -histo 23415 > /home/bgq/s.txt

[root@localhost ~]# cat /home/bgq/s.txt |less

num #instances #bytes class name
----------------------------------------------
1: 195451 21772752 [C
2: 82717 18440736 [B
3: 18116 16245400 [I

输出默认是占用空间大小（#bytes）倒序显示。

[I代表整数数组

3.2、Dump堆
jmap -dump:format=b,file=/home/bgq/heap.hprof 23415

dump完成之后，通过工具打开这个文件。比如mat工具

jstack

打印线程dump，注意一定要用该进程的启动用户去拉，否则会报 Unable to open socket file: target process not responding or HotSpot VM not loaded 错误。

-l 打印锁信息
-m 打印java和native的帧信息
-F 强制dump,当jstack没有响应时使用

打印120这个pid的线程信息
jstack 120 >> C:\a.txt

JStack 拉取的文件信息基本分为以下几个部分：
该拉取快照的服务器时间
JVM 版本
以线程 ID(即 tid)升序依次列出当前进程中每个线程的调用栈
死锁(如果有的话)
阻塞锁链
打开的锁链
监视器解锁情况跟踪
每个线程在等待什么资源，这个资源目前在被哪个线程 hold，尽在眼前。JStack 最好在压测时多次获取，找到的普遍存在的现象即为线程瓶颈所在。

JConsole

图形化监控工具
可以查看java应用程序的运行情况，监控堆信息，永久区使用情况，类加载情况等。

堆：新生代、老年代
非堆：堆以外的内存，包括code cache、compressed class space

Jvisual VM

比jconsole更强大的工具
多合一故障诊断和性能监控的可视化工具。

性能监控：找到占用CPU时间最长的方法
抽象器-->CPU

分析堆Dump

练习：
运行一个程序ThreadBlockMain,期望输出Hello, World，结果在程序运行后，程序卡死，没有预期输出

1、通过jps获取进程id号
2、打印进程的线程信息：jstack 2300 > C:\ts.txt
3、打开文件，查看，通过进程发现在等待一个socket receive

练习2：
java程序HoldCPUMain运行后，发现占用CPU很高，希望能找到原因。

1、通过jps获取HoldCPUMain的进程id号
2、uptime查看负载
3、top命令，查看java程序CPU占用率100%
4、pidstat -p 3455 1 3 -u -t
打印CPU的线程输出情况，发现某个线程3467，占用CPU特别高
3467转16进制：D8B(jstack获取的线程信息文件中，线程号以16进制呈现)
jstack 3455 > C:\ts.txt

然后根据jstack的线程调用信息，查看指定的代码行。

练习3：
死锁。

如何从jstack的输出中找出死锁。

看是不是有线程互相等待

使用jvisualvm、jmc远程监控JVM

https://blog.csdn.net/mn960mn/article/details/73958701

IBM HeapAnalyzer简介使用

https://blog.csdn.net/wwd0501/article/details/78657319

来源：oschina

链接：https://my.oschina.net/u/4404844/blog/4147134

标签

JMAP

jStat

java

sysstat

Linux

Java程序性能监控工具