技术分享 | mysql show processlist Time 为负数的思考

て烟熏妆下的殇ゞ 提交于 2019-12-04 19:13:24

作者:高鹏 文章末尾有他著作的《深入理解 MySQL 主从原理 32 讲》,深入透彻理解 MySQL 主从,GTID 相关技术知识。

一、问题来源

这是一个朋友问我的一个问题,问题如下,在 MTS 中 Worker 线程看到 Time 为负数是怎么回事,如下:

二、关于 show processlist 中的 Time

实际上 show processlist 中的信息基本都来自函数 mysqld_list_processes,也就是说每次执行 show processlist 都需要执行这个函数来进行填充。对于 Time 值来讲它来自如下信息:

Percona:
time_t now= my_time(0);
protocol->store_long ((thd_info->start_time > now) ? 0 :  (longlong) (now - thd_info->start_time));
官方版:
time_t now= my_time(0);
protocol->store_long ((longlong) (now - thd_info->start_time));

我们可以注意到在 Percona 的版本中对这个输出值做了优化,也就是如果出现负数的时候直接显示为 0,但是官方版中没有这样做,可能出现负数。

三、计算方式解读和测试

现在我们来看看这个简单的计算公式,实际上 now 很好理解就是服务器的当前时间,重点就在于 thd_info->start_time的取值来自何处。实际这个时间来自于函数 THD::set_time,但是需要注意的是这个函数会进行重载,有下面三种方式:

重载 1

inlinevoid set_time()
{
    start_utime= utime_after_lock= my_micro_time();
if(user_time.tv_sec || user_time.tv_usec)
{
      start_time= user_time;
}
else
      my_micro_time_to_timeval(start_utime, &start_time);
...
}

重载 2

 inlinevoid set_time(conststruct timeval *t)
 {
    start_time= user_time= *t;
    start_utime= utime_after_lock= my_micro_time();
...
}

重载 3

void set_time(QUERY_START_TIME_INFO *time_info)
{
    start_time= time_info->start_time;
    start_utime= time_info->start_utime;
}

其实简单的说就是其中有一个 start_utime,如果设置了 start_utime 那么 start_time 将会指定为 start_utime,并且在重载 1 中将会不会修改 start_time,这一点比较重要。好了说了 3 种方式,我们来看看 Time 的计算有如下可能。

1、执行命令 如果主库执行常见的命令都会在命令发起的时候调用重载 1,设置 start_time 为命令开始执行的时间如下:

堆栈:
#0  THD::set_time (this=0x7ffe7c000c90) at /mysqldata/percona-server-locks-detail-5.7.22/sql/sql_class.h:3505
#1  0x00000000015c5fe8 in dispatch_command (thd=0x7ffe7c000c90, com_data=0x7fffec03fd70, command=COM_QUERY)
    at /mysqldata/percona-server-locks-detail-5.7.22/sql/sql_parse.cc:1247

可以看到这个函数没有实参,因此 start_time 会设置为当前时间,那 Time 的计算公式 now - thdinfo->start_time 就等于 (服务器当前时间 - 命令开始执行的时间)。

2、从库单 Sql 线程和 Worker 线程

其实不管单 Sql 线程还是 Worker 线程都是执行 Event 的,这里的 start_time 将会被设置为 Event header 中 timestamp 的时间(query event/dml event),这个时间实际就是主库命令发起的时间。如下:

堆栈:
query event:

#0  THD::set_time (this=0x7ffe78000950, t=0x7ffe701ec430) at /root/mysqlall/percona-server-locks-detail-5.7.22/sql/sql_class.h:3526
#1  0x00000000018459ab in Query_log_event::do_apply_event (this=0x7ffe701ec310, rli=0x7ffe7003c050, query_arg=0x7ffe701d88a9 "BEGIN", q_len_arg=5)
    at /root/mysqlall/percona-server-locks-detail-5.7.22/sql/log_event.cc:4714

堆栈:
dml event:
#0  THD::set_time (this=0x7ffe78000950, t=0x7ffe701ed5b8) at /root/mysqlall/percona-server-locks-detail-5.7.22/sql/sql_class.h:3526
#1  0x000000000185aa6e in Rows_log_event::do_apply_event (this=0x7ffe701ed330, rli=0x7ffe7003c050)
    at /root/mysqlall/percona-server-locks-detail-5.7.22/sql/log_event.cc:11417

我们看到这里有一个实参的传入我们看一下代码如下:

thd->set_time(&(common_header->when))

实际上就是这一行,这是我们前面说的重载 3,这样设置后 start_utime 和 start_time 都将会设置,即便调用重载 1 也不会更改, 那 Time 的计算方式 now-thd_info->start_time 就等于(从库服务器当前时间 - Event header 中的时间),但是要知道 Event header 中的时间实际也是来自于主库命令发起的时间。既然如此如果从库服务器的时间小于主库服务器的时间,那么 Time 的结果可能是负数是可能出现的,当然 Percona 版本做了优化负数将会显示为 0,如果从库服务器的时间大于主库的时间那么可能看到 Time 比较大。因为我的测试环境都是 Percona,为了效果明显,我们来测试一下 Worker 线程 Time 很大的情况,如下设置:

主库:
[root@mysqltest2 test]# date
FriNov101:40:54 CST 2019

从库:
[root@gp1 log]# date
TueNov1915:58:37 CST 2019

主库随便做一个命令,然后观察如下:

3、设置 timestamp

如果手动指定 timestamp 也会影响到 Time 的计算结果,因为 start_utime 和 start_time 都将会设置,如下:

mysql> set timestamp=1572540000

堆栈:
#0  THD::set_time (this=0x7ffe7c000c90, t=0x7fffec03db30) at /mysqldata/percona-server-locks-detail-5.7.22/sql/sql_class.h:3526
#1  0x000000000169e509 in update_timestamp (thd=0x7ffe7c000c90, var=0x7ffe7c006860) at /mysqldata/percona-server-locks-detail-5.7.22/sql/sys_vars.cc:4966
#2  0x00000000016b9a3d in Sys_var_session_special_double::session_update (this=0x2e68e20, thd=0x7ffe7c000c90, var=0x7ffe7c006860)
    at /mysqldata/percona-server-locks-detail-5.7.22/sql/sys_vars.h:1889

我们看到带入了实参,我们看看代码这一行如下:

 thd->set_time(&tmp);

这就是重载 2 了,这样设置后 start_utime 和 start_time 都将会设置,即便调用重载 1 也不会更改,言外之意就是设置了 timestamp 后即便执行了其他的命令 Time 也不会更新。Time 的计算方式 now - thdinfo->starttime 就等于 (服务器当前时间 - 设置的 timestamp 时间),这样的话就可能出现 Time 出现异常,比如很大或者为负数(Percona 为 0)如下:

4、空闲情况下

如果我们的会话空闲状态下那么 now-thd_info->start_time公式中,now 会不断变大,但是 thd_info->start_time 却不会改变,因此 Time 会不断增大,等待到下一次命令到来后才会更改。

四、延伸

这里我想在说明一下如果从库开启了 log_slave_updates 的情况下,从库记录会记录来自主库的 Event,但是这些 Event 的 timestamp 和 Query Event 的 exetime 如何取值呢?

Event 的 timestamp 的取值

其实上面我已经说了,因为 start_time 将会被设置为 Event header 中 timestamp 的时间(query event/dml event),当记录 Evnet 的时候这个时间和主库基本一致,如下:

很明显我们会发现这些 Event 的 timestamp 不是本地的时间,而是主库的时间。

Query Event 的 exetime

我们先来看看这个时间的计算方式:

ulonglong micro_end_time= my_micro_time();//这里获取时间 query event
  my_micro_time_to_timeval(micro_end_time, &end_time);

  exec_time= end_time.tv_sec - thd_arg->start_time.tv_sec;//这里计算时间

相信对于 thd_arg->start_time 而言已经不再陌生,它就是主库命令发起的时间。我在我的《深入理解主从原理》系列中说过了,对于 Query Event 的 exetime 在 row 格式 binlog 下,DML 语句将会是第一行语句修改时间的时间,那么我们做如下定义(row 格式 DML 语句):

  • 主:主库第一行数据修改完成的服务器时间 - 主库本命令发起的时间
  • 从:从库第一行数据修改完成的服务器时间 - 主库本命令发起的时间

他们的差值就是:(从库第一行数据修改完成的服务器时间 - 主库第一行数据修改完成的服务器时间 )同样如果我们从库的时间远远大于主库的时间,那么 exetime 也会出现异常如下:

最后:

Time 是我们平时关注的一个指标,我们经常用它来表示我的语句执行了多久,但是如果出现异常的情况我们也应该能够明白为什么,这里我将它的计算方式做了一个不完全的解释,希望对大家有帮助。当然对于主从部分或者 Event 部分可以参考我的《深入理解主从原理》系列。

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!