如何将 performance_schema 中的 TIMER 字段转换为日期时间

王柳  论坛元老 | 2024-2-15 00:40:00 | 显示全部楼层 | 阅读模式
打印 上一主题 下一主题

主题 1024|帖子 1024|积分 3072

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
问题

最近有好几个朋友问,如何将 performance_schema.events_statements_xxx 中的 TIMER 字段(主要是TIMER_START和TIMER_END)转换为日期时间。
因为 TIMER 字段的单位是皮秒(picosecond),所以很多童鞋会尝试直接转换,但转换后的结果并不对,看下面这个示例。
  1. mysql> select * from performance_schema.events_statements_current limit 1\G<br>*************************** 1. row ***************************<br>              THREAD_ID: 57<br>               EVENT_ID: 13<br>           END_EVENT_ID: 13<br>             EVENT_NAME: statement/sql/commit<br>                 SOURCE: log_event.cc:4825<br>            TIMER_START: 3304047000000<br>              TIMER_END: 3305287000000<br>             TIMER_WAIT: 1240000000<br>             ...<br>       EXECUTION_ENGINE: PRIMARY<br>1 row in set (0.00 sec)<br><br># 因为1秒等于10^12皮秒,所以需要先除以 1000000000000。<br>mysql> select from_unixtime(3304047000000/1000000000000);<br>+--------------------------------------------+<br>| from_unixtime(3304047000000/1000000000000) |<br>+--------------------------------------------+<br>| 1970-01-01 08:00:03.3040                   |<br>+--------------------------------------------+<br>1 row in set (0.00 sec)<br>
复制代码
下面会从源码角度分析 TIMER 字段的生成逻辑。
对源码分析不感兴趣的童鞋,可直接跳到后面的案例部分看结论。
TIMER 字段的生成逻辑

当我们查询 events_statements_xxx 表时,会调用对应的 make_row() 函数来生成行数据。
如 events_statements_current 表,对应的生成函数是 table_events_statements_current::make_row()。
make_row 会调用 make_row_part_1 和 make_row_part_2 来生成数据。
TIMER_START、TIMER_END 实际上就是table_events_statements_common::make_row_part_1调用to_pico来生成的。
  1. int table_events_statements_common::make_row_part_1(<br>    PFS_events_statements *statement, sql_digest_storage *digest) {<br>  ulonglong timer_end;<br>  ...<br>  m_normalizer->to_pico(statement->m_timer_start, timer_end,<br>                        &m_row.m_timer_start, &m_row.m_timer_end,<br>                        &m_row.m_timer_wait);<br>  m_row.m_lock_time = statement->m_lock_time * MICROSEC_TO_PICOSEC;<br><br>  m_row.m_name = klass->m_name.str();<br>  m_row.m_name_length = klass->m_name.length();<br>  ...<br>  return 0;<br>}<br><br>void time_normalizer::to_pico(ulonglong start, ulonglong end,<br>                              ulonglong *pico_start, ulonglong *pico_end,<br>                              ulonglong *pico_wait) {<br>  if (start == 0) {<br>    *pico_start = 0;<br>    *pico_end = 0;<br>    *pico_wait = 0;<br>  } else {<br>    *pico_start = (start - m_v0) * m_factor;<br>    if (end == 0) {<br>      *pico_end = 0;<br>      *pico_wait = 0;<br>    } else {<br>      *pico_end = (end - m_v0) * m_factor;<br>      *pico_wait = (end - start) * m_factor;<br>    }<br>  }<br>}<br>
复制代码
函数中的 start 和 end 分别对应语句的开始时间(m_timer_start)和结束时间(m_timer_end)。
如果 start,end 不为 0,则 pico_start = (start - m_v0) * m_factor,pico_end = (end - m_v0) * m_factor。
pico_start、pico_end 即我们在 events_statements_current 中看到的 TIMER_START 和 TIMER_END。
m_timer_start 和 m_timer_end 的实现逻辑

如果 performance_schema.setup_instruments 中 statement 相关的采集项开启了(默认开启),则语句在开始和结束时会分别调用pfs_start_statement_vc() 和pfs_end_statement_vc()这两个函数。
m_timer_start 和 m_timer_end 实际上就是在这两个函数中被赋值的。
  1. void pfs_start_statement_vc(PSI_statement_locker *locker, const char *db,<br>                            uint db_len, const char *src_file, uint src_line) {<br>  ...<br>  if (flags & STATE_FLAG_TIMED) {<br>    timer_start = get_statement_timer();<br>    state->m_timer_start = timer_start;<br>  }<br>  ...<br>    pfs->m_timer_start = timer_start;<br>  ...<br>}<br><br>void pfs_end_statement_vc(PSI_statement_locker *locker, void *stmt_da) {<br>  ...<br>  if (flags & STATE_FLAG_TIMED) {<br>    timer_end = get_statement_timer();<br>    wait_time = timer_end - state->m_timer_start;<br>  }<br>  ...<br>    pfs->m_timer_end = timer_end;<br>  ...<br>}<br>
复制代码
可以看到,无论是语句开始时间(timer_start)还是结束时间(timer_end),调用的都是get_statement_timer()。
接下来,我们看看get_statement_timer()的具体实现。
  1. ulonglong inline get_statement_timer() { return USED_TIMER(); }<br><br># 如果有其它的计数器实现,只需更新宏定义即可。<br>#define USED_TIMER my_timer_nanoseconds<br><br>ulonglong my_timer_nanoseconds(void) {<br> ...<br>#elif defined(HAVE_CLOCK_GETTIME) && defined(CLOCK_REALTIME)<br>  {<br>    struct timespec tp;<br>    clock_gettime(CLOCK_REALTIME, &tp);<br>    return (ulonglong)tp.tv_sec * 1000000000 + (ulonglong)tp.tv_nsec;<br>  }<br> ...<br>#else<br>  return 0;<br>#endif<br>}<br>
复制代码
get_statement_timer()调用的是 USED_TIMER(),而 USED_TIMER 只不过是个宏定义,实际调用的还是my_timer_nanoseconds。
my_timer_nanoseconds是一个计时器函数,用于获取系统当前时间,并将其转换为纳秒级别的时间戳。不同的系统,会使用不同的方法来获取。
对于 linux 系统,它会首先调用clock_gettime函数获取系统当前时间,然后再将其转换为纳秒。
所以,语句的开始时间(m_timer_start)和结束时间(m_timer_end)取的都是系统当前时间。
m_v0 和 m_factor 的实现逻辑

m_v0和m_factor是结构体 time_normalizer 中的两个变量。其中,

  • m_v0:实例的启动时间(计数器值)。
  • m_factor:将计数器值转换为皮秒的转换因子。
这两个变量是在实例启动时被赋值的。
  1. void init_timers(void) {<br>  double pico_frequency = 1.0e12;<br>  ...<br>  my_timer_init(&pfs_timer_info);<br>  ...<br>  cycle_v0 = my_timer_cycles();<br>  nanosec_v0 = my_timer_nanoseconds(); # 获取系统当前时间,以纳秒表示。<br>  ...<br>  if (pfs_timer_info.nanoseconds.frequency > 0) {<br>    nanosec_to_pico =<br>        lrint(pico_frequency / (double)pfs_timer_info.nanoseconds.frequency);<br>  } else {<br>    nanosec_to_pico = 0;<br>  }<br>  ...<br>  to_pico_data[TIMER_NAME_NANOSEC].m_v0 = nanosec_v0;<br>  to_pico_data[TIMER_NAME_NANOSEC].m_factor = nanosec_to_pico;<br>  ...<br>}<br>
复制代码
可以看到,nanosec_v0 调用的函数,实际上同 m_timer_start、m_timer_end 一样,都是my_timer_nanoseconds。
nanosec_to_pico 是将纳秒转换为皮秒的转换因子,等于 1.0e12/1.0e9 = 1000。
案例

基于上面的分析,我们总结下 TIMER_START 的计算公式。
  1. TIMER_START = (语句执行时的系统时间(单位纳秒)- 实例启动时的系统时间(单位纳秒))* 1000<br>
复制代码
所以,如果要获取语句执行时的系统时间,可将 TIMER_START 除以 1000,然后再加上实例启动时的系统时间。
而实例启动时的系统时间,可通过当前时间(now)减去Uptime这个状态变量来实现。
下面我们通过一个具体的案例来验证下。
  1. mysql> create database test;<br>Query OK, 1 row affected (0.01 sec)<br><br>mysql> create table test.t1(id int primary key, c1 datetime(6));<br>Query OK, 0 rows affected (0.05 sec)<br><br>mysql> insert into test.t1 values(1, now(6));<br>Query OK, 1 row affected (0.02 sec)<br><br>mysql> select * from test.t1;<br>+----+----------------------------+<br>| id | c1                         |<br>+----+----------------------------+<br>|  1 | 2023-12-05 23:57:01.892242 |<br>+----+----------------------------+<br>1 row in set (0.01 sec)<br><br>mysql> select * from performance_schema.events_statements_history where digest_text like '%insert%'\G<br>*************************** 1. row ***************************<br>              THREAD_ID: 69<br>               EVENT_ID: 8<br>           END_EVENT_ID: 9<br>             EVENT_NAME: statement/sql/insert<br>                 SOURCE: init_net_server_extension.cc:97<br>            TIMER_START: 24182166000000<br>              TIMER_END: 24208896000000<br>             TIMER_WAIT: 26730000000<br>              LOCK_TIME: 254000000<br>               SQL_TEXT: insert into test.t1 values(1, now(6))<br>                 DIGEST: b2e0770f7505d35d2894321783fe92b7ebfbb908f687b98966efdc58d3386b3c<br>            DIGEST_TEXT: INSERT INTO `test` . `t1` VALUES ( ? , NOW (?) )<br>            ...<br>       EXECUTION_ENGINE: PRIMARY<br>1 row in set (0.04 sec)<br><br>mysql> select (unix_timestamp(now(6)) - variable_value) * 1000000000 into @mysql_start_time from performance_schema.global_status where variable_name = 'uptime';<br>Query OK, 1 row affected (0.02 sec)<br><br>mysql> select sql_text, timer_start, from_unixtime((timer_start/1000 + @mysql_start_time)/1000000000) as formatted_time from performance_schema.events_statements_history where digest_text like '%insert%';<br>+---------------------------------------+----------------+----------------------------+<br>| sql_text                              | timer_start    | formatted_time             |<br>+---------------------------------------+----------------+----------------------------+<br>| insert into test.t1 values(1, now(6)) | 24182166000000 | 2023-12-05 23:57:02.356767 |<br>+---------------------------------------+----------------+----------------------------+<br>1 row in set (0.01 sec)<br>
复制代码
插入时间(2023-12-05 23:57:01.892242)和 formatted_time(2023-12-05 23:57:02.356767)基本吻合,相差不到 0.5s。
为什么会有误差呢?

  • Uptime这个状态变量的单位是秒。
  • 语句的开始时间(m_timer_start)要比语句中的 now(6) 这个时间早。
细节补充

为了可读性,上面其实忽略了很多细节,这里简单记录下。
1. to_pico_data

to_pico_data是个数组,这个数组包含了多个 time_normalizer 类型的元素。
实例启动,在调用init_timers函数时,实际上还会将以微秒、毫秒为单位的系统时间分别赋值给to_pico_data[TIMER_NAME_MICROSEC].m_v0、to_pico_data[TIMER_NAME_MILLISEC].m_v0。
  1. to_pico_data[TIMER_NAME_CYCLE].m_v0 = cycle_v0;<br>to_pico_data[TIMER_NAME_CYCLE].m_factor = cycle_to_pico;<br><br>to_pico_data[TIMER_NAME_NANOSEC].m_v0 = nanosec_v0;<br>to_pico_data[TIMER_NAME_NANOSEC].m_factor = nanosec_to_pico;<br><br>to_pico_data[TIMER_NAME_MICROSEC].m_v0 = microsec_v0;<br>to_pico_data[TIMER_NAME_MICROSEC].m_factor = microsec_to_pico;<br><br>to_pico_data[TIMER_NAME_MILLISEC].m_v0 = millisec_v0;<br>to_pico_data[TIMER_NAME_MILLISEC].m_factor = millisec_to_pico;<br>
复制代码
既然有这么多个 m_v0,怎么知道time_normalizer::to_pico函数取的是哪一个呢?
实际上,events_statements_xxx 系列表的实现中,有个基类table_events_statements_common。
该类的构造函数里面会基于time_normalizer::get_statement()来初始化 m_normalizer,
而time_normalizer::get_statement()实际上返回的就是to_pico_data[TIMER_NAME_NANOSEC]。
  1. table_events_statements_common::table_events_statements_common(<br>    const PFS_engine_table_share *share, void *pos)<br>    : PFS_engine_table(share, pos) {<br>  m_normalizer = time_normalizer::get_statement();<br>}<br><br>time_normalizer *time_normalizer::get_statement() {<br>  return &to_pico_data[USED_TIMER_NAME];<br>}<br><br>#define USED_TIMER_NAME TIMER_NAME_NANOSEC<br>
复制代码
2. performance_schema 表的实现注释

storage/perfschema/pfs.cc文件中有一段注释。
这段注释非常重要,它介绍了 performance_schema 中的表是如何实现的。
以下是 events_statements_xxx 相关的注释。
  1.  ... <br> Implemented as:<br>  - [1] #pfs_start_statement_vc(), #pfs_end_statement_vc()<br>       (1a, 1b) is an aggregation by EVENT_NAME,<br>        (1c, 1d, 1e) is an aggregation by TIME,<br>        (1f) is an aggregation by DIGEST<br>        all of these are orthogonal,<br>        and implemented in #pfs_end_statement_vc().<br>  - [2] #pfs_delete_thread_v1(), #aggregate_thread_statements()<br>  - [3] @c PFS_account::aggregate_statements()<br>  - [4] @c PFS_host::aggregate_statements()<br>  - [A] EVENTS_STATEMENTS_SUMMARY_BY_THREAD_BY_EVENT_NAME,<br>        @c table_esms_by_thread_by_event_name::make_row()<br>  ...<br>  - [H] EVENTS_STATEMENTS_HISTORY_LONG,<br>        @c table_events_statements_history_long::make_row()<br>  - [I] EVENTS_STATEMENTS_SUMMARY_BY_DIGEST<br>        @c table_esms_by_digest::make_row()<br>
复制代码
3. 如何知道 TIMER 字段对应 m_row 中的哪些变量?

两者的对应关系实际上是在table_events_statements_common::read_row_values中定义的。
  1. int table_events_statements_common::read_row_values(TABLE *table,<br>                                                    unsigned char *buf,<br>                                                    Field **fields,<br>                                                    bool read_all) {<br>  Field *f;<br>  uint len;<br><br>  /* Set the null bits */<br>  assert(table->s->null_bytes == 3);<br>  buf[0] = 0;<br>  buf[1] = 0;<br>  buf[2] = 0;<br><br>  for (; (f = *fields); fields++) {<br>    if (read_all || bitmap_is_set(table->read_set, f->field_index())) {<br>      switch (f->field_index()) {<br>        case 0: /* THREAD_ID */<br>          set_field_ulonglong(f, m_row.m_thread_internal_id);<br>          break;<br>        ...<br>        case 5: /* TIMER_START */<br>          if (m_row.m_timer_start != 0) {<br>            set_field_ulonglong(f, m_row.m_timer_start);<br>          } else {<br>            f->set_null();<br>          }<br>          break;<br>        case 6: /* TIMER_END */<br>          if (m_row.m_timer_end != 0) {<br>            set_field_ulonglong(f, m_row.m_timer_end);<br>          } else {<br>            f->set_null();<br>          }<br>          break;<br>          ...
复制代码
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

王柳

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表