【StoneDB技术解析】验证相关数据包是否需要解压缩

十念  金牌会员 | 2022-9-16 17:18:26 | 显示全部楼层 | 阅读模式
打印 上一主题 下一主题

主题 806|帖子 806|积分 2418

在StoneDB中,数据包分为以下几类:

  • 不相关的数据包:不满足查询条件的数据包。
  • 相关的数据包:满足查询条件的数据包。
  • 可疑的数据包:数据包中的数据部分满足查询条件,需要进一步解压缩数据包才能得到满足条件的数据行。
通过对数据包的划分,知识网格技术过滤掉不相关的数据包,读取相关的数据包和可疑的数据包。其中相关的数据包不需要解压缩,只读取元数据,不会发生IO,可疑的数据包需要解压缩,会发生IO。
  1. 1)创建表t_user
  2. CREATE TABLE t_user(
  3.   id INT NOT NULL AUTO_INCREMENT,
  4.   first_name VARCHAR(10) NOT NULL,
  5.   last_name VARCHAR(10) NOT NULL,
  6.   sex VARCHAR(5) NOT NULL,
  7.   score INT NOT NULL,
  8.   copy_id INT NOT NULL,
  9.   PRIMARY KEY (`id`),
  10.   key idx_lastname(last_name)
  11. ) engine=STONEDB;
  12. 2)创建存储过程
  13. DELIMITER //
  14.     create PROCEDURE add_user(in num INT)
  15.     BEGIN
  16.         DECLARE rowid INT DEFAULT 0;
  17.         DECLARE firstname CHAR(1);
  18.         DECLARE name1 CHAR(1);
  19.         DECLARE name2 CHAR(1);
  20.         DECLARE lastname VARCHAR(3) DEFAULT '';
  21.         DECLARE sex CHAR(1);
  22.         DECLARE score CHAR(2);
  23.         WHILE rowid < num DO
  24.         SET firstname = SUBSTRING('赵钱孙李周吴郑王林杨柳刘孙陈江阮侯邹高彭徐',FLOOR(1+21*RAND()),1);
  25.         SET name1 = SUBSTRING('一二三四五六七八九十甲乙丙丁静景京晶名明铭敏闵民军君俊骏天田甜兲恬益依成城诚立莉力黎励',ROUND(1+43*RAND()),1);
  26.         SET name2 = SUBSTRING('一二三四五六七八九十甲乙丙丁静景京晶名明铭敏闵民军君俊骏天田甜兲恬益依成城诚立莉力黎励',ROUND(1+43*RAND()),1);
  27.         SET sex=FLOOR(0 + (RAND() * 2));
  28.         SET score= FLOOR(40 + (RAND() *60));
  29.         SET rowid = rowid + 1;
  30.         IF ROUND(RAND())=0 THEN
  31.         SET lastname =name1;
  32.         END IF;
  33.         IF ROUND(RAND())=1 THEN
  34.         SET lastname = CONCAT(name1,name2);
  35.         END IF;
  36.         insert INTO t_user(first_name,last_name,sex,score,copy_id) VALUES (firstname,lastname,sex,score,rowid);  
  37.         END WHILE;
  38.     END //
  39. DELIMITER ;
  40. 3)插入数据
  41. call add_user(10000000);
  42. 4)创建表t_user_innodb
  43. create table t_user_innodb like t_user;
  44. insert into t_user_innodb select * from t_user;
  45. alter table t_user_innodb engine=innodb;
复制代码
1)验证读取相关数据包

SQL的语义逻辑是对字段 first_name 进行分组统计,在StoneDB中,元数据信息记录在元数据节点,如果能通过元数据节点读取到元数据,就不需要解压缩数据包,不发生IO。
在InnoDB中,表的统计信息记录在mysql.innodb_table_stats,优化器根据表和索引的统计信息,生成一个最优的执行计划,然后执行SQL。分别在InnoDB与StoneDB执行,通过SQL profile观察读取IO的情况。
注:为规避缓存的影响,每组测试前重启数据库实例。
InnoDB
  1. mysql> set profiling=on;                                          
  2. Query OK, 0 rows affected, 1 warning (0.00 sec)
  3. mysql> select first_name,count(*) from t_user_innodb group by first_name;
  4. +------------+----------+
  5. | first_name | count(*) |
  6. +------------+----------+
  7. | 侯         |   476424 |
  8. | 刘         |   475764 |
  9. | 吴         |   475979 |
  10. | 周         |   475891 |
  11. | 孙         |   950444 |
  12. | 彭         |   476632 |
  13. | 徐         |   476219 |
  14. | 李         |   475521 |
  15. | 杨         |   476026 |
  16. | 林         |   477289 |
  17. | 柳         |   476250 |
  18. | 江         |   476623 |
  19. | 王         |   475119 |
  20. | 赵         |   476529 |
  21. | 邹         |   476852 |
  22. | 郑         |   476379 |
  23. | 钱         |   476829 |
  24. | 阮         |   476336 |
  25. | 陈         |   476746 |
  26. | 高         |   476148 |
  27. +------------+----------+
  28. 20 rows in set (8.62 sec)
  29. mysql> show profiles;                                                   
  30. +----------+------------+-------------------------------------------------------------------+
  31. | Query_ID | Duration   | Query                                                             |
  32. +----------+------------+-------------------------------------------------------------------+
  33. |        1 | 8.61591075 | select first_name,count(*) from t_user_innodb group by first_name |
  34. +----------+------------+-------------------------------------------------------------------+
  35. 1 row in set, 1 warning (0.00 sec)
  36. mysql> show profile cpu,block io for query 1;                           
  37. +----------------------+----------+----------+------------+--------------+---------------+
  38. | Status               | Duration | CPU_user | CPU_system | Block_ops_in | Block_ops_out |
  39. +----------------------+----------+----------+------------+--------------+---------------+
  40. | starting             | 0.000149 | 0.000059 |   0.000083 |            0 |             0 |
  41. | checking permissions | 0.000027 | 0.000011 |   0.000015 |            0 |             0 |
  42. | Opening tables       | 0.048181 | 0.003919 |   0.007952 |          608 |             0 |
  43. | init                 | 0.000036 | 0.000014 |   0.000021 |            0 |             0 |
  44. | System lock          | 0.000022 | 0.000009 |   0.000013 |            0 |             0 |
  45. | optimizing           | 0.000017 | 0.000007 |   0.000010 |            0 |             0 |
  46. | statistics           | 0.000029 | 0.000012 |   0.000016 |            0 |             0 |
  47. | preparing            | 0.000022 | 0.000009 |   0.000013 |            0 |             0 |
  48. | Creating tmp table   | 0.000045 | 0.000019 |   0.000027 |            0 |             0 |
  49. | Sorting result       | 0.000016 | 0.000007 |   0.000009 |            0 |             0 |
  50. | executing            | 0.000014 | 0.000005 |   0.000008 |            0 |             0 |
  51. | Sending data         | 8.566974 | 6.905969 |   0.772964 |       873888 |             0 |
  52. | Creating sort index  | 0.000144 | 0.000164 |   0.000037 |           64 |             0 |
  53. | end                  | 0.000014 | 0.000012 |   0.000003 |           32 |             0 |
  54. | query end            | 0.000028 | 0.000038 |   0.000009 |            0 |             0 |
  55. | removing tmp table   | 0.000019 | 0.000015 |   0.000003 |            0 |             0 |
  56. | query end            | 0.000012 | 0.000010 |   0.000002 |            0 |             0 |
  57. | closing tables       | 0.000031 | 0.000025 |   0.000006 |            0 |             0 |
  58. | freeing items        | 0.000032 | 0.000027 |   0.000006 |            0 |             0 |
  59. | logging slow query   | 0.000067 | 0.000054 |   0.000012 |            0 |             8 |
  60. | cleaning up          | 0.000035 | 0.000028 |   0.000006 |            0 |             0 |
  61. +----------------------+----------+----------+------------+--------------+---------------+
  62. 21 rows in set, 1 warning (0.00 sec)
复制代码
从SQL profile可知,SQL在InnoDB执行的过程中,发生IO的阶段有Opening tables、Sending data、Creating sort index、end,其中Opening tables是每张表第一次加载都会经历的,可排除讨论。重点关注Sending data部分,它表示在执行器的任意阶段,通常是存储引擎层与Server层的IO交互过程。
StoneDB
  1. mysql> set profiling=on;
  2. Query OK, 0 rows affected, 1 warning (0.00 sec)
  3. mysql> select first_name,count(*) from t_user group by first_name;
  4. +------------+----------+
  5. | first_name | count(*) |
  6. +------------+----------+
  7. | 赵         |   476529 |
  8. | 徐         |   476219 |
  9. | 王         |   475119 |
  10. | 阮         |   476336 |
  11. | 柳         |   476250 |
  12. | 侯         |   476424 |
  13. | 孙         |   950444 |
  14. | 郑         |   476379 |
  15. | 高         |   476148 |
  16. | 林         |   477289 |
  17. | 邹         |   476852 |
  18. | 彭         |   476632 |
  19. | 李         |   475521 |
  20. | 吴         |   475979 |
  21. | 刘         |   475764 |
  22. | 钱         |   476829 |
  23. | 周         |   475891 |
  24. | 杨         |   476026 |
  25. | 陈         |   476746 |
  26. | 江         |   476623 |
  27. +------------+----------+
  28. 20 rows in set (0.59 sec)
  29. mysql> show profiles;
  30. +----------+------------+------------------------------------------------------------+
  31. | Query_ID | Duration   | Query                                                      |
  32. +----------+------------+------------------------------------------------------------+
  33. |        1 | 0.59069975 | select first_name,count(*) from t_user group by first_name |
  34. +----------+------------+------------------------------------------------------------+
  35. 1 row in set, 1 warning (0.00 sec)
  36. mysql> show profile cpu,block io for query 1;
  37. +----------------------+----------+----------+------------+--------------+---------------+
  38. | Status               | Duration | CPU_user | CPU_system | Block_ops_in | Block_ops_out |
  39. +----------------------+----------+----------+------------+--------------+---------------+
  40. | starting             | 0.000160 | 0.000066 |   0.000089 |            0 |             0 |
  41. | checking permissions | 0.000027 | 0.000011 |   0.000015 |            0 |             0 |
  42. | Opening tables       | 0.011405 | 0.003718 |   0.007688 |            0 |           240 |
  43. | System lock          | 0.000385 | 0.000163 |   0.000222 |            0 |             0 |
  44. | init                 | 0.000050 | 0.000021 |   0.000028 |            0 |             0 |
  45. | optimizing           | 0.000143 | 0.000061 |   0.000082 |            0 |             0 |
  46. | update multi-index   | 0.000052 | 0.000022 |   0.000030 |            0 |             0 |
  47. | aggregation          | 0.578315 | 2.639504 |   0.981471 |            0 |             8 |
  48. | query end            | 0.000069 | 0.000043 |   0.000026 |            0 |             0 |
  49. | closing tables       | 0.000035 | 0.000021 |   0.000013 |            0 |             0 |
  50. | freeing items        | 0.000034 | 0.000021 |   0.000013 |            0 |             0 |
  51. | cleaning up          | 0.000027 | 0.000017 |   0.000010 |            0 |             0 |
  52. +----------------------+----------+----------+------------+--------------+---------------+
  53. 12 rows in set, 1 warning (0.00 sec)
复制代码
从SQL profile可知,SQL在StoneDB执行的过程中,只在Opening tables阶段发生IO。其它阶段没有发生IO,说明相关数据包是不需要解压缩的,通过元数据得到。
2)验证读取可疑数据包

SQL的语义逻辑是查询一行数据,StoneDB可以通过知识网格技术过滤掉不相关的数据包,由于只返回一行数据,最终只能找到可疑的数据包,然后解压缩可疑的数据包,最终得到这一行数据。InnoDB还是根据统计信息生成一个最优的执行计划去执行SQL。
InnoDB
  1. mysql> set profiling=on;                              
  2. Query OK, 0 rows affected, 1 warning (0.00 sec)
  3. mysql> select count(*) from t_user_innodb where first_name='柳' and copy_id=9968888;
  4. +----------+
  5. | count(*) |
  6. +----------+
  7. |        1 |
  8. +----------+
  9. 1 row in set (3.20 sec)
  10. mysql> show profile cpu,block io for query 1;
  11. +----------------------+----------+----------+------------+--------------+---------------+
  12. | Status               | Duration | CPU_user | CPU_system | Block_ops_in | Block_ops_out |
  13. +----------------------+----------+----------+------------+--------------+---------------+
  14. | starting             | 0.000170 | 0.000072 |   0.000092 |            0 |             0 |
  15. | checking permissions | 0.000030 | 0.000013 |   0.000016 |            0 |             0 |
  16. | Opening tables       | 0.024121 | 0.004351 |   0.008638 |          800 |             0 |
  17. | init                 | 0.000049 | 0.000021 |   0.000027 |            0 |             0 |
  18. | System lock          | 0.000019 | 0.000008 |   0.000011 |            0 |             0 |
  19. | optimizing           | 0.000022 | 0.000010 |   0.000012 |            0 |             0 |
  20. | statistics           | 0.000030 | 0.000013 |   0.000016 |            0 |             0 |
  21. | preparing            | 0.000026 | 0.000012 |   0.000015 |            0 |             0 |
  22. | executing            | 0.000013 | 0.000005 |   0.000007 |            0 |             0 |
  23. | Sending data         | 3.169882 | 2.755171 |   0.389367 |       534176 |             0 |
  24. | end                  | 0.000069 | 0.000050 |   0.000018 |            0 |             0 |
  25. | query end            | 0.000029 | 0.000022 |   0.000008 |            0 |             0 |
  26. | closing tables       | 0.000031 | 0.000023 |   0.000009 |            0 |             0 |
  27. | freeing items        | 0.000035 | 0.000025 |   0.000009 |            0 |             0 |
  28. | cleaning up          | 0.000038 | 0.000028 |   0.000010 |            0 |             0 |
  29. +----------------------+----------+----------+------------+--------------+---------------+
  30. 15 rows in set, 1 warning (0.00 sec)
复制代码
StoneDB
  1. mysql> set profiling=on;                                                            
  2. Query OK, 0 rows affected, 1 warning (0.00 sec)
  3. mysql> select count(*) from t_user where first_name='柳' and copy_id=9968888;
  4. +----------+
  5. | count(*) |
  6. +----------+
  7. |        1 |
  8. +----------+
  9. 1 row in set (0.01 sec)
  10. mysql> show profile cpu,block io for query 1;                                
  11. +----------------------+----------+----------+------------+--------------+---------------+
  12. | Status               | Duration | CPU_user | CPU_system | Block_ops_in | Block_ops_out |
  13. +----------------------+----------+----------+------------+--------------+---------------+
  14. | starting             | 0.000173 | 0.000081 |   0.000086 |            0 |             0 |
  15. | checking permissions | 0.000026 | 0.000013 |   0.000013 |            0 |             0 |
  16. | Opening tables       | 0.010228 | 0.009385 |   0.000843 |            0 |           240 |
  17. | System lock          | 0.000232 | 0.000113 |   0.000119 |            0 |             0 |
  18. | init                 | 0.000045 | 0.000021 |   0.000022 |            0 |             0 |
  19. | optimizing           | 0.000144 | 0.000071 |   0.000074 |            0 |             0 |
  20. | update multi-index   | 0.003694 | 0.002027 |   0.006428 |            0 |             0 |
  21. | aggregation          | 0.000191 | 0.000093 |   0.000098 |            0 |            16 |
  22. | query end            | 0.000020 | 0.000010 |   0.000010 |            0 |             0 |
  23. | closing tables       | 0.000029 | 0.000014 |   0.000015 |            0 |             0 |
  24. | freeing items        | 0.000033 | 0.000016 |   0.000017 |            0 |             0 |
  25. | cleaning up          | 0.000027 | 0.000013 |   0.000013 |            0 |             0 |
  26. +----------------------+----------+----------+------------+--------------+---------------+
  27. 12 rows in set, 1 warning (0.00 sec)
复制代码
从SQL profile可知,SQL在StoneDB执行的过程中,在aggregation阶段发生IO。
综上所述:

  • 知识网格技术过滤出相关的数据包后,只需要读取元数据,不再解压缩数据包;
  • 知识网格技术过滤出可疑的数据包后,需要解压缩数据包。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

十念

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表