ToB企服应用市场:ToB评测及商务社交产业平台

标题: MYSQL(进阶篇)——一篇文章带你深入掌握MYSQL [打印本页]

作者: 泉缘泉    时间: 2022-9-16 17:15
标题: MYSQL(进阶篇)——一篇文章带你深入掌握MYSQL
MYSQL(进阶篇)——一篇文章带你深入掌握MYSQL

我们在上篇文章中已经学习了MYSQL的基本语法和概念
在这篇文章中我们将讲解底层结构和一些新的语法帮助你更好的运用MYSQL
温馨提醒:该文章大约20000字,建议关注收藏慢慢观看,希望能给你带来帮助~
进阶篇内容目录

这篇文章我们主要分为七个部分:
存储引擎

在讲解存储引擎前我们先来了解一下MYSQL的整体体系结构
MYSQL整体分为四个部分:

存储引擎简介

存储引擎概念:
存储引擎注意点:
首先我们要先直到存储引擎是在哪里定义的:
  1. # 下面是一个表的创建语句
  2. create table Name (
  3.     ~~~~~~~~
  4. )engine = InnoDB;
  5. # 在上面的engine = 存储引擎类型 就是存储引擎的设计语句
  6. # 我们默认情况下是InoDB存储引擎
复制代码
同样我们可以通过查看创建方法来得到表的存储引擎类型:
  1. show create table 表名;
复制代码
存储引擎类型以及特点

我们可以在DG或其他数据库软件中直接查看存储引擎的类型:
  1. # 下述代码会给出该数据库中支持的存储引擎类型
  2. show engines;
复制代码
在这里我们仅详细介绍三种存储引擎:
介绍:
特点:
文件:
介绍:
特点:
文件:
介绍:
特点:
文件:
三者区别:
特点InnoDBMyISAMMemory存储限制64TB有有事务安全支持--锁机制行锁表锁表锁B+tree索引支持支持支持Hash索引--支持全文索引支持(5.6版本)支持-空间使用高低N/A内存使用高低中等批量插入速度低高高支持外键支持--存储引擎选择

我们在各个表都可以选择不同的存储引擎,而存储引擎的选择大多遵循以下特征:
优选InnoDB:
优选MyISAM:
优选Memory:
索引

首先我们来简略的介绍一下索引:
索引的优点:
索引的缺点:
索引结构

MySQL的索引是在存储引擎层实现的,因而不同的存储引擎有不同的索引结构 :
索引结构描述B+Tree索引最常见的索引类型,大部分引擎都支持 B+ 树索引Hash索引底层数据结构是用哈希表实现的, 只有精确匹配索引列的查询才有效, 不 支持范围查询R-tree索引空间索引是MyISAM引擎的一个特殊索引类型,主要用于地理空间数据类 型,通常使用较少Full-text索引是一种通过建立倒排索引,快速匹配文档的方式。类似于 Lucene,Solr,ES不同的索引结构也有不同的适配情况:
索引InnoDBMyISAMMemoryB+Tree索引√√√Hash索引××√R-tree索引×√×Full-text索引√√×在这里我们仅对B+Tree索引和Hash索引做出详细解释:
以一颗最大度数为4的B+Tree结构为例:

图片内容解释:
注意:
MYSQL中的B+Tree索引在B+Tree结构上对叶节点进行了一点改造:

我们先来讲解一下hash表:
Hash索引特点:
Hash索引的存储引擎支持:
接下来我们分析一下InnoDB存储引擎为什么选择B+tree索引结构:
索引分类

我们根据索引类型常常把索引分为四种:
分类含义特点关键字主键索引针对于表中主键创建的索引默认自动创建, 只能 有一个PRIMARY唯一索引避免同一个表中某数据列中的值重复可以有多个UNIQUE常规索引快速定位特定数据可以有多个全文索引全文索引查找的是文本中的关键词,而不是比 较索引中的值可以有多个FULLTEXT在InoDB存储引擎中,根据索引的存储形式,我们又可以把他们分为以下两种:
分类含义特点聚集索引将数据存储与索引放到了一块,索引结构的叶子节点保存了行数据必须有且只有一个二级索引将数据与索引分开存储,索引结构的叶子节点关联的是对应的主键可以存在多个聚集索引选择特点:

聚集索引:

二级索引:
我们在查询时常常采用回表查询:
索引语法

索引的语法只有三条:
  1. # 创建索引
  2. -- UNIQUE表示唯一索引 FULLTEXT表示全文索引
  3. -- (index_col_name,... ) 表示可以形成联合索引,一个索引包括多个表内列
  4. CREATE [ UNIQUE | FULLTEXT ] INDEX index_name ON table_name (index_col_name,... ) ;
  5. # 查看索引
  6. SHOW INDEX FROM table_namne;
  7. # 删除索引
  8. DROP INDEX index_name ON table_name;
复制代码
我们下面通过一个实例来演示索引的使用方法:
  1. # 以下为构造表
  2. -- 创建表
  3. create table tb_user(
  4.         id int primary key auto_increment comment '主键',
  5.         name varchar(50) not null comment '用户名',
  6.         phone varchar(11) not null comment '手机号',
  7.         email varchar(100) comment '邮箱',
  8.         profession varchar(11) comment '专业',
  9.         age tinyint unsigned comment '年龄',
  10.         gender char(1) comment '性别 , 1: 男, 2: 女',
  11.         status char(1) comment '状态',
  12.         createtime datetime comment '创建时间'
  13. ) comment '系统用户表';
  14. -- 添加数据
  15. INSERT INTO tb_user (name, phone, email, profession, age, gender, status, createtime) VALUES ('吕布', '17799990000', 'lvbu666@163.com', '软件工程', 23, '1', '6', '2001-02-02 00:00:00');
  16. INSERT INTO tb_user (name, phone, email, profession, age, gender, status, createtime) VALUES ('曹操', '17799990001', 'caocao666@qq.com', '通讯工程', 33, '1', '0', '2001-03-05 00:00:00');
  17. INSERT INTO tb_user (name, phone, email, profession, age, gender, status, createtime) VALUES ('赵云', '17799990002', '17799990@139.com', '英语', 34, '1', '2', '2002-03-02 00:00:00');
  18. INSERT INTO tb_user (name, phone, email, profession, age, gender, status, createtime) VALUES ('孙悟空', '17799990003', '17799990@sina.com', '工程造价', 54, '1', '0', '2001-07-02 00:00:00');
  19. INSERT INTO tb_user (name, phone, email, profession, age, gender, status, createtime) VALUES ('花木兰', '17799990004', '19980729@sina.com', '软件工程', 23, '2', '1', '2001-04-22 00:00:00');
  20. INSERT INTO tb_user (name, phone, email, profession, age, gender, status, createtime) VALUES ('大乔', '17799990005', 'daqiao666@sina.com', '舞蹈', 22, '2', '0', '2001-02-07 00:00:00');
  21. INSERT INTO tb_user (name, phone, email, profession, age, gender, status, createtime) VALUES ('露娜', '17799990006', 'luna_love@sina.com', '应用数学', 24, '2', '0', '2001-02-08 00:00:00');
  22. INSERT INTO tb_user (name, phone, email, profession, age, gender, status, createtime) VALUES ('程咬金', '17799990007', 'chengyaojin@163.com', '化工', 38, '1', '5', '2001-05-23 00:00:00');
  23. INSERT INTO tb_user (name, phone, email, profession, age, gender, status, createtime) VALUES ('项羽', '17799990008', 'xiaoyu666@qq.com', '金属材料', 43, '1', '0', '2001-09-18 00:00:00');
  24. INSERT INTO tb_user (name, phone, email, profession, age, gender, status, createtime) VALUES ('白起', '17799990009', 'baiqi666@sina.com', '机械工程及其自动化', 27, '1', '2', '2001-08-16 00:00:00');
  25. INSERT INTO tb_user (name, phone, email, profession, age, gender, status, createtime) VALUES ('韩信', '17799990010', 'hanxin520@163.com', '无机非金属材料工程', 27, '1', '0', '2001-06-12 00:00:00');
  26. INSERT INTO tb_user (name, phone, email, profession, age, gender, status, createtime) VALUES ('荆轲', '17799990011', 'jingke123@163.com', '会计', 29, '1', '0', '2001-05-11 00:00:00');
  27. INSERT INTO tb_user (name, phone, email, profession, age, gender, status, createtime) VALUES ('兰陵王', '17799990012', 'lanlinwang666@126.com', '工程造价', 44, '1', '1', '2001-04-09 00:00:00');
  28. INSERT INTO tb_user (name, phone, email, profession, age, gender, status, createtime) VALUES ('狂铁', '17799990013', 'kuangtie@sina.com', '应用数学', 43, '1', '2', '2001-04-10 00:00:00');
  29. INSERT INTO tb_user (name, phone, email, profession, age, gender, status, createtime) VALUES ('貂蝉', '17799990014', '84958948374@qq.com', '软件工程', 40, '2', '3', '2001-02-12 00:00:00');
  30. INSERT INTO tb_user (name, phone, email, profession, age, gender, status, createtime) VALUES ('妲己', '17799990015', '2783238293@qq.com', '软件工程', 31, '2', '0', '2001-01-30 00:00:00');
  31. INSERT INTO tb_user (name, phone, email, profession, age, gender, status, createtime) VALUES ('芈月', '17799990016', 'xiaomin2001@sina.com', '工业经济', 35, '2', '0', '2000-05-03 00:00:00');
  32. INSERT INTO tb_user (name, phone, email, profession, age, gender, status, createtime) VALUES ('嬴政', '17799990017', '8839434342@qq.com', '化工', 38, '1', '1', '2001-08-08 00:00:00');
  33. INSERT INTO tb_user (name, phone, email, profession, age, gender, status, createtime) VALUES ('狄仁杰', '17799990018', 'jujiamlm8166@163.com', '国际贸易', 30, '1', '0', '2007-03-12 00:00:00');
  34. INSERT INTO tb_user (name, phone, email, profession, age, gender, status, createtime) VALUES ('安琪拉', '17799990019', 'jdodm1h@126.com', '城市规划', 51, '2', '0', '2001-08-15 00:00:00');
  35. INSERT INTO tb_user (name, phone, email, profession, age, gender, status, createtime) VALUES ('典韦', '17799990020', 'ycaunanjian@163.com', '城市规划', 52, '1', '2', '2000-04-12 00:00:00');
  36. INSERT INTO tb_user (name, phone, email, profession, age, gender, status, createtime) VALUES ('廉颇', '17799990021', 'lianpo321@126.com', '土木工程', 19, '1', '3', '2002-07-18 00:00:00');
  37. INSERT INTO tb_user (name, phone, email, profession, age, gender, status, createtime) VALUES ('后羿', '17799990022', 'altycj2000@139.com', '城市园林', 20, '1', '0', '2002-03-10 00:00:00');
  38. INSERT INTO tb_user (name, phone, email, profession, age, gender, status, createtime) VALUES ('姜子牙', '17799990023', '37483844@qq.com', '工程造价', 29, '1', '4', '2003-05-26 00:00:00');
  39. # 创建索引
  40. -- 为name创造索引,因为name可能重复,这里创造简单索引
  41. create index idx_user_name on tb_user(name);
  42. -- 为phone创造索引,因为phone只有一个,我们创造唯一索引
  43. create unique index idx_user_phone on tb_user(phone);
  44. -- 创造联合索引,为professin,age,status创造联合索引
  45. create index idx_user_pro_age_status on tb_user(profession,age,status);
  46. -- 为email创造索引
  47. create index idx_user_email on tb_user(email);
  48. # 删除索引
  49. -- 我们删除email的索引
  50. drop index idx_user_email on tb_user;
  51. # 查看索引
  52. show index from tb_user;
复制代码
SQL性能分析

我们在后面的章节中将会讲到SQL语句的优化
那么优化自然是要针对SQL中性能较差的部分进行优化,因而这部分我们先讲解如何分析其性能差异
语句执行频率

在SQL中为我们提供了SHOW语句来查看当前数据库的INSERT,DELETE,UPDATE,SELECT的访问频率:
  1. # 显示SQL中各种语句的访问频率
  2. # 注意_______是七个_
  3. SHOW GLOBAL STATUS LIKE 'Com_______';
复制代码
慢查询日志

慢查询日志记录了所有执行时间超过指定参数(long_query_time,单位:秒,默认10秒)的所有SQL语句的日志。
MySQL的慢查询日志默认没有开启,我们可以查看一下系统变量 slow_query_log
  1. # 开启MYSQL慢日志查询开关
  2. slow_query_log = 1;
  3. # 设置慢查询日志的时间为2s,即SQL的语句执行时间超过2s就被记录到慢查询日志中
  4. long_query_time = 2;
复制代码
这部分暂时了解即可,我们在运维篇会重点介绍日志这一章节
profile详情

首先我们需要查看当前MySQL是否支持profile操作:
  1. # 查看是否支持profile操作
  2. SELECT @@have_profiling;
复制代码
在默认情况下profile操作时关闭的,我们需要通过set语句开启profile:
  1. # 开启profile操作
  2. SET profiling = 1;
复制代码
profile可以存储我们之前的操作时长,帮助我们在SQL优化中了解时间损耗的具体项目并加以改善:
  1. # 查看每条SQL语句的耗时情况
  2. SHOW profile;
  3. # 查看指定query_id的SQL语句各个阶段的耗时情况(这里的id是SHOW profile的标号id)
  4. SHOW profile for query query_id;
  5. # 查看指定query_id的SQL语句CPU的使用情况(这里的id是SHOW profile的标号id)
  6. show profile cpu for query query_id;
复制代码
explain执行计划

Explain是很重要的一部分,我们在下面的调试中经常使用并查看
EXPLAIN 或者 DESC命令获取 MySQL 如何执行 SELECT 语句的信息,包括在 SELECT 语句执行过程中表如何连接和连接的顺序 。
  1. -- 直接在select语句之前加上关键字 explain / desc
  2. EXPLAIN SELECT 字段列表 FROM 表名 WHERE 条件 ;
复制代码
我们可以看到一些关于字段的详细内容(针对其内部分析)
接下来我来一一解释EXPLAIN所给出的信息含义:
字段含义idselect查询的序列号,表示查询中执行select子句或者是操作表的顺序 (id相同,执行顺序从上到下;id不同,值越大,越先执行)。select_type表示 SELECT 的类型,常见的取值有 SIMPLE(简单表,即不使用表连接 或者子查询)、PRIMARY(主查询,即外层的查询)、 UNION(UNION 中的第二个或者后面的查询语句)、 SUBQUERY(SELECT/WHERE之后包含了子查询)等type表示连接类型,性能由好到差的连接类型为NULL、system、const、 eq_ref、ref、range、 index、all 。possible_key显示可能应用在这张表上的索引,一个或多个。Key实际使用的索引,如果为NULL,则没有使用索引。Key_len表示索引中使用的字节数, 该值为索引字段最大可能长度,并非实际使用长 度,在不损失精确性的前提下, 长度越短越好 。rowsMySQL认为必须要执行查询的行数,在innodb引擎的表中,是一个估计值, 可能并不总是准确的。filtered表示返回结果的行数占需读取行数的百分比, filtered 的值越大越好。索引使用

我们在前面已经学了索引的创建,索引实际上大部分是由系统决定使用类型,但我们也有需要注意的地方
时间差异

我们创建索引时需要遍历所有数据,因而创建索引时的时间相当于我们不创建索引而查询数据的时间
但当我们创建索引后去查询数据,就会发现时间大大减少
  1. # 假设我们的table中有1w条数据,当我们直接查询时可能需要10s
  2. SELECT * FROM table WHERE name = 02932131;
  3. # 但当我们创建name索引,这时可能耗时15s
  4. CREATE INDEX table_name_index ON table;
  5. # 然后我们再凭借name而进行数据查询时,耗时将会接近0s
  6. SELECT * FROM table WHERE name = 02932131;
复制代码
联合索引注意点

我们在使用联合索引时需要注意以下两点:
如果索引了多列(联合索引),要遵守最左前缀法则。
最左前缀法则指的是查询从索引的最左列开始,并且不跳过索引中的列。如果跳跃某一列,索引将会部分失效(后面的字段索引失效)。
  1. # 例如我们在前面建立了一个idx_user_pro_age_status索引包含了pro,age,status三个列
  2. # 当我们从左边往右边逐渐使用时不会产生错误:
  3. explain select * from tb_user where profession = '软件工程' and age = 31 and status= '0';
  4. explain select * from tb_user where profession = '软件工程' and age = 31;
  5. explain select * from tb_user where profession = '软件工程';
  6. # 但当我们中间省略一列,或者缺少最前面的列,后面的索引列将不再被使用
  7. explain select * from tb_user where age = 31 and status = '0';
  8. explain select * from tb_user where status = '0';
复制代码
注意:

在联合索引中,不允许出现(>, 30 and status = '0';# 但我们使用 = 则不受影响explain select * from tb_user where profession = '软件工程' and age >= 30 and status = '0';[/code]索引失效注意点

针对于索引失效的常见情况共有五种:
我们不能在索引列上继续运算,否则索引失效
  1. # 我们如果使用 <,> 后面的索引将不再生效
  2. explain select * from tb_user where profession = '软件工程' and age > 30 and status = '0';
  3. # 但我们使用 <=,>= 则不受影响
  4. explain select * from tb_user where profession = '软件工程' and age >= 30 and status = '0';
复制代码
字符串类型字段使用时,不加引号,索引将失效
  1. # 如果我们采用substring等操作,索引列将失效
  2. explain select * from tb_user where substring(phone,10,2) = '15';
复制代码
索引中禁止头部出现模糊查询
  1. # 这里最后一部分status的0未加引号,数据仍旧可以输出,但不再通过索引查询
  2. explain select * from tb_user where profession = '软件工程' and age = 31 and status= 0;
复制代码
用or分割开的条件, 如果or前的条件中的列有索引,而后面的列中没有索引,那么涉及的索引都不会被用到。
  1. # 如果头部出现%,索引失效
  2. -- 索引有效
  3. explain select * from tb_user where profession like '软件%';
  4. -- 索引失效
  5. explain select * from tb_user where profession like '%工程';
  6. -- 索引失效
  7. explain select * from tb_user where profession like '%工%';
复制代码
如果MySQL评估使用索引比全表更慢,则不使用索引。
  1. # 如果phone被设置有索引 但age未设置索引 ,则采用普通查询方法不采用索引
  2. explain select * from tb_user where phone = '17799990017' or age = 23;
复制代码
SQL提示

SQL提示,是优化数据库的一个重要手段,简单来说,就是在SQL语句中加入一些人为的提示来达到优化操作的目的。
  1. # 假设我们所查询的数据占用该表的大多数数据,可能不采用索引而直接采用全表查询
  2. -- 假设我们希望查询 phone 不为 NULL的行,但全表大部分都不为NULL,则会直接采用全表查询
  3. SELECT * FROM table WHERE phone is not NULL;
复制代码
覆盖索引

我们希望尽量使用覆盖索引,减少select  * 操作。
  1. # 因为我们的SQL系统自动判定时可能不会采用最佳的运行方法
  2. -- 比如 我们有 profession索引 和 profession,age,status联合索引
  3. -- 当我们希望查询含有profession,age,status的数据时,系统却自动选择profession索引导致速度降低
  4. -- 因而我们需要手动设置SQL提示来提高整体运行速度
  5. # 推荐使用索引 use index
  6. explain select * from tb_user use index(idx_user_pro) where profession = '软件工程';
  7. # 拒绝使用索引 ignore index
  8. explain select * from tb_user ignore index(idx_user_pro) where profession = '软件工程';
  9. # 强迫使用索引 force index
  10. explain select * from tb_user force index(idx_user_pro) where profession = '软件工程';
复制代码
前缀查询

当字段类型为字符串(varchar,text,longtext等)时,有时候需要索引很长的字符串,这会让索引变得很大,查询时,浪费大量的磁盘IO, 影响查询效率。
此时可以只将字符串的一部分前缀,建立索引,这样可以大大节约索引空间,从而提高索引效率。
  1. # 当我们可以一次性获得所有数据时就不再需要回表查询操作,可以大大提高查询速度
  2. -- 例如:我们的主键为id,索引有name
  3. -- 则下述我们在查询name时,可以获得id,这样就获得了所有数据,就不再进行回表查询
  4. SELECT * FROM table WHERE name = 'xxx';
  5. -- 但如果包含其他元素,我们就会进行回表查询,导致速度降低
  6. SELECT * FROM table WHERE name = 'xxx' and status = '0';
复制代码
当然我们也需要得知如何取得最合适的前缀长度:
  1. # 选择前缀长度来创建前缀索引
  2. create index idx_xxxx on table_name(column(n)) ;
复制代码
单列/联合索引选择

我们先来回顾一下单列索引和联合索引:
  1. # 可以根据索引的选择性来决定,而选择性是指不重复的索引值(基数)和数据表的记录总数的比值,索引选择性越高则查询效率越高
  2. # 唯一索引的选择性是1,这是最好的索引选择性,性能也是最好的。
  3. # 我们可以通过下述代码找到 不同元素 和 全部元素 的比例从而获得最佳前缀长度
  4. select count(distinct email) / count(*) from tb_user ;
  5. select count(distinct substring(email,1,5)) / count(*) from tb_user ;
复制代码
索引设计原则

我们的索引并非说是无条件的任意设计,我们针对索引的设计上有以下七条规则:
SQL优化

这部分我们来介绍SQL的优化
SQL的大部分优化主要是属于我们手动的优化以及配合索引的优化
插入数据优化

插入数据优化有四个方面:
  1. # 在业务场景中,如果存在多个查询条件,考虑针对于查询字段建立索引时,建议建立联合索引,而非单列索引。
复制代码
  1. # 我们在插入数据时,可以一次插入多条数据以进行SQL优化(可以一次插入500~1000条数据)
  2. insert into tb_test values (1,'TOM'),(2,'JERRY')...;
复制代码
  1. # SQL在每条语句后都进行提交会影响整体性能,我们可以手动提交以减轻电脑负担
  2. start transaction;
  3. insert into tb_test values (1,'TOM'),(2,'JERRY')...;
  4. insert into tb_test values (3,'TaM'),(4,'JyRRY')...;
  5. insert into tb_test values (5,'TeM'),(6,'JiRRY')...;
  6. commit;
复制代码
如果一次性插入超大量数据,insert语句的插入性能就太低了,因而我们采用load方法插入:
  1. # 主键的顺序插入会减轻SQL排序操作直接插入加快速度
  2. 主键插入:1,2,3,6,9,12,40,60...
复制代码
主键优化

首先我们要先了解InnoDB存储引擎的数据排序:
主键设计原则:
这里原本应该具有拓展知识:页合并和页分裂
但因不好讲解所以我把黑马邓老师的链接放在这里,有兴趣的小伙伴可以去查看:33. 进阶-SQL优化-主键优化_哔哩哔哩_bilibili
Order by优化

order by排序具有两种排序方式:
  1. # 如果想要更详细了解,可以移步其他大佬的文章介绍~
  2. -- 客户端连接服务端时,加上参数 -–local-infile
  3. mysql –-local-infile -u root -p
  4. -- 设置全局参数local_infile为1,开启从本地加载文件导入数据的开关
  5. set global local_infile = 1;
  6. -- 执行load指令将准备好的数据,加载到表结构中
  7. load data local infile '/root/sql1.log' into table tb_user fieldsterminated by ',' lines terminated by '\n' ;
复制代码
Order by优化原则:
Group by优化

Group by优化同样借助索引进行优化:
  1. # 我们通常直接排序(在不使用主键或者索引时)使用的是Using filesort
  2. explain select id,age,phone from tb_user order by name;
  3. # 但当我们通过主键排序或者使用索引后,采用Using index,速度提高
  4. create index idx_user_age_phone_aa on tb_user(age,phone);
  5. explain select id,age,phone from tb_user order by age,phone;
  6. explain select id,age,phone from tb_user order by age desc,phone desc;
  7. # 但是请注意:我们的索引排序也有具有ASC和DESC排序,当我们默认时均为ASC
  8. # 当我们采用ASC,ASC或DESC,DESC时可以采用Using index,但若以ASC,DESC或DESC,ASC的形式时使用Using filesort
  9. # 因而我们如果需要ASC,DESC或DESC,ASC的形式时需要再次创建index:create index idx_user_age_phone_aa on tb_user(age ASC,phone DESC);
  10. create index idx_user_age_phone_aa on tb_user(age ASC,phone DESC);
  11. explain select id,age,phone from tb_user order by age ASC,phone DESC;
复制代码
Group by优化原则:
Limit优化

limit用来作为分页操作,我们常常在数据过多时对limit进行优化:
  1. # 当我们正常使用时,效率较低
  2. explain select profession , count(*) from tb_user group by profession ;
  3. # 但当我们建立索引后,效率会有明显提升(注意同样满足索引的使用规范)
  4. create index idx_user_pro_age_sta on tb_user(profession , age , status);
  5. explain select profession , count(*) from tb_user group by profession ;
复制代码
Count优化

针对count操作,不同存储引擎有不同的处理方式:
优化思路:
在这里我们顺便讲解一下count的四种常见情况:
count用法含义count(主键)InnoDB 引擎会遍历整张表,把每一行的 主键id 值都取出来,返回给服务层。 服务层拿到主键后,直接按行进行累加(主键不可能为null)count(字段)没有not null 约束 : InnoDB 引擎会遍历整张表把每一行的字段值都取出 来,返回给服务层,服务层判断是否为null,不为null,计数累加。 有not null 约束:InnoDB 引擎会遍历整张表把每一行的字段值都取出来,返 回给服务层,直接按行进行累加。count(1)InnoDB 引擎遍历整张表,但不取值。服务层对于返回的每一行,放一个数字“1” 进去,直接按行进行累加。count(*)InnoDB引擎并不会把全部字段取出来,而是专门做了优化,不取值,服务层直接按行进行累加。注意:
Update优化

InnoDB的行锁是针对索引加的锁,不是针对记录加的锁 ,并且该索引不能失效,否则会从行锁升级为表锁 。
  1. # 当我们希望获得第900000个数据后的十个数据,就需要完全获得前9000000个数据才可以,这会损耗许多时间
  2. # 优化思路:
  3. # 我们通过select只获得第9000000个后的十个数据的id
  4. # 然后通过id对比来获得整行数据:
  5. explain select * from tb_sku t , (select id from tb_sku order by id limit 9000000,10) a where t.id = a.id;
复制代码
视图

视图(View)是一种虚拟存在的表。
视图中的数据并不在数据库中实际存在,行和列数据来自定义视图的查询中使用的表,并且是在使用视图时动态生成的。
通俗的讲,视图只保存了查询的SQL逻辑,不保存查询结果。所以我们在创建视图的时候,主要的工作就落在创建这条SQL查询语句上。
视图操作

视图的操作主要分为四部分:
  1. # 我们所需要注意的就是Update的操作尽量采用索引来进行改变,这样锁就会变成行锁,只控制这一行数据
  2. # 如果我们采用的Update的操作没有使用索引,那么就会采用表锁,导致整个表的数据都无法改变,影响其他人同步修改该表
  3. -- 这个就是采用行锁,你可以在另一个服务器同步修改该表中其他行
  4. update course set name = 'javaEE' where id = 1 ;
  5. -- 这个采用表锁,你无法在另一个服务器同步修改该表
  6. update course set name = 'SpringBoot' where name = 'PHP' ;
复制代码
  1. # 创建视图
  2. # [WITH [CASCADED | LOCAL] CHECK OPTION] 表示限制条件,我们在后续会讲到
  3. CREATE [OR REPLACE] VIEW 视图名称[(列名列表)] AS SELECT语句 [WITH [CASCADED | LOCAL] CHECK OPTION]
复制代码
  1. # 查询
  2. -- 查看创建视图语句
  3. SHOW CREATE VIEW 视图名称;
  4. -- 查看视图数据
  5. SELECT * FROM 视图名称;
复制代码
  1. # 修改
  2. -- 方法1:
  3. CREATE [OR REPLACE] VIEW 视图名称[(列名列表)] AS SELECT语句 [WITH [CASCADED | LOCAL] CHECK OPTION]
  4. -- 方法2:
  5. ALTER VIEW 视图名称[(列名列表)] AS SELECT语句 [WITH [CASCADED | LOCAL] CHECK OPTION]
复制代码
注意:
CHECK检查操作

视图的CHECK检查操作就是指[WITH [CASCADED | LOCAL] CHECK OPTION]这部分
首先我们要明白为什么需要检查操作:
  1. DROP VIEW [IF EXISTS] 视图名称;
复制代码
当使用WITH CHECK OPTION子句创建视图时,MySQL会通过视图检查正在更改的每个行,例如 插入,更新,删除,以使其符合视图的定义。
MySQL允许基于另一个视图创建视图,它还会检查依赖视图中的规则以保持一致性。
为了确定检查的范围,mysql提供了两个选项: CASCADED 和 LOCAL,默认值为 CASCADED 。
  1. # 我们在对视图进行INSERT操作时,会直接对原表进行操作
  2. # 但倘若我们对原表操作成功,但是对该视图要求不符合,该操作结构是不会产生在视图中的,导致原表改变但并未达到我们希望的效果
  3. # 另一方面,我们对视图的创建常常建立于另一视图的操作
  4. # 倘若我们不对此设置检查,可能导致视图创建失败或对之前视图操作失败
复制代码
  1. # 首先我们来介绍CHECK操作
  2. -- CHECK操作会对视图要求进行检测并加以约束
  3. -- 假设我们有一个 原表table含有age属性
  4. -- 下述视图没有设置CHECK
  5. CREATE VIEW table_view1 AS SELECT id,age FROM table WHERE age > 20;
  6. -- 当我们对view1操作时,如果添加的数据没有大于20,仍旧会执行成功
  7. INSERT INTO table_view1 values (1,18);
  8. -- 下述视图设置CHECK
  9. CREATE VIEW table_view2 AS SELECT id,age FROM table WHERE age > 20 WITH CASCADED CHECK OPTION;
  10. -- 当我们对view1操作时,如果添加的数据没有大于20,不会执行成功
  11. INSERT INTO table_view2 values (1,18);
复制代码
  1. # 下面我们介绍CASCADED操作
  2. -- CASCADED:不仅为当前视图检查条件,而且为当前视图的之前视图检查条件
  3. -- 假设我们有一个 原表table含有age属性
  4. -- 下述视图没有设置CHECK
  5. CREATE VIEW table_view1 AS SELECT id,age FROM table WHERE age > 20;
  6. -- 下述视图view2以view1为模板设置检查条件
  7. CREATE VIEW table_view2 AS SELECT id,age FROM table WHERE age < 25 WITH CASCADED CHECK OPTION;
  8. -- 这时,我们所添加的数据不仅需要满足当前条件age<25,并且需要满足上一视图条件age>20
  9. INSERT INTO table_view2 values (1,23);
复制代码
表级锁

表级锁,每次操作锁住整张表。
锁定粒度大,发生锁冲突的概率最高,并发度最低。应用在MyISAM、InnoDB、BDB等存储引擎中。
对于表级锁,主要分为以下三类:
表锁

表锁一般分为两种:
语法:
  1. # 下面我们介绍LOCAL操作
  2. -- LOCAL:只为当前视图检查条件,不为之前视图设置条件
  3. -- 假设我们有一个 原表table含有age属性
  4. -- 下述视图没有设置CHECK
  5. CREATE VIEW table_view1 AS SELECT id,age FROM table WHERE age > 20;
  6. -- 下述视图view2以view1为模板设置检查条件
  7. CREATE VIEW table_view2 AS SELECT id,age FROM table WHERE age < 25 WITH LOCAL CHECK OPTION;
  8. -- 这时,我们所添加的数据只需要满足当前条件age<25即可
  9. INSERT INTO table_view2 values (1,10);
复制代码
总结:
元数据锁(MDL)

MDL加锁过程是系统自动控制,无需显式使用,在访问一张表的时候会自动加上。
MDL锁主要作用:
MDL具体操作为:
对应SQL锁类型说明lock tables xxx read / writeSHARED_READ_ONLY / SHARED_NO_READ_WRITEselect 、select ... lock in share modeSHARED_READ与SHARED_READ、 SHARED_WRITE兼容,与 EXCLUSIVE互斥insert 、update、 delete、select ... for updateSHARED_WRITE与SHARED_READ、 SHARED_WRITE兼容,与 EXCLUSIVE互斥alter table ...EXCLUSIVE与其他的MDL都互斥下面我们给出案例演示:
  1. # 创建存储过程
  2. CREATE PROCEDURE 存储过程名称([参数列表])
  3. BEGIN
  4.         --SQL语句
  5. END;
复制代码
  1. # 调用存储过程
  2. CALL 名称([参数])
复制代码
下面我们提供一条语句进行锁的查看:
  1. # 查看存储过程
  2. -- 查询指定数据库的存储过程及状态信息
  3. SELECT * FROM INFORMATION_SCHEMA.ROUTINES WHERE ROUTINE_SCHEMA = 'XXX';
  4. -- 查询某个存储过程的定义
  5. HOW CREATE PROCEDURE 存储过程名称 ;
复制代码
意见锁

为了避免DML在执行时,加的行锁与表锁的冲突
在InnoDB中引入了意向锁,使得表锁不用检查每行数据是否加锁,使用意向锁来减少表锁的检查。
首先我们先来模拟一下加锁环节:
  1. # 删除存储过程
  2. DROP PROCEDURE [IF EXISTS] 存储过程名称;
复制代码
意见锁分为两种:
我们同样给出案例解释:
  1. # 查看系统变量
  2. -- 查看所有系统变量
  3. SHOW [SESSION | GLOBAL] VARIABLES;
  4. -- 可以通过LIKE模糊匹配查找变量
  5. SHOW [SESSION | GLOBAL] VARIABLES LIKE '...';
  6. -- 直接查看指定变量
  7. SELECT @@[SESSION | GLOBAL].系统变量名;
  8. # 设置系统变量
  9. SET [SESSION | GLOBAL] 系统变量名 = 值;
  10. SET @@[SESSION | GLOBAL].系统变量名 = 值;
复制代码
  1. # 赋值
  2. -- 直接赋值
  3. SET @var_name = expr [, @var_name = expr] ... ;
  4. SET @var_name := expr [, @var_name := expr] ... ;
  5. SELECT @var_name := expr [, @var_name := expr] ... ;
  6. -- 从表中抽取数据进行赋值
  7. SELECT 字段名 INTO @var_name FROM 表名;
  8. # 使用
  9. SELECT @var_name ;
复制代码
行级表

行级锁,每次操作锁住对应的行数据。锁定粒度最小,发生锁冲突的概率最低,并发度最高。应用在InnoDB存储引擎中。
InnoDB的数据是基于索引组织的,行锁是通过对索引上的索引项加锁来实现的,而不是对记录加的锁。
对于行级锁,主要分为以下三类:
行锁

InnoDB实现了以下两种类型的行锁 :
注意:
下面我们给出不同SQL语句相对应的行锁级别:
SQL行锁类型说明INSERT排他锁自动加锁UPDATE排他锁自动加锁DELETE排他锁自动加锁SELECT不加锁SELECT ... LOCK IN SHARE MOOE共享锁需要手动在SELECT之后加LOCK IN SHARE MODESELECT ... FOR UPDATE排他锁需要手动在SELECT之后加FOR UPDATE行锁特点:
我们同样给出案例解释:
  1. # 声明
  2. -- [DEFAULT ...]表示设置初始化值
  3. DECLARE 变量名 变量类型[DEFAULT ...]
  4. # 赋值
  5. SET 变量名 = 值 ;
  6. SET 变量名 := 值 ;
  7. SELECT 字段名 INTO 变量名 FROM 表名 ... ;
复制代码
  1. CREATE PROCEDURE 存储过程名称 ([ IN/OUT/INOUT 参数名 参数类型 ])
  2. BEGIN
  3. -- SQL语句
  4. END ;
复制代码
  1. IF 条件1 THEN
  2. .....
  3. ELSEIF 条件2 THEN -- 可选
  4. .....
  5. ELSE -- 可选
  6. .....
  7. END IF;
复制代码
  1. # case结构1:
  2. -- 当case_value的值为 when_value1时,执行statement_list1,
  3. -- 当值为 when_value2时,执行statement_list2,
  4. -- 否则就执行 statement_list
  5. CASE case_value
  6.         WHEN when_value1 THEN statement_list1
  7.         [ WHEN when_value2 THEN statement_list2] ...
  8.         [ ELSE statement_list ]
  9. END CASE;
  10. # case结构2:
  11. -- 当条件search_condition1成立时,执行statement_list1,
  12. -- 当条件search_condition2成立时,执行statement_list2,
  13. -- 否则就执行 statement_list
  14. CASE
  15.         WHEN search_condition1 THEN statement_list1
  16.         [WHEN search_condition2 THEN statement_list2] ...
  17.         [ELSE statement_list]
  18. END CASE;
复制代码
  1. # while循环结构
  2. -- 先判定条件,如果条件为true,则执行逻辑,否则,不执行逻辑
  3. WHILE 条件 DO
  4.         SQL逻辑...
  5. END WHILE;
复制代码
间隙锁&临键锁

默认情况下,InnoDB在 REPEATABLE READ事务隔离级别运行,InnoDB使用 next-key 锁进行搜索和索引扫描,以防止幻读。
一般出现上述锁有以下三种情况:
注意:
接下来我们通过案例进行解释:
  1. # repeat循环结构
  2. -- 先执行一次逻辑,然后判定UNTIL条件是否满足,如果满足,则退出。如果不满足,则继续下一次循环
  3. REPEAT
  4.     SQL逻辑...
  5.     UNTIL 条件
  6. END REPEAT;
复制代码
  1. # loop循环结构
  2. -- begin_label可以自己设置
  3. -- 退出指定标记的循环体:LEAVE label;
  4. -- 直接进入下一次循环: ITERATE label;
  5. [begin_label:] LOOP
  6.         SQL逻辑...
  7. END LOOP [end_label];
复制代码
  1. # 要求:计算从1到n之间的偶数累加的值,n为传入的参数值。
  2. -- A. 定义局部变量, 记录累加之后的值;
  3. -- B. 每循环一次, 就会对n进行-1 , 如果n减到0, 则退出循环 ----> leave xx
  4. -- C. 如果当次累加的数据是奇数, 则直接进入下一次循环. --------> iterate xx
  5. -- 创建存储过程
  6. create procedure p10(in n int)
  7. begin
  8.         -- 设置返回值
  9.     declare total int default 0;
  10.    
  11.     -- 进入loop循环,sum是label标记
  12.     sum:loop
  13.    
  14.     -- 整体结束判断:如果n减到0, 则退出循环
  15.     if n<=0 then
  16.     leave sum;
  17.     end if;
  18.    
  19.     -- 单个判断:如果当次累加的数据是奇数, 则直接进入下一次循环.
  20.     if n%2 = 1 then
  21.     set n := n - 1;
  22.     iterate sum;
  23.     end if;
  24.    
  25.     -- 如果没有问题,最后执行语句
  26.     set total := total + n;
  27.     set n := n - 1;
  28.    
  29.     -- 结束loop循环
  30.     end loop sum;
  31.    
  32.     -- 输出结果
  33.     select total;
  34. end;
  35. -- 执行存储过程
  36. call p10(100);
复制代码
InnoDB引擎(拓展内容)

这部分内容大多数属于底层解释,稍微查看理解即可。
InnoDB逻辑存储结构

首先我们来查看一张图,该图表示了InnoDB引擎的整体结构

我们依次介绍图中元素:
表空间是InnoDB存储引擎逻辑结构的最高层, 如果用户启用了参数 innodb_file_per_table(在8.0版本中默认开启) ,则每张表都会有一个表空间(xxx.ibd),一个mysql实例可以对应多个表空间,用于存储记录、索引等数据。
段,分为数据段(Leaf node segment)、索引段(Non-leaf node segment)、回滚段(Rollback segment),InnoDB是索引组织表,数据段就是B+树的叶子节点, 索引段即为B+树的非叶子节点。段用来管理多个Extent(区)。
区,表空间的单元结构,每个区的大小为1M。 默认情况下, InnoDB存储引擎页大小为16K, 即一个区中一共有64个连续的页。
页,是InnoDB 存储引擎磁盘管理的最小单元,每个页的大小默认为 16KB。为了保证页的连续性,InnoDB 存储引擎每次从磁盘申请 4-5 个区。
行,InnoDB 存储引擎数据是按行进行存放的
注意行中有两个隐藏字段:
架构

MySQL5.5 版本开始,默认使用InnoDB存储引擎,它擅长事务处理,具有崩溃恢复特性,在日常开发中使用非常广泛。
下面是InnoDB架构图,左侧为内存结构,右侧为磁盘结构。

接下来我们分别从内存结构和磁盘结构分开介绍,并在最后介绍一下后台线程:


在InnoDB的后台线程中,分为4类,分别是:Master Thread 、IO Thread、Purge Thread、Page Cleaner Thread。
事务原理

在介绍事务原理前,我们先回顾一下事务的基本概念:
事务的四大特点:
而这四大特点均有相关的技术支持,我们在下面一一介绍:
redo log

重做日志,记录的是事务提交时数据页的物理修改,是用来实现事务的持久性。
该日志文件由两部分组成:重做日志缓冲(redo log buffer)以及重做日志文件(redo logfile),前者是在内存中,后者在磁盘中。
当事务提交之后会把所有修改信息都存到该日志文件中, 用于在刷新脏页到磁盘,发生错误时, 进行数据恢复使用。
undo log

回滚日志,用于记录数据被修改前的信息 , 作用包含两个 :
undo log和redo log记录物理日志不一样,它是逻辑日志:
undo log 具有两种操作:
MVCC多版本并发控制

我们先通过对比来认识一下MVCC的概念
首先我们了解一下当前读:
然后了解一下快照读:
最后我们来介绍MVCC多版本并发控制:
实现原理三部曲

当我们创建一个表之后,表中的字段不仅仅包括我们创造的字段,还包括三个自动生成的字段:
隐藏字段含义DB_TRX_ID最近修改事务ID,记录插入这条记录或最后一次修改该记录的事务ID。DB_ROLL_PTR回滚指针,指向这条记录的上一个版本,用于配合undo log,指向上一个版本。DB_ROW_ID隐藏主键,如果表结构没有指定主键,将会生成该隐藏字段。回滚日志,在insert、update、delete的时候产生的便于数据回滚的日志。
undo log日志删除条件:
ReadView(读视图)是 快照读 SQL执行时MVCC提取数据的依据,记录并维护系统当前活跃的事务(未提交的)id。
readView包含四个重要字段:
字段含义m_ids当前活跃的事务ID集合min_trx_id最小活跃事务IDmax_trx_id预分配事务ID,当前最大事务ID+1(因为事务ID是自增的)creator_trx_idReadView创建者的事务ID而在readview中就规定了版本链数据的访问规则:  (trx_id 代表当前undolog版本链对应事务ID。  )
[table][tr]条件是否可以访问说明[/tr][tr][td]trx_id == creator_trx_id[/td][td]可以访问该版本[/td][td]成立,说明数据是当前这个事务更改[/td][/tr][tr][td]trx_id < min_trx_id[/td][td]可以访问该版本[/td][td]成立,说明数据已经提交了。[/td][/tr][tr][td]trx_id > max_trx_id[/td][td]不可以访问该版本[/td][td]成立,说明该事务是在 ReadView生成后才开启。[/td][/tr][tr][td]min_trx_id




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4