首页 > 数据库技术 > 详细

MySQL==> SQL执行流程分析

时间:2020-05-04 17:16:57      阅读:57      评论:0      收藏:0      [点我收藏+]

一、MySQL基本架构

技术分享图片从该图可以看出,MySQL 主要分为 Server 层和存储引擎层:

  • Server 层中包含连接器,查询缓存,分析器,优化器,执行器,涵盖 MySQL 的大多数核心服务功能,以及所有的内置函数(如日期、时间、数学和加密函数等),所有跨存储引擎的功能(存储过程、触发器、视图等)都在这一层实现。
  • 存储引擎层主要负责最终数据的存储和提取,其架构模式是插件式的,支持 InnoDB、MyISAM、Memory等多个存储引擎。现在最常用的存储引擎是 InnoDB,它从 MySQL 5.5.5 版本开始成为了默认存储引擎。

二、SELECT 语句的执行过程

  SELECT 语句的执行过程为:连接、查询缓存、词法分析,语法分析,语义分析,构造执行树,生成执行计划、执行器执行计划,下面开始梳理一次完整的查询流程:

技术分享图片

连接器

  • 连接器负责与客户端建立连接,获取权限,维持和管理连接
  • 连接命令: >mysql -uroot -p123456 -h127.0.0.1 -P3306 -A
    • 其中 mysql 是自带的一个客户端连接工具
  • 连接的基本流程: 认证用户名+密码 -> 权限列表中查询拥有的权限
    • 后续的权限判断,都依赖于此时读到的权限.因此在修改权限之后要想生效需要重新登录
  • 连接建立后,无其他动作,则此连接将处于空闲状态.
    • 查看命令: >show processlist
    • Command列若显示为Sleep,则表示空闲
  • 若连接后无任何动作,连接器会自动断开
    • 控制参数: wait_timeout, 默认8小时
    • 针对非交互式连接
    • 例: jdbc的方式
  • 控制参数: interactive_timeout, 默认8小时
    • 针对交互式连接(交互式连接:即在mysql_real_connect()函数中使用了CLIENT_INTERACTIVE选项)
    • 例:终端的连接方式
  • 资料:
  • 长连接&短连接
    • 建议使用长连接,减少资源建立时的开销,因为建立连接的过程比较复杂(开空间,验证密码,查权限...)
    • 但是如果都使用长连接,则可能会导致MySQL占用内存增长过快而出现内存溢出
    • 原因是MySQL在执行过程中临时使用的内存是管理在连接对象里面的.这些资源是要到连接断开时才会释放的.
    • 长期积累会导致内存溢出,被系统强行kill掉,现象就是MySQL异常重启
    • 解决:
      • 定期断开长连接.使用一段时间/程序判断执行过一个占用内存极大的查询过后断开连接,之后在重连
      • MySQL5.7之后,可在每次执行一个较大的操作后,执行mysql_reset_connection来重新初始化连接资源.此过程不需要重连和重新做权限验证.会将连接恢复到刚刚创建完成时的状态.
    • mysql_reset_connection参考资料:

查询缓存

  • 执行过的查询会被 MySQL 以 key-value 的形式缓存起来. key 是查询语句, value 是查询结果
  • 实际使用时不建议开启此功能.原因是 MySQL 在执行 update 时会将整个表的所有缓存都失效
  • 定制化配置:
    • query_cache_type=DEMAND, 默认的 SQL 都不使用查询缓存.
  • 显示指定使用缓存:
    • select SQL_CACHE * from tb_xxx where id=xxx;
  • MySQL8.0以上版本已将此功能废弃

分析器

  • 解析SQL语句
  • 词法分析: 解析输入的语句的每个单词,将 select 识别为查询语句,from 之后的字符串识别为表等
    • 从 information schema 里面获得表的结构信息
  • 语法分析: 基于词法分析的结果,语法分析器会判断是否满足 MySQL 语法规则

优化器

  • 经过分析器之后, MySQL 即知道具体需要做什么操作,但是在具体操作之前要先经过优化器
  • 优化:
    • 表中若存在多个索引时,选择该使用哪个索引
    • 多表关联时,决定各表的连接顺序

执行器

  • 具体该执行的操作.
    • 执行之前要先判断对表的操作是否具备权限.如果没有会返回权限错误的提示
    • 如果存在查询缓存,会在查询缓存返回结果时来做权限验证,查询会在优化器之前调用 precheck 验证权限
    • 具备权限之后,即打开表开始执行.打开表时会根据表的引擎定义来选择具体的引擎,并调用其接口来执行
  • 执行过程(无索引,InnoDB):
    • 调用 InnoDB 引擎取此表的第一行数据,判断 Where 条件是否满足,满足则将此行存在结果集中, 不满足则跳过
    • 调用 InnoDB 引擎取下一行数据,重复上述逻辑,直到最后一行
    • 执行器将所有满足条件的行作为结果集返回给客户端
  • 问题:
    • 对表的权限验证为何是在执行器阶段来执行?
      • SQL语句要操作的表不只是SQL字面上那些,例如触发器,得在执行器阶段(过程中)才能确定。优化器等其他阶段是无能为力的

存储引擎

  • 负责数据的存储和提取

总结

  • 1、客户端与服务端连接,连接器来负责建立连接
    • cmd: mysql -uroot -p123456 -h127.0.0.1 -P3306 -A
    • 过程:
      • 验证用户名+密码
      • 从权限列表中查询所拥有的权限
  • 2、判断是否命中查询缓存,检查当前是否开启了查询缓存(query_cache_type)
    • 如果开启了查询缓存,则用当前 sql 作为 key 去缓存中查询,如果存在,则直接返回结果
  • 3、分析SQL: 分析器工作,分析SQL,先做词法分析
    • 识别出关键字如 select,insert, from 后的表, where 后的查询条件等
  • 4、语法分析,基于词法分析的结果,来识别当前的SQL是否满足语法规定,比如关键字的使用先后顺序等

  • 5、优化SQL执行,优化器工作,优化SQL的执行
    • 如:选择要使用的索引
    • 如:连表时选择的连接顺序
  • 6、执行SQL,执行器工作,执行SQL语句
    • 判断对此表是否具有查询权限
    • 权限具备,则打开表开始执行
    • 根据表的引擎定义,选择具体的引擎,去调引擎的接口执行查询
    • 查询到的数据放入内存中,放入结果集里.
    • 查询完毕后,将结果集返回给客户端

三、UPDATE 语句执行过程

  UPDATE 语句执行过程总体上和 SELECT 语句是差不多的,分为:连接、查询缓存、词法分析,语法分析,语义分析,构造执行树,生成执行计划、执行器执行计划。但是有两个过程是完全不一样的:

  • 第一个是查询缓存阶段,SELECT 语句是去缓存查有没有相同 SELECT 语句,并将其结果取出返回给客户端,而 UPDATE 语句是去清空该表的查询缓存。
  • 第二个是执行器阶段,SELECT 语句是将磁盘上的数据取出,而 UPDATE 语句是先查到这些数据,然后进行更新并写入磁盘。
  • 其他包括连接、词法分析、语法分析、生成执行计划等过程都是一样的。

更新流程涉及到两个重要的日志模块,binlog(归档日志) 和 redo log(重做日志)

binlog

  binlog 记录了对 MySQL 数据库执行更改的所有操作,但是不包括 SELECT 和 SHOW 这类操作,因为这类操作对数据本身并没有修改。若操作本身并没有导致数据库发生变化,那么该操作也会写入二进制日志。

  binlog 是 Server 层特有的。

redo log

  redo log又称重做日志文件,用于记录事务操作的变化,记录的是数据修改之后的值,不管事务是否提交都会记录下来。在实例和介质失败(media failure)时,redo log文件就能派上用场,如数据库掉电,InnoDB存储引擎会使用redo log恢复到掉电前的时刻,以此来保证数据的完整性。

  redo log 是 InnoDB 独有的,属于存储引擎层。

binlog 和 redo log 的区别

 

MySQL==> SQL执行流程分析

原文:https://www.cnblogs.com/L-Test/p/12810076.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!