对于join操作，MySQL它是咋做的？

时间：2019-10-12 09:24:44 阅读：122 评论：0 收藏：0 [点我收藏+]

　　首先我们对于join操作，需要了解两个概念：驱动表和被驱动表。首先先给出两张表：

CREATE TABLE `t2` (
  `id` int(11) NOT NULL,
  `a` int(11) DEFAULT NULL,
  `b` int(11) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `a` (`a`)
) ENGINE=InnoDB;

drop procedure idata;
delimiter ;;
create procedure idata()
begin
  declare i int;
  set i=1;
  while(i<=1000)do
    insert into t2 values(i, i, i);
    set i=i+1;
  end while;
end;;
delimiter ;
call idata();

create table t1 like t2;
insert into t1 (select * from t2 where id<=100)

t1数据100行，t2数据1000行，a字段有索引，b字段无索引。

select * from t1 straight_join t2 on (t1.a=t2.a);// 在执行该sql时，t1被强制性作为驱动表，而t2就是被驱动表了

　　这条语句执行过程是先对t1全表扫，拿到每一行数据的a值，然后作为搜索条件到t2表里进行搜索，以为b有索引并且b的值不重复，所以认为扫表（回表）次数就是100+1000(因为走索引很快并且只要找到对应的t2的a之后只需要回表一次)，ok，扫表次数：N+M。

　　之后再看复杂度，首先t1的扫表次数是N，其次每一个t1的行在t2里都需要做两次索引查找操作，可以认为是N*2*logM，因此复杂度为：N+N*2*logM。

　　由此可见，当小表作为驱动表时，复杂度会小很多！但是这是在被驱动表t2的a值有索引的情况下，如果没有索引，t2就只能全表扫描了，这种情况下建议立马考虑索引问题，虽然说mysql对此有它自己的优化方案：Block Nested Loop

　　我们可以再看一看对于驱动表没有索引的情况下再采用上面的方式，扫表次数以及判断复杂度的不同：

　　（1）扫表：t1还是继续他的N次扫表，然后t2就大有不同了，因为缺少了索引，导致只能走全表扫描也就是M次，那也就是相当暴力的N+N*M次扫表，这个时候不论大表做驱动还是小表做驱动，扫表次数都一样。。。