以下仅考虑 InnoDB 存储引擎。
自增主键有两个性质需要考虑:
为何会有单调性的问题?
这主要跟自增主键最大值的获取方式,以及存放位置有关系。
如果最大值是通过计算获取的,并且在某些情况下需要重新获取时,会因为最新的数据被删除而减小。
MySQL 5.7 及之前的版本,自增主键最大值会在启动(重启)后从数据库中取出放到内存:
SELECT MAX(ai_col) FROM table_name FOR UPDATE;
这样获取是通过计算的,并且由于存放在内存而容易丢失。
如果删除最新一条数据(假设 ID 为 10),因故障或者其他必要重启后再插入一条数据时会使用之前的 ID (即 ID 为 10)。
问题在于如果有其他表依赖了该 ID,则其他表的数据关联到的数据就符合要求了。除非设置了外键。
比如我要向最大一个 ID 的账号充了 100 万。但是在充值之前,该账号被删除,然后服务器故障重启,重启后有人新注册了一个账号。结果我的 100 万充到了他的新账号上。注册新账号的人以为是新手福利,笑嘻嘻。
从 MySQL 8.0 开始,自增主键最大值会在每次修改后写入到 redo log,并且在每个检查点写入引擎私有的系统表。
但由于数据库可能在 redo log 刷入磁盘前就故障了,所以可能会用到之前申请的 ID。
注:如果 redo log 都没刷入,就更不用说将数据插入数据表了。
InnoDB AUTO_INCREMENT Counter Initialization
https://dev.mysql.com/doc/refman/8.0/en/innodb-auto-increment-handling.html#innodb-auto-increment-initialization
这里不考虑由于删除导致的连续性问题
为何会有连续性问题?
这主要是跟插入事务回滚有关系。
对于两个插入事务,事务 A 先执行插入语句,之后事务 B 执行插入语句。在这之后,事务 A 回滚,导致 A 执行插入语句时占用的 ID 被抛弃。
之所以事务 A 没提交的情况下,事务 B 就能执行插入语句,跟 InnoDB 的自增长锁(AUTO-INC Locking)相关。该锁是一种特殊的表锁(table-level lock),但会在插入语句执行后立即释放,不会等到事务结束。
使用最高隔离级别 SERIALIZABLE (串行)。
由于性能上的考虑,通常不这样做。
事务 A 和事务 B 都在执行 不确定数量 的批量插入(INSERT ... SELECT):
三种插入定义:
如果主动指定 ID 为 0 或者 NULL 插入,则会使用数据库生成的自增 ID。
为什么 MySQL 的自增主键不单调也不连续
https://database.51cto.com/art/202004/614923.htm
《MySQL技术内幕——InnoDB存储引擎》 第 6 章:锁
原文:https://www.cnblogs.com/schaepher/p/12798203.html