专栏学习-MySQL实战45讲(三)

本文是个人学习极客时间专栏《MySQL实战45讲》过程中所记录的一些笔记,内容来源于专栏

MySQL高可用

主备延迟

在备库上执行 show slave status 命令,它的返回结果里面会显示 seconds_behind_master,用于表示当前备库延迟了多少秒。主备延迟的来源可能

  • 备库所在机器的性能要比主库所在的机器性能差

  • 备库的压力大

  • 大事务,如一次性地用 delete 删除太多数据,大表 DDL 等

主备切换策略

  • 可靠性优先策略(有不可用时间)

    • 判断备库 B 现在的 seconds_behind_master,如果小于某个值(比如 5 秒)继续下一步,否则持续重试这一步;

    • 把主库 A 改成只读状态,即把 readonly 设置为 true;

    • 判断备库 B 的 seconds_behind_master 的值,直到这个值变成 0 为止;

    • 把备库 B 改成可读写状态,也就是把 readonly 设置为 false;

    • 把业务请求切到备库 B。

  • 可用性优先策略(有可能出现数据不一致)

    • 不等主备数据同步,直接把连接切到备库 B,并且让备库 B 可以读写

MySQL Join

Index Nested-Loop Join

  • **可以用上被驱动表的索引。**先遍历驱动表(全表扫描),然后从驱动表中取出每行数据中的关联值,去被驱动表中查找满足条件的记录(树搜索)

Block Nested-Loop Join

  • 被驱动表上无索引可用。把驱动表的数据读入线程内存 join_buffer 中(全表扫描,存不下则分段取),把被驱动表的每一行取出来(全表扫描),跟 join_buffer 中的数据做对比,满足 join 条件的,作为结果集的一部分返回

Join 该怎么用

  • 能不能使用 join 语句?

    • 如果可以使用 Index Nested-Loop Join 算法,也就是说可以用上被驱动表上的索引,其实是没问题的

    • 如果使用 Block Nested-Loop Join 算法,扫描行数就会过多。尤其是在大表上的 join 操作,这样可能要扫描被驱动表很多次,会占用大量的系统资源。所以这种 join 尽量不要用

  • 如果要使用 join,应该选择大表做驱动表还是选择小表做驱动表?

    • 总是应该使用小表做驱动表(在决定哪个表做驱动表的时候,应该是两个表按照各自的条件过滤,过滤完成之后,计算参与 join 的各个字段的总数据量,数据量小的那个表,就是“小表”,应该作为驱动表

常见配置参数

  • join_buffer_size:控制Join Buffer的大小,调大后可以避免多次的被驱动表扫描,从而提高性能。默认值为257KB

自增主键为什么不是连续的

自增值保存在哪

  • MyISAM 引擎的自增值保存在数据文件中

  • InnoDB 引擎的自增值,其实是保存在了内存里,并且到了 MySQL 8.0 版本后,才有了“自增值持久化”的能力

    • 在 MySQL 5.7 及之前的版本,自增值保存在内存里,并没有持久化。每次重启后,第一次打开表的时候,都会去找自增值的最大值 max(id),然后将 max(id)+1 作为这个表当前的自增值

    • 在 MySQL 8.0 版本,将自增值的变更记录在了 redo log 中,重启的时候依靠 redo log 恢复重启之前的值

自增值修改机制

假设,某次要插入的值是 X,当前的自增值是 Y

  • 如果 X < Y,那么这个表的自增值不变;

  • 如果 X ≥ Y,那么需要把当前自增值修改为新的自增值

新的自增值生成算法是:从 auto_increment_offset 开始,以 auto_increment_increment 为步长,持续叠加,直到找到第一个大于 X 的值,作为新的自增值。其中,auto_increment_offset 和 auto_increment_increment 是两个系统参数,分别用来表示自增的初始值步长,默认值都是 1

自增值修改时机

  • 表的自增值修改是在真正执行插入数据的操作之前,且自增值不会回退(MySQL 这么设计是为了提升性能,回退需要多一次判断id存不存在或需要扩大自增id锁的范围),所以如果插入数据操作失败(如唯一键冲突)或事务回滚,那么自增主键将出现不连续的情况(但是递增的)

自增主键不连续的原因

  • 数据插入时发生唯一索引冲突

  • 数据插入事务回滚

  • 自增主键的批量申请。对于批量插入语句(如 insert … select、replace … select、load data 语句),MySQL 有一个批量申请自增 id 的策略,第一次申请分配1个自增id,后续每次申请的 id 都是上一次的两倍,当 id 用不到时会浪费掉