mysql中的mvcc 原理详解_数据库-免费资源网

来自：网络

时间：2022-12-27

阅读：

简介

MVCC（Multi-Version Concurrency Control）多版本并发控制，是用来在数据库中控制并发的方法，实现对数据库的并发访问用的。在MySQL中，MVCC只在读取已提交（Read Committed）和可重复读（Repeatable Read）两个事务级别下有效。其是通过Undo日志中的版本链和ReadView一致性视图来实现的。MVCC就是在多个事务同时存在时，SELECT语句找寻到具体是版本链上的哪个版本，然后在找到的版本上返回其中所记录的数据的过程。

首先需要知道的是，在MySQL中，会默认为我们的表后面添加三个隐藏字段：

DB_ROW_ID：行ID，MySQL的B+树索引特性要求每个表必须要有一个主键。如果没有设置的话，会自动寻找第一个不包含NULL的唯一索引列作为主键。如果还是找不到，就会在这个DB_ROW_ID上自动生成一个唯一值，以此来当作主键（该列和MVCC的关系不大）；
DB_TRX_ID：事务ID，记录的是当前事务在做INSERT或UPDATE语句操作时的事务ID（DELETE语句被当做是UPDATE语句的特殊情况，后面会进行说明）；
DB_ROLL_PTR：回滚指针，通过它可以将不同的版本串联起来，形成版本链。相当于链表的next指针。

注意，添加的隐藏字段并不是很多人认为的创建时间和删除时间，同时在MySQL中MVCC的实现也不是通过什么快照来实现的。之所以有这种说法可能是源自于《高性能MySQL》一书中对MySQL中MVCC的错误结论，然后就人云亦云传开了（注意，我这里一直强调的是MySQL中MVCC的实现，是因为在不同的数据库中可能会有不同的实现）。所以说看源码和看官方文档才是最权威的解释）

前言

很多人在谈起mysql事务的时候都能很快的答出mysql的几种事务隔离级别，以及在各自隔离级别下产生的问题，但是一旦谈到为什么会产生这样的结果时会觉得难以回答，说到底，还是对底层的原理未做深入的探究，本篇将从较为底层的原理层面来聊聊关于mysql的mvcc原理，了解并掌握了mvcc原理，也就能真正回答这些问题了。

一、mysql 数据写入磁盘流程

在了解mvcc原理之前，先来看下面这种图，这是一张关于客户端发起一条update 数据的语句时，mysql 的innodb引擎所作的一些列操作过程（可按照前面的序列号）；

从这张图，我们提取如下关键信息：

update 语句到达mysql的innodb引擎之后，并不是直接操作磁盘进行数据修改，而是先将磁盘数据load到buffer pool（如果没有的话）；
buffer poo中update完成之后，并不是立即刷到磁盘，还需要将数据写到 undolog和redolog；
undolog记录了数据修改前的记录，redolog记录的是事务提交时数据页的物理修改；
提交事务时，数据刷写到磁盘，同时把所有修改信息都存到该日志文件（redolog）, 用于在刷新脏页到磁盘,发生错误时, 进行数据恢复使用；
数据确认落盘成功后，redolog就没有作用了，innodb将会自动清理redolog；

从上面的分析中，可以看出，redolog文件在整个执行过程中起到了非常重要的作用，有必要对该文件做一些深入的了解和学习；

二、redo log

又叫重做日志，记录的是事务提交时数据页的物理修改，用来实现事务的持久性

redo log 日志文件由两部分组成：

重做日志缓冲（redo log buffer），保存在内存中，容易丢失，对应于mysql配置文件参数为：innodb_log_buffer_size，redo log buffer 大小，默认 16M ，最大值是4096M，最小值为1M，可以通过命令：show variables like '%innodb_log_buffer_size%' 进行查看；
以及重做日志文件（redo logfile）,保存在磁盘中，是持久的；

1、redolog 的整体流程

仍然以上面流程图中的更新一条数据的事务过程分析，来看redolog的整体流转过程

具体步骤如下：

将原始数据从磁盘中load到内存，修改数据的内存拷贝（buffer pool）；
生成一条重做日志，并写入redo log buffer，记录的是数据被修改后的值；
事务commit时，将redo log buffer中的内容刷新到 redo log file，对 redo log file采用追加
写的方式；
定期将内存中修改的数据刷新到磁盘中；

2、为什么需要 redo log

在 InnoDB引擎中的内存结构中，主要内存区域就是缓冲池，在缓冲池中缓存了很多的数据页（磁盘中读取mysql数据时一般以数据页为单位进行加载）；在一个事务执行中，比如执行多个增删改的操作时， InnoDB 引擎会先操作缓冲池中的数据，如果缓冲区没有对应的数据，再通过后台线程将磁盘中数据load出来，放到缓冲区，然后修改缓冲池中的数据，修改后的数据页我们称为脏页；而脏页则会在一定的时机，通过后台线程刷新到磁盘中，从而保证缓冲区与磁盘的数据一致。但是缓冲区脏页数据并不是实时刷新的，而是隔一段时间后才将缓冲区的数据刷到磁盘中。假如刷新到磁盘的过程出错了，而提示给用户事务提交成功，而数据却没有持久化下来，这就出现问题了，没有保证事务的持久性。有了 redolog 之后，当对缓冲区的数据进行增删改之后，会首先将操作的数据页的变化，记录在 redo log buffer中。在事务提交时，会将 redo log buffer 中的数据刷新到 redo log 磁盘文件中。过一段时间后，如果刷新缓冲区的脏页到磁盘时，发生错误，此时就可以借助于 redo log 进行数据恢复，这样就保证了事务的持久性。而如果脏页成功刷新到磁盘或或者涉及到的数据已经落盘，此时redolog 就没有作用了，就可以删除了，所以存在的两个 redolog 文件是循环写的。说到这里就有伙伴要问，为什么每一次提交事务，要刷新 redo log 到磁盘中呢，而不是直接将 buffer pool 中的脏页刷新到磁盘呢？因为客户端与mysql进行数据交互（IO）过程中，们操作数据一般都是随机读写磁盘的（随机读写比较慢），而不是顺序读写磁盘（顺序读写块）。而 redo log 在往磁盘文件中写入数据，由于是日志文件，所以都是顺序写的。顺序写的效率，要远大于随机写。这种先写日志的方式，也称之为 WAL （ Write-Ahead Logging ）。

三、undo log

undo log 也成为回滚日志，用于记录数据被修改前的信息 , 作用包含两个 : 提供回滚 ( 保证事务的原子性 ) 和 MVCC(多版本并发控制 ) 。

举例来说，本次使用update语句修改了一条id为1的数据，如果事务提交失败，那么就需要回滚数据，mysql引擎怎么知道回滚到哪里呢？那就要借助undo log了，undolog中记录了修改之前的数据，所以就可以用于事务回滚。

1、undo log 特点

undo log和redo log记录物理日志不一样，它是逻辑日志；
当delete一条记录时，undo log中会记录一条对应的insert记录，反之亦然，当update一条记录时，它记录一条对应相反的 update记录；
执行rollback时，就可以从undo log中的逻辑记录读取到相应的内容并进行回滚；

2、undo log 类型

insert undo log；
update undo log；

3、undo log 生成过程

从文章开头的流程图中再简单抽象出下面的简化执行步骤

在开启一个事务对一条数据记录进行update的时候，对于这条数据行来说，其底层存储的结构大概长下面这样；

在这行记录中，对应着两个隐藏字段，事务ID和回滚指针，当执行一条insert语句时，

begin ;
insert into user (name) values ( "tom" );

对于 undolog 来说，记录的数据状态将会呈现如下效果，可以看到，在这条记录中，回滚指针指向了一条数据激励，记录了这条数据的源信息，通过一个undo no标识；

执行update的时候，数据行记录变更，同时在redo log 回滚指针链上将增加一条记录，并连接上一条记录；

继续执行一个update语句：

UPDATE user SET name ='jike'   WHERE id= 1 ;

4、undo log 回滚过程

如果事务回滚，执行rollback，对应的流程如下：

通过undo no=3的日志把name='jike'的数据删除；
通过undo no=2的日志把id=1的数据的deletemark还原成0；
通过undo no=1的日志把id=1的数据的name还原成Tom；
通过undo no=0的日志把id=1的数据删除;

5、undo log的删除

undo log的删除分成2种

针对于insert undo log，因为insert操作的记录，只对事务本身可见，对其他事务不可见。故该undo log可以在事务提交后直接删除，不需要进行purge操作；
针对于update undo log，该undo log可能需要提供MVCC机制，因此不能在事务提交时就进行删除。提交时放入undo log链表，等待purge线程进行最后的删除；

四、mvcc

1、什么是MVCC

全称：多版本并发控制，MVCC 是通过数据行的多个版本管理来实现数据库的并发控制。通过这项技术，使得在InnoDB的事务隔离级别下执行一致性读操作有了保证。换言之，就是为了查询一些正在被另一个事务更新的数据行，并且可以看到它们被更新之前的值，这样在做查询的时候就不用等待另一个事务释放锁。

2、MVCC组成

mvcc的实现主要依赖下面的3个主要逻辑实现，分别是：

隐藏字段，在上文中有所交待，每个数据行都会存在一个隐藏字段；
undolog版本链，上文有所交待，记录了回滚数据行的数据；
ReadView（读视图）是快照读SQL执行时MVCC提取数据的依据，记录并维护系统当前活跃的事务（未提交的）id，可能是一个数组；

3、快照读与当前读

MVCC在MySQL InnoDB中的实现主要是为了提高数据库并发性能，用更好的方式去处理读-写冲突，这样即使有读写冲突时，也能做到不加锁，非阻塞并发读，而这个读指的就是快照读,而非当前读。当前读实际上是一种加锁的操作，是悲观锁的实现，而MVCC本质是采用乐观锁思想的一种方式。

快照读

快照读又叫一致性读，读取的是快照数据。不加锁的简单的 SELECT 都属于快照读，即不加锁的非阻塞读；比如这样：

SELECT * FROM player WHERE ...

之所以出现快照读的情况，是基于提高并发性能的考虑，快照读的实现是基于MVCC，它在很多情况下，避免了加锁操作，降低了开销。

既然是基于多版本，那么快照读可能读到的并不一定是数据的最新版本，而有可能是之前的历史版本。快照读的前提是隔离级别不是串行级别，串行级别下的快照读会退化成当前读。

当前读

当前读读取的是记录的最新版本（最新数据，而不是历史版本的数据），读取时还要保证其他并发事务不能修改当前记录，会对读取的记录进行加锁。加锁的 SELECT，或者对数据进行增删改都会进行当前读。比如：

SELECT * FROM student LOCK IN SHARE MODE; # 共享锁

SELECT * FROM student FOR UPDATE; # 排他锁

INSERT INTO student values ... # 排他锁

DELETE FROM student WHERE ... # 排他锁

五、mvcc操作演示

来看下面这一些列的事务操作过程，如下是一组操作同一条数据的记录的多个事务，从事务2 ~ 事务5，分别对应不同的操作何阶段；

从上文我们对undolog的了解，每次修改一条数据时，会在undolog 回滚链中增加一条记录，用于后续做数据回滚；

具体步骤如下：

比如当事务2执行第一条修改语句时，会记录一条undo log日志，记录了当前数据变更之前的样子; 然后更新记录，并且记录本次操作的事务ID，回滚指针，回滚指针用来指定如果发生回滚，回滚到哪一个版本；

当事务 3 执行第一条修改语句时，也会记录 undo log 日志，记录数据变更之前的样子 ; 然后更新记录，并且记录本次操作的事务 ID ，回滚指针，回滚指针用来指定如果发生回滚，回滚到哪一个版本；

当事务 4 执行第一条修改语句时，也会记录 undo log 日志，记录数据变更之前的样子 ; 然后更新记录，并且记录本次操作的事务 ID ，回滚指针，回滚指针用来指定如果发生回滚，回滚到哪一个版本；

通过上面一些列的操作，最终会发现，不同事务或相同事务对同一条记录进行修改，会导致该记录的 undolog 生成一条记录版本链表，链表的头部是最新的旧记录，链表尾部是最早的旧记录。

有了上面的redo log 的回链，最终是怎么确定某个事务读取的数据是长什么样子呢？接下来 readview就派上用场了；

ReadView （读视图）是快照读 SQL 执行时 MVCC 提取数据的依据，记录并维护系统当前活跃的事务（未提交的）id；

ReadView中包含了四个核心字段：

字段	含义
m_ids	当前活跃事务 ID 集合
min_trx_id	最小活跃事务 ID
max_trx_id	预分配事务 ID ，当前最大事务 ID+1 （因为事务 ID 是自增的）
creator_trx_id	ReadView 创建者事务 ID

而在 readview 中就规定了版本链数据的访问规则，

trx_id 代表当前undolog版本链对应事务ID

完整的匹配规则如下：

条件	是否可以访问	说明
trx_id == creator_trx_id	可以访问该版本	成立，说明数据是当前这个事务更改的
trx_id < min_trx_id	可以访问该版本	成立，说明数据已经提交了
trx_id > max_trx_id	不可以访问该版本	成立，说明该事务是在 ReadView 生成后才开启
min_trx_id <= trx_id <= max_trx_id	如果 trx_id 不在 m_ids 中，是可以访问该版本的	成立，说明数据已经提交

不同的隔离级别，生成ReadView的时机不同：

READ COMMITTED （读已提交）：在事务中每一次执行快照读时生成ReadView；
REPEATABLE READ（可重复读）：仅在事务中第一次执行快照读时生成ReadView，后续复用该ReadView；

也就是说，在利用mvcc的多版本并发控制时，只需要关注这两种事务隔离级别就行了，接下来，以上午的excel中展示的几个事务为例，对照这两种类型的事务隔离级别进行说明；

1、READ COMMITTED 隔离级别

以事务5为例进行说明，两次快照读读取数据时，是如何获取数据的?

在事务 5 中，查询了两次 id 为 30 的记录，由于隔离级别为 Read Committed ，所以每一次进行快照读都会生成一个 ReadView ，那么两次生成的 ReadView 如下

那么这两次快照读在获取数据时，就需根据所生成的 ReadView 以及 ReadView 的版本链访问规则，到undolog 版本链中匹配数据，最终决定此次快照读返回的数据； 先来看第一次快照读具体的读取过程

对应的undo log 版本链如下

在进行匹配时，会从undo log的版本链，从上到下进行挨个匹配：

1）先匹配下面这条记录，这条记录对应的trx_id为4，也就是将4带入右侧的匹配规则中。 ①不满足 ②不满足 ③不满足 ④也不满足，都不满足，则继续匹配undo log版本链的下一条；

2）再匹配第二条记录，这条记录对应的 trx_id 为 3 ，也就是将 3 带入右侧的匹配规则中。①不满足 ②不满足 ③不满足 ④也不满足，都不满足，则继续匹配 undo log 版本链的下一条；

3）再匹配第三条记录，这条记录对应的trx_id为2，也就是将2带入右侧的匹配规则中。①不满足 ②满足终止匹配，此次快照读，返回的数据就是版本链中记录的这条数据；

再来看第二次快照读具体的读取过程:

对应的undolog 版本链如下：

在进行匹配时，会从 undo log 的版本链，从上到下进行挨个匹配：

1）先匹配这条记录，这条记录对应的 trx_id为4，也就是将4带入右侧的匹配规则中。 ①不满足 ②不满足 ③不满足 ④也不满足，都不满足，则继续匹配undo log版本链的下一条；

2）再匹配第二条，这条记录对应的 trx_id 为 3 ，也就是将 3 带入右侧的匹配规则中。①不满足 ②满足。终止匹配，此次快照读，返回的数据就是版本链中记录的这条数据；

2、REPEATABLE READ 隔离级别

在这种隔离级别下，仅在事务中第一次执行快照读时生成 ReadView ，后续继续复用该 ReadView 。而可重复读在一个事务中，执行两次相同的select 语句，查询到的结果是一样的；那 MySQL 是如何做到可重复读的呢 ? 按照上面的过程做一下类似的分析

可以看到，在可重复读这种事务隔离级别下，只在事务中第一次快照读时生成 ReadView ，后续都复用该 ReadView。既然 ReadView 都一样， ReadView 版本链匹配规则也一样，最终快照读返回的结果也是一样的了。总结 MVCC实现原理是通过 InnoDB表的隐藏字段、UndoLog 版本链、ReadView来实现的；MVCC + 锁，则实现了事务的隔离性；一致性则是由redolog 与 undolog保证；

SQL Server:SELECT TOP 10 * FROM T_USER ORDER BY NEWID()ORACLE:SELECT * FROM (SELECT * FROM T_USER ORDER BY DBMS_RANDOM.RANDOM()) WHERE RONUM <= 10MySQL:SELECT *

2024-10-21 20:47:50

一、limit用法在我们使用查询语句的时候，经常要返回前几条或者中间某几行数据，这个时候怎么办呢？不用担心，mysql已经为我们提供了这样一个功能。SELECT * FROM table LIMIT [off

2024-10-21 20:44:48

目录问题原因解决办法如何设置和查看使用Navicat Premium 12导入mysql的sql文件时，导入失败，出现如下错误：2006 - MySQL server has gone away。mysql出现ERROR : (2006, &

2024-10-21 20:43:22

今天早上启动了 phpstudy 软件中的 MySQL 8.0 数据库时，发现它启动后约过了 3 秒就自行关闭了。接着又自动启动然后再次关闭，似乎陷入了一个“开-闭-开”的循环。这导致我无

2024-10-18 23:15:41

目录

1. 每秒交易量

2. 每分钟交易量

3. 每5分钟交易量

4. 每10分钟交易量

5. 每30分钟交易量

结合 WHERE

2024-10-18 23:15:27

目录 Redis是什么？ Redis的特点依赖配置 redis的配置类（用于格式转换，处理乱码） String（字符串）特点业务场景代码使用案例 List（列表）特点业务场景代码使用案例 S

2024-10-18 23:15:18

目录 Oracle中BLOB、CLOB的读取和写入基于SQL的方式实现CLOB、BLOB的插入与读取 1. 插入大类型数据 2. 读取大类型数据并转换为字符串基于Java方式实现CLOB和B

2024-10-18 23:15:09

目录 dbeaver导出mysql数据库右键表-tools-Dump database 按默认设置总结 dbeaver导出mysql数据库右键表-tools-Dump database按默认设置只需修改输出文件夹我这里把

2024-10-18 23:15:01

目录 DBeaver如何导入excel中的大量数据步骤一：将Excel文件转换为CSV格式步骤二：在DBeaver中创建数据库表（如果尚未创建）步骤三：导入CSV文件到数据库表注意事项总结

2024-10-18 23:14:43

目录一、先清理归档日志使得数据库能够正常连接二、排查问题三、处理问题四、清理后效果最近客户单位的oracle数据库出了问题，经常出现无法连接,报错提示 ORA-00257: arc

2024-10-18 23:14:30

目录函数单行函数字符函数数学函数日期函数流程控制函数分组函数分组查询按单个字段分组在分组前进行条件筛选在分组之后进行条件筛选按多字段分

2024-10-18 23:14:18

目录 1、计算两个时间字符串之间的差值 2、字符串转换成日期/时间类型 3、计算两个日期和时间之间的差值在 SQL Server 中，计算两个时间字符串之间的差值首先将这些字符串转

2024-10-18 23:14:10

目录问题描述原因分析解决方案在Oracle数据库中，DECODE 函数是一个非常实用的条件处理函数，通常用于替代简单的 CASE WHEN 语句。它根据给定的值列表进行匹配，如果匹配成功

2024-10-18 23:14:02

目录描述实践描述删除表大批量数据，这是一个比较少的事件。但在实际的业务开发中或者数据测试也会遇到这种情况。比如定期从日志大表中删除几百万的数据记录；删除表数据的

2024-10-18 23:13:52

目录前言简介概述 DELETE 操作的基本概念常用的 DELETE 方法核心源码解读简单 DELETE 语句批量 DELETE 示例案例分析案例1：使用简单 DELETE 删除用户数据

2024-10-18 23:13:43

目录一、MySQL清空表数据三种方法 1.1 清空表数据：truncate 1.2 删除表：drop 1.3 删除/清空表数据：delete 二、使用原则三、truncate、drop、delete区别 1.操作类型

2024-10-14 19:50:11

目录一、问题描述二、解决方案 1.使用mysqldump命令备份数据库 2.创建目标数据库 3.导入数据到目标数据库三、补充知识 3.1 mysqldump命令介绍 3.2 常用备份命

2024-10-14 19:50:03

目录一、limit深分页为什么会变慢二、优化方案 2.1 通过子查询优化（覆盖索引）回顾B+树结构覆盖索引把条件转移到主键索引树 2.2 INNER JOIN 延迟关联

2024-10-14 19:49:55

目录 MySQL的TRUNCATE()函数规则如下函数示例当 X 为正数时当 X 为负数时总结 MySQL的TRUNCATE()函数TRUNCATE(X,D) 是MySQL自带的一个系统函数。其中，X是数值，D

2024-10-14 19:49:37

目录方法一：在电脑设置中查看电脑iP地址方法二：通过运行程序查看电脑IP地址方法三：通过浏览器查看电脑IP地址拓展：在自己电脑建立了MYSQL数据库，但是想在其它的电脑进行连接，

2024-10-14 19:49:29

目录概念 Pipeline 底层原理分析 Redis单个命令执行基本步骤 RTT 时间 Redis Pipeline Pipeline实际应用场景数据导入导出数据处理批量操作其他应用场

2024-10-14 19:49:13

修改配置文件1.打开Postgresql配置文件，如：C:\Program Files\PostgreSQL\14\data\postgresql.conf
2.修改如下，如果字段被#注释，则去掉#log_directory = 'log'
log_file

2024-10-14 19:49:02

目录创建分区删除分区分区性能总结说明：分区表，顾名思义，就是一张表根据规则，划分多个区，通过分区，实现一种“逻辑隔离”，这在Saas系统中是非常常见的。本文介绍如何

2024-10-14 19:48:52

目录 1.创建mysql基础配置 2.创建pvc挂载 3.创建工作负载 4.创建服务（创建服务后才能进行外部访问） 5.测试mysql是否能正常访问演示示例使用的是3.4.1，各版本有名字差异功能是

2024-10-14 19:48:36

目录安装步骤 1. 解压安装包 2. 移动解压后的文件夹 3. 创建MySQL用户 4. 设置权限 5. 配置MySQL 6. 设置环境变量 7. 初始化数据库 8. 设置系统服务 9. 设置roo

2024-10-14 19:48:11

目录解决方案 1. 检查是否输入正确的密码 2. 使用“跳过权限表”的方式重置 root 密码 2.1 停止 MySQL 服务 2.2 以跳过权限表模式启动 MySQL 2.3 重

2024-10-14 19:48:03

目录实现演示说明：实际开发中，我们在前端页面上点击了一个按钮，访问了一个接口，这时因为网络波动或者其他原因，页面上没有反应，用户可能会在短时间内再次点击一次或者用户以为没

2024-10-14 19:47:53

发生的错误好吧，当我在 laragon 应用程序中从mysql 5.1.72升级到mysql 8.0.32时，发生了这个错误。当我在 laragon 应用程序中 start all 时，出现的错误是这样的。laragon 中的

2024-09-17 21:32:55

介绍在本实验中，我们将学习和练习索引、视图、备份和恢复。这些概念对于数据库管理员来说非常重要。学习目标创建索引创建视图备份与恢复准备开始之前，我们需要准备好环境

2024-09-17 21:32:18

如何将 SQL 文件导入 MySQL 数据库导入 MySQL 数据库文件的方法：使用 MySQL 客户端打开 MySQL 客户端并连接到目标数据库。使用 SOURCE 命令，后跟要导入的 SQL 文件路径：SOUR

2024-09-17 21:32:00

2018-08-19

2020-03-22

2020-12-17

2020-03-22

2020-10-15

2021-01-28

2020-03-22

2021-01-21

2020-10-28

mysql中的mvcc 原理详解

目录

简介

前言

一、mysql 数据写入磁盘流程

二、redo log

1、redolog 的整体流程

2、为什么需要 redo log

三、undo log

1、undo log 特点

2、undo log 类型

3、undo log 生成过程

4、undo log 回滚过程

5、undo log的删除

四、mvcc

1、什么是MVCC

2、MVCC组成

3、快照读与当前读

快照读

当前读

五、mvcc操作演示

1、READ COMMITTED 隔离级别

2、REPEATABLE READ 隔离级别

热点内容

免费资源网

在线工具

扫一扫随时看

本站下载频道