MySQL事务中的redo与undo
一前言
二 Redo log
2.1 redo的作用
2.2 redo的组成
2.3 redo工作流程
2.4 Write Ahead Log
2.5 参数innodb_flush_log_at_trx_commit
三 Undo log
3.1 作用
3.2 undo的存储位置
3.3 undo的类型
3.4 undo log 是否是redo log的逆过程？
3.5 redo & undo总结

MySQL事务中的redo与undo

一前言

众所周知InnoDB 是一个事务性的存储引擎，在上一小节我们提到事务有4种特性：原子性、一致性、隔离性和持久性，在事务中的操作，要么全部执行，要么全部不做，这就是事务的目的。

那么事务的四种特性到底是基于什么机制实现呢？？？

1、事务的原子性、隔离性由锁机制实现，我们将在后续章节《数据库锁机制》中介绍

2、而事务的一致性和持久性由事务的 redo 日志和undo 日志来保证。

redo log 是重做日志，提供再写入操作，实现事务的持久性；
undo log 是回滚日志，提供回滚操作，保证事务的一致性。

本文将讨论关于事务中的redo和undo的几个问题：

redo 日志与undo日志分别用于记录什么？
redo 如何保证事务的持久性？
undo 如何保证事务的一致性？
undo log 是否是redo log的逆过程？

二 Redo log

2.1 redo的作用

记录的是尚未完成的操作，数据库崩溃则用其重做

2.2 redo的组成

Redo log可以简单分为以下两个部分：

保存在内存中重做日志的缓冲 (redo log buffer),是易失的
保存在硬盘中重做日志文件 (redo log file)，是持久的

2.3 redo工作流程

InnoDB 的更新操作采用的是 Write Ahead Log (预先日志持久化)策略，即先写日志，再写入磁盘。

当一条记录更新时，redo流程大致如下

在内存更新数据后，会把更新后的记录写入到 redo log buffer 中。

第一步：InnoDB 会先把记录从硬盘读入内存
第二部：修改数据的内存拷贝
第三步：生成一条重做日志并写入redo log buffer，记录的是数据被修改后的值
第四步：当事务commit时，将redo log buffer中的内容刷新到 redo log file，对 redo log file采用追加写的方式
第五步：定期将内存中修改的数据刷新到磁盘中(注意注意注意，不是从redo log file刷入磁盘，而是从内存刷入磁盘，redo log file只在崩溃恢复数据时才用)，如果数据库崩溃，则依据redo log buffer、redo log file进行重做，恢复数据,这才是redo log file的价值所在

2.4 Write Ahead Log

redo是如何保证事务的持久性的呢？？？

答案是Force Log at Commit 机制，即当事务commit提交时，innodb引擎先将 redo log buffer 写入到 redo log file 进行持久化，待事务的commit操作完成时才算完成。这种做法也被称为 Write-Ahead Log(预先日志持久化)，在持久化一个数据页之前，先将内存中相应的日志页持久化。

问题1：为何不直接将修改的数据写入磁盘，而是要write ahead log呢？

答案：用于崩溃恢复
详解：
undo日志是对原始数据的备份
redo日志是对原始数据的修改

原始数据的按照既定的数据结构存放在磁盘上，写入磁盘是要耗费巨大成本的，而写入redo相对容易一些，因为redo里毕竟只需要考虑存放改动的数据即可，所以内存数据写写入redo log file，然后内存数据才能写入磁盘，如此，在内存数据再写入磁盘时因为某种原因比如断电崩溃，那么还可以依据redo log file恢复数据，如下图所示。

问题2：如何保证每次修改的数据都能写入redo log file呢？

# 储备知识1
O_DIRECT选项是在Linux系统中的选项，使用该选项后，对文件进行直接IO操作，不经过文件系统缓存，直接写入磁盘

# 储备知识2
redo log又称之为重做日志，因重做日志打开并没有O_DIRECT选项，所以重做日志先写入到文件系统缓存，然后才会刷入硬盘，即
Redo log buffer--->os cache(文件系统缓存)--->redo log file

如果在刷入redo log file前断电，则会丢失文件系统缓存中数据，数据未写入redo log file，
因为由内存写入redo log file在前，而由内存写入磁盘在后，所以redo log file写入失败，则数据丢失

# 那如何保证每次的修改都记入日志文件redo log file呢？？？
答案是fsync操作
在每次将redo buffer写入os cache文件系统缓存后，InnoDB存储引擎都需要调用一次 fsync操作,保证立即由os cache文件系统缓存写入redo log file

fsync是一种系统调用操作，其fsync的效率取决于磁盘的性能，因此磁盘的性能也影响了事务提交的性能，也就是数据库的性能。

问题3：脏页何时刷入磁盘呢？

# 储备知识：脏页
Buffer Pool 中更新的数据未刷新到磁盘中，该内存页我们称之为脏页。最终脏页的数据会刷新到磁盘中，将磁盘中的数据覆盖，这个过程与 redo log 不一定有关系。

# 答案
redo log 日志满了的情况下，会主动触发脏页刷新到磁盘

问题4：脏页只在redo log满的情况下才会刷入磁盘吗？

答案：no，以下几种情况同样会触发脏页的刷新

- 1、系统内存不足时，需要将一部分数据页淘汰掉，如果淘汰的是脏页，需要先将脏页同步到磁盘；
- 2、MySQL 认为空闲的时间，这种情况没有性能问题；
- 3、MySQL 正常关闭之前，会把所有的脏页刷入到磁盘，这种情况也没有性能问题。

问题5：脏页刷入会带来性能问题吗？
[rml_read_more]：

在生产环境中，如果我们开启了慢 SQL 监控，你会发现偶尔会出现一些用时稍长的 SQL。**这是因为脏页在刷新到磁盘时可能会给数据库带来性能开销，**导致数据库操作抖动。

2.5 参数innodb_flush_log_at_trx_commit

上面提到的Force Log at Commit机制就是靠InnoDB存储引擎提供的参数innodb_flush_log_at_trx_commit来控制的

该参数控制 commit提交事务时，如何将 redo log buffer 中的日志刷新到 redo log file 中。

1、当设置参数为1时，（默认为1，建议），表示事务提交时必须调用一次 fsync 操作，最安全的配置，保障持久性
2、当设置参数为2时，则在事务提交时只做 write 操作，只保证将redo log buffer写到系统的页面缓存中，不进行fsync操作，因此如果MySQL数据库宕机时不会丢失事务，但操作系统宕机则可能丢失事务
3、当设置参数为0时，表示事务提交时不进行写入redo log操作，这个操作仅在master thread 中完成，而在master thread中每1秒进行一次重做日志的fsync操作，因此实例 crash 最多丢失1秒钟内的事务。（master thread是负责将缓冲池中的数据异步刷新到磁盘，保证数据的一致性）

拓展阅读

我们需要注意的是 InnoDB 的 redo log 的大小是固定的，分别有多个日志文件采用循环方式组成一个循环闭环，当写到结尾时，会回到开头循环写日志。我们可以通过参数 innodb_log_files_in_group 和 innodb_log_file_size 配置日志文件数量和每个日志文件的大小。

三 Undo log

3.1 作用

undo即撤销还原。

用于记录更改前的一份copy，在操作出错时，可以用于回滚、撤销还原，只将数据库逻辑地恢复到原来的样子

undo日志记录了什么？

比如有两个用户访问数据库，当然并发罗。A是更改，B是查询。

--A更改还没有提交，B查询的话，数据肯定为历史数据，这个历史数据就是来源于UNDO段，

--A更改未提交，需要回滚rollback，回滚rollback的数据也来至于UNDO段。

结论：为了并发时读一致性成功，那么DML操作，肯定先写UNDO段。

3.2 undo的存储位置

在InnoDB存储引擎中，undo存储在回滚段(Rollback Segment)中,每个回滚段记录了1024个undo log segment，而在每个undo log segment段中进行undo 页的申请，在5.6以前，Rollback Segment是在共享表空间里的，5.6.3之后，可通过 innodb_undo_tablespace设置undo存储的位置。

3.3 undo的类型

在InnoDB存储引擎中，undo log分为：

insert undo log
update undo log

insert undo log是指在insert 操作中产生的undo log，因为insert操作的记录，只对事务本身可见，对其他事务不可见。故该undo log可以在事务提交后直接删除，不需要进行purge操作。

而update undo log记录的是对delete 和update操作产生的undo log，该undo log可能需要提供MVCC机制，因此不能再事务提交时就进行删除。提交时放入undo log链表，等待purge线程进行最后的删除。

补充：purge线程两个主要作用是：清理undo页和清除page里面带有Delete_Bit标识的数据行。在InnoDB中，事务中的Delete操作实际上并不是真正的删除掉数据行，而是一种Delete Mark操作，在记录上标识Delete_Bit，而不删除记录。是一种”假删除”,只是做了个标记，真正的删除工作需要后台purge线程去完成。

3.4 undo log 是否是redo log的逆过程？

undo log 是否是redo log的逆过程？其实从前文就可以得出答案了，undo log是逻辑日志，对事务回滚时，只是将数据库逻辑地恢复到原来的样子，而redo log是物理日志，记录的是数据页的物理变化，显然undo log不是redo log的逆过程。

3.5 redo & undo总结

下面是redo log + undo log的简化过程，便于理解两种日志的过程：

假设有A、B两个数据，值分别为1,2.
1. 事务开始
2. 记录A=1到undo log
3. 修改A=3
4. 记录A=3到 redo log
5. 记录B=2到 undo log
6. 修改B=4
7. 记录B=4到redo log
8. 将redo log写入磁盘
9. 事务提交

实际上，在insert/update/delete操作中，redo和undo分别记录的内容都不一样，量也不一样。在InnoDB内存中，一般的顺序如下：

写undo的redo
写undo
修改数据页
写Redo

因为，数据在没有commit前，是随时从内存中写入到表数据块的，属于脏数据。数据库崩溃后即使使用redo流程进行redo操作，但是脏数据还在，脏数据怎么处理，就只能靠undo流程，使用undo数据块的旧数据覆盖了。

undo与redo的联系：但是不管是脏的还是旧的，都在redo日志中复制了一份。

1.undo是一种“数据文件datafile”，具有表空间，当然具有块block;
2.redo是一种“文件file”，没有表空间。
3.数据库在DML事务时，先创建undo
4.读一致性与一致性(scn相同）的区别
5.undo与rollback的区别：在undo（撤销还原流程）中会使用rollback（回滚）这个动作

文档更新时间: 2022-02-08 20:26 作者：李延召

第八章：事务的redo与undo