【MySQL】Undo Log清理机制（Purge）：原理、判断与优化实战

By - YunYang
Posted on 2026-02-05
Posted in MySQL

【MySQL】Undo Log清理机制（Purge）：原理、判断与优化实战

在 MySQL InnoDB 存储引擎中，Undo Log 作为事务回滚与 MVCC（多版本并发控制）的核心组件，其生命周期管理直接影响数据库性能与磁盘空间利用率。事务提交后 Undo Log 不会立即删除，而是通过后台 Purge 机制清理无用日志。本文将深入解析 Purge 的工作原理、判断逻辑，并提供可落地的优化策略。

一、Purge 的核心逻辑

1. 什么是 Purge？

Purge 是 InnoDB 通过后台线程（Purge Thread）执行的异步清理操作，核心目标是删除不再被任何事务访问的 Undo Log，释放磁盘空间，避免表空间膨胀。

2. Undo Log 可被 Purge 的条件

只有同时满足以下两个条件，Undo Log 才会被标记为可清理：

生成该 Undo Log 的事务已提交；
所有读事务均无需访问该 Undo Log 对应的历史版本（即无事务依赖该版本数据）。

3. Purge 的触发时机

InnoDB 通过三种方式触发 Purge，确保日志及时清理：

定时触发：默认每 1 秒检查一次可清理的 Undo Log；
事务提交触发：当 Undo Log 累积数量达到阈值时，提交事务会触发 Purge；
Checkpoint 触发：Redo Log 执行 Checkpoint 时，若 Undo Log 占用空间过大，主动触发清理。

二、如何判断 Undo Log 可被 Purge？

InnoDB 通过Read View（读视图）实现 Undo Log 的可用性判断，核心逻辑围绕事务 ID（trx_id）展开：

1. Read View 的核心属性

每个读事务启动时会生成 Read View，包含两个关键参数：

min_trx_id：当前活跃事务的最小 ID；
max_trx_id：当前系统中即将分配的下一个事务 ID。

2. 判断规则

Undo Log 的 trx_id 与 Read View 关系	结论	原因
`trx_id` < `min_trx_id`	Undo log可 Purge	该事务在所有活跃事务前提交，其历史版本不再被任何读事务访问
`trx_id` ≥ `max_trx_id`	Undo log不可 Purge	该事务在当前读事务后启动，可能被其他事务访问
`min_trx_id` ≤ `trx_id` ≤ `max_trx_id`	需校验	需进一步检查该事务是否仍活跃，若已提交且无其他读事务访问则可 Purge

三、Purge 优化策略（实战篇）

针对 Undo Log 堆积、表空间膨胀等问题，可通过以下 4 个维度优化 Purge 效率：

1. 调整 Purge 线程数

Purge 线程数默认为 4（MySQL 8.0+），若 Undo Log 堆积严重（如长事务多、并发高），可增加线程数提升清理速度：

-- 查看当前线程数
show global variables like "innodb_purge_threads";

-- 调整为8个线程
# 1. 编辑配置文件
vim /data/mysql/conf/my.cnf

# 2. 在配置文件的 [mysqld] 节点下添加或修改一行
innodb_purge_threads = 8

# 3. 重启 MySQL 服务
/etc/init.d/mysql.server restart

注意：innodb_purge_threads变量只能在 MySQL 服务启动前配置，启动后无法通过 set global 在线修改

适用场景：Undo Log 堆积严重、CPU 资源充足的服务器。

2. 配置回滚段清理频率

innodb_purge_rseg_truncate_frequency 控制每执行多少次 Purge 操作后，检查并删除无用的回滚段，默认值是128（回滚段是 Undo Log 的存储单元）：

-- 查看当前配置
show global variables like "innodb_purge_rseg_truncate_frequency";

-- 调整为每10次Purge检查一次回滚段
set global innodb_purge_rseg_truncate_frequency = 10;

数值越小：回滚段清理越频繁，Undo 表空间截断越及时，但可能增加 CPU 开销；
数值越大：回滚段清理频率低，可能导致 Undo 表空间膨胀，但 CPU 开销小。

3. 监控并优化长事务

长事务会导致 Read View 的 min_trx_id 长期不变，使大量 Undo Log 无法被 Purge（需等待长事务结束），因此需监控并优化长事务：

# 查看执行时间过长的事务
show processlist;

# 查看执行时间超过 60 秒的事务
select 
  trx_id, 
  trx_started, 
  timestampdiff(second, trx_started, now()) as trx_duration_seconds,
  trx_query 
from information_schema.innodb_trx 
where timestampdiff(second, trx_started, now()) > 60;

优化方案：

设置事务超时时间（innodb_lock_wait_timeout）。

拆分长事务为短事务；

优化慢查询（添加索引、减少扫描量）；

4. 开启 Undo Log 自动截断

当 Undo 表空间大小超过 innodb_max_undo_log_size 时，自动截断表空间，释放空间：

# 查看自动截断配置
show global variables like "innodb_undo_log_truncate";
show global variables like "innodb_max_undo_log_size";

# 开启自动截断（永久开启需添加到配置文件）
set global innodb_undo_log_truncate = on;

# 设置 Undo 表空间最大大小为 2G（默认 1G）
set global innodb_max_undo_log_size = 2147483648;  # 2G = 2*1024*1024*1024

总结

Purge 机制是 InnoDB Undo Log 生命周期管理的核心，其效率直接影响数据库的稳定性与性能。实际优化中需结合业务场景：

高并发场景：增加 Purge 线程数、提高回滚段清理频率；
长事务较多：重点监控并优化事务执行效率；
磁盘空间紧张：开启 Undo Log 自动截断，合理设置表空间阈值。

通过以上策略，可有效避免 Undo Log 堆积与表空间膨胀，保障 MySQL 数据库的高效运行。

Tags:MySQL

云扬のBlog