招行二面:Redis 為什么要 RDB 和 AOF 兩種持久化方式?直接寫日志不行嗎?
這篇文章,我們來分享 Redis是如何實(shí)現(xiàn)持久化以及Redis 為什么要采用 RDB 和 AOF兩種持久化方式。
1. 什么是持久化?
持久化,Persistence,把數(shù)據(jù)(如內(nèi)存中的對象)保存到可永久保存的存儲設(shè)備中(如磁盤)。這樣可以保證程序在服務(wù)器宕機(jī)后,重新啟動不會丟失數(shù)據(jù)。
2. 持久化方式
Redis 的持久化方式有兩種:RDB 和 AOF。
(1) RDB
RDB:Redis DataBase,它是將 Redis 在內(nèi)存中的數(shù)據(jù)定期或者在指定時(shí)間間隔內(nèi)快照到磁盤上,生成一個(gè)RDB文件,該文件包含了Redis在某個(gè)時(shí)間點(diǎn)上的數(shù)據(jù)快照。當(dāng) Redis 重新啟動時(shí),可以通過加載 RDB 文件來恢復(fù)數(shù)據(jù)。
(2) AOF
AOF:Append Only File,它是將 Redis 執(zhí)行的每一條寫命令追加到 AOF 文件的末尾,每次 Redis 啟動時(shí)重新執(zhí)行 AOF 文件中的命令,從而重新構(gòu)建數(shù)據(jù)集。通過這種方式,可以保證 Redis 的數(shù)據(jù)不會丟失,但是對于每一次寫操作都需要進(jìn)行記錄,AOF文件會變得非常大。
實(shí)現(xiàn)原理圖如下:
3. RDB原理
Redis DataBase(RDB)是將 Redis 在內(nèi)存中的數(shù)據(jù)以二進(jìn)制的形式定期或者在指定時(shí)間間隔內(nèi)快照到磁盤上,生成一個(gè) RDB 文件,該文件包含了 Redis 在某個(gè)時(shí)間點(diǎn)上的數(shù)據(jù)快照。當(dāng) Redis 重新啟動時(shí),可以通過加載 RDB 文件來恢復(fù)數(shù)據(jù)。其原理主要分為如下 3個(gè)核心流程:
(1) 觸發(fā)持久化
Redis支持兩種觸發(fā)持久化的方式,一種是根據(jù)時(shí)間間隔自動觸發(fā)持久化,另一種是手動執(zhí)行 SAVE 或 BGSAVE 命令來觸發(fā)持久化。手動執(zhí)行 BGSAVE 命令可以在 Redis 持續(xù)提供服務(wù)的同時(shí)進(jìn)行持久化操作,而手動執(zhí)行 SAVE 命令會阻塞 Redis 的服務(wù)進(jìn)程,直到持久化操作完成,所以生產(chǎn)換進(jìn)慎用 SAVE 指令。
(2) 生成 RDB文件
當(dāng) Redis 觸發(fā)持久化操作時(shí),Redis 會 fork 出一個(gè)子進(jìn)程,子進(jìn)程負(fù)責(zé)生成 RDB 文件。在生成 RDB 文件的過程中,Redis 會將內(nèi)存中的數(shù)據(jù)按照一定的格式寫入到 RDB 文件中,包括鍵值對、過期時(shí)間、數(shù)據(jù)庫號等信息。
(3) 完成持久化
當(dāng)子進(jìn)程完成 RDB 文件的生成后,Redis會將原來的RDB文件替換成新生成的RDB文件,從而完成持久化操作。在這個(gè)過程中,Redis會阻塞所有寫操作,確保RDB文件的一致性。
Redis Server 自動創(chuàng)建 RDB 文件的默認(rèn)配置在 redis.conf 里,內(nèi)容如下:
save 900 1 # 服務(wù)器在900s(15分鐘)之內(nèi),對數(shù)據(jù)進(jìn)行了至少1次修改
save 300 10 #服務(wù)器在300s(5分鐘)之內(nèi),對數(shù)據(jù)進(jìn)行了至少10次修改
save 60 10000 #服務(wù)器在60s(1分鐘)之內(nèi),對數(shù)據(jù)進(jìn)行了至少10000次修改
RDB文件格式由多個(gè)部分組成,包括:
- RDB文件頭部:包含"REDIS"字樣的字符串,以及版本號等信息。
- 保存鍵值對數(shù)據(jù):鍵值對數(shù)據(jù)以"SELECTDB"命令開頭,后面跟著一個(gè)4字節(jié)的整數(shù),表示數(shù)據(jù)庫編號。然后是若干個(gè)鍵值對數(shù)據(jù),每個(gè)鍵值對包含3部分:鍵的長度、鍵的內(nèi)容、值的內(nèi)容。
- 保存過期時(shí)間:RDB文件還可以保存鍵值對的過期時(shí)間,以便在Redis重啟時(shí)自動刪除過期的鍵值對。過期時(shí)間以"EXPIRETIME_MS"命令開頭,后面跟著鍵和過期時(shí)間等信息。
- RDB文件尾部:包含一個(gè)8字節(jié)的校驗(yàn)和,用于檢測RDB文件是否被修改。
以下是一個(gè)簡單的 RDB文件示例:
REDIS0006 // RDB文件頭部
SELECTDB 0 // 選擇數(shù)據(jù)庫0
$3foo$3bar // 鍵為"foo",值為"bar"
$3abc$5hello // 鍵為"abc",值為"hello"
EXPIRETIME_MS $3foo$4 // 設(shè)置鍵"foo"的過期時(shí)間為4秒
00000000 // RDB文件尾部的校驗(yàn)和
在讀取RDB文件時(shí),Redis會按照上述格式逐個(gè)解析RDB文件的每個(gè)部分,并將數(shù)據(jù)加載到內(nèi)存中。如果Redis在重啟時(shí)檢測到了存在RDB文件,它將讀取RDB文件,并將其中的數(shù)據(jù)加載到內(nèi)存中,以便快速恢復(fù)數(shù)據(jù)。
4. AOF 原理
Append Only File(AOF),將 Redis 執(zhí)行的每一條寫命令追加到 AOF 文件的末尾,每次Redis啟動時(shí)重新執(zhí)行 AOF 文件中的命令,從而重新構(gòu)建數(shù)據(jù)集。通過這種方式,可以保證 Redis 的數(shù)據(jù)不會丟失。
AOF 實(shí)現(xiàn)原理核心流程如下:
(1) AOF持久化策略
Redis 支持三種 AOF 持久化策略:
- always:每次執(zhí)行寫命令時(shí)都會將命令追加到AOF文件中。
- everysec:每秒執(zhí)行一次AOF持久化操作,將一秒鐘內(nèi)執(zhí)行的寫命令追加到AOF文件中。
- no:不進(jìn)行AOF持久化操作。
(2) AOF文件格式
AOF文件的格式是一系列Redis命令的序列化形式,Redis將寫入AOF文件的命令轉(zhuǎn)換為一系列字符串,并添加到AOF文件的末尾。這些命令包括SET、DEL、INCR等操作,但是對于讀命令,如GET、HGET等操作,Redis不會將其寫入AOF文件。
(3) AOF重寫
AOF重寫是為了解決 AOF 文件過大的問題,它會根據(jù)當(dāng)前內(nèi)存中的數(shù)據(jù)重建一個(gè)新的 AOF文件,并用新文件替換舊文件。在重寫過程中,Redis會將一段時(shí)間內(nèi)的寫命令重寫為一條SET命令或者DEL命令,從而減小AOF文件的大小。重寫過程中,Redis會使用內(nèi)存中的數(shù)據(jù)來生成新的AOF文件,并在生成過程中暫停所有寫操作。
(4) 完成持久化
當(dāng)Redis觸發(fā)AOF持久化操作時(shí),Redis會將內(nèi)存中的寫命令追加到AOF文件的末尾,然后通過fsync系統(tǒng)調(diào)用將寫入的內(nèi)容強(qiáng)制寫入磁盤,確保數(shù)據(jù)的安全性。
AOF文件的格式非常簡單,它是一個(gè)文本文件,每行都記錄了一條Redis命令。每條命令都以"$"開頭,表示命令長度,接著是命令的具體內(nèi)容,以"\r\n"結(jié)尾。例如,以下是一條SET命令的AOF格式:
$3\r\nSET\r\n$5\r\nmykey\r\n$7\r\nmyvalue\r\n
其中,"表示命令的長度為,表示換行符,5\r\n"表示key的長度為5,"mykey"是key的具體內(nèi)容,"\r\n"表示換行符,"$7\r\n"表示value的長度為7,"myvalue"是value的具體內(nèi)容,"\r\n"表示換行符。
在AOF文件中,除了記錄命令外,還有一些特殊的標(biāo)記,如"*\r\n"表示一次多個(gè)命令的操作,"$-1\r\n"表示空值,":0\r\n"表示數(shù)字0等。
5. 優(yōu)缺點(diǎn)
(1) RDB 優(yōu)缺點(diǎn)
- 優(yōu)點(diǎn):對于數(shù)據(jù)的備份和恢復(fù)非??焖?,因?yàn)樗傻氖且粋€(gè)快照文件,不需要對每一條數(shù)據(jù)進(jìn)行操作。
- 缺點(diǎn):如果 Redis 意外宕機(jī),可能會丟失最近一次快照時(shí)間點(diǎn)之后的數(shù)據(jù)。
(2) AOF 優(yōu)缺點(diǎn)
- 優(yōu)點(diǎn):能夠保證數(shù)據(jù)的完整性,即使 Redis 意外宕機(jī),也可以通過 AOF 文件來恢復(fù)數(shù)據(jù)。
- 缺點(diǎn):每一次寫操作都需要進(jìn)行記錄,AOF文件會變得非常大,而且 AOF 重寫操作會占用大量 CPU 和內(nèi)存資源。
為了兼顧兩種方式的優(yōu)缺點(diǎn),Redis提供了兩種混合持久化方式:
- AOF重寫:Redis會在后臺啟動一個(gè)進(jìn)程,重寫 AOF文件,將其中的無效命令刪除,從而縮小AOF文件的大小。
- AOF 和 RDB同時(shí)開啟:Redis同時(shí)使用 AOF 和 RDB 兩種方式進(jìn)行持久化,當(dāng)Redis重啟時(shí),優(yōu)先使用 AOF 文件來恢復(fù)數(shù)據(jù),如果 AOF 文件不存在或者損壞,則使用 RDB文件來恢復(fù)數(shù)據(jù)。
6. AOF 重寫機(jī)制
AOF重寫機(jī)制是Redis用來解決AOF文件過大問題的一種機(jī)制。當(dāng)AOF文件過大時(shí),可以通過 AOF 重寫機(jī)制來生成一個(gè)新的、緊湊的 AOF 文件,以減小 AOF 文件的大小,提高Redis的性能。
AOF重寫機(jī)制的實(shí)現(xiàn)原理總結(jié)為下面 3步:
(1) 觸發(fā)AOF重寫
Redis會周期性地檢查 AOF 文件的大小,如果超過了設(shè)定的閾值,就會觸發(fā) AOF 重寫操作。在默認(rèn)情況下,當(dāng) AOF 文件大小超過64MB時(shí),Redis會自動觸發(fā) AOF 重寫操作。如果需要修改閾值,可以通過配置文件中的"auto-aof-rewrite-percentage"和"auto-aof-rewrite-min-size"參數(shù)來修改。
(2) 執(zhí)行AOF重寫
AOF重寫操作是在一個(gè)子進(jìn)程中執(zhí)行的,它會遍歷內(nèi)存中的數(shù)據(jù)結(jié)構(gòu),將一段時(shí)間內(nèi)的寫命令重寫為一條SET命令或者 DEL命令,并寫入新的 AOF 文件。在重寫過程中,Redis會將新的AOF文件和舊的AOF文件進(jìn)行比較,如果發(fā)現(xiàn)有相同的命令序列,就會將新的AOF文件中的命令序列替換為舊的AOF文件中的命令序列,以減小新AOF文件的大小。
(3) 完成AOF重寫
AOF重寫操作完成后,Redis會將新的AOF文件替換舊的AOF文件,并通過fsync系統(tǒng)調(diào)用將寫入的內(nèi)容強(qiáng)制寫入磁盤,以確保數(shù)據(jù)的安全性。
AOF重寫機(jī)制的優(yōu)點(diǎn)是可以減小AOF文件的大小,提高Redis的性能,缺點(diǎn)是重寫操作會占用大量CPU和內(nèi)存資源,如果數(shù)據(jù)量較大,可能會導(dǎo)致Redis的性能下降。