一文詳解redis中的高可用與持久化

本篇文章帶大家聊聊redis中的高可用與持久化,看看redis 持久化的功能、兩種方式(rdb和aof),希望對大家有所幫助!

一文詳解redis中的高可用與持久化

一、Redis 高可用

1. Redis 高可用概述

??在web服務器中,高可用是指服務器可以正常訪問的時間,衡量的標準是在多長時間內可以提供正常服務(99.9%、99.99%、99.999%等等)。【相關推薦:Redis視頻教程

??但是在Redis語境中,高可用的含義似乎要寬泛一些,除了保證提供正常服務(如主從分離、快速容災技術),還需要考慮數據容量的擴展、數據安全不會丟失等。

2. Redis 高可用策略

在Redis中,實現高可用的技術主要包括持久化、主從分離、哨兵和集群。

高可用策略 說明
持久化 持久化是最簡單的高可用方法(有時甚至不被歸為高可用的手段),主要作用是數據備份,即將數據存儲在硬盤,保證數據不會因進程退出而丟失。
主從復制 主從復制是高可用Redis的基礎,哨兵和集群都是在主從復制基礎上實現高可用的。主從復制主要實現了數據的多機備份,以及對于讀操作的負載均衡和簡單的故障恢復。缺陷:故障恢復無法自動化,寫操作無法負載均衡,存儲能力受到單機的限制。
哨兵 在主從復制的基礎上,哨兵實現了自動化的故障恢復。缺陷:寫操作無法負載均衡,存儲能力受到單機的限制。
集群 通過集群,Redis解決了寫操作無法負載均衡,以及存儲能力受到單機限制的問題,實現了較為完善的高可用方案。

二、Redis 持久化

1. Redis 持久化的功能

??Redis是內存數據庫,數據都是存儲在內存中,為了避免服務器斷電等原因導致Redis進程異常退出后數據的永久丟失,需要定期將Redis中的數據以某種形式(數據或命令)從內存保存到硬盤;當下次Redis重啟時,利用持久化文件實現數據恢復。除此之外,為了進行災難備份,可以將持久化文件拷貝到一個遠程位置。

2. Redis 持久化的兩種方式

  • RDB持久化
    原理是將Redis在內存中的數據庫記錄定時保存到磁盤上。
  • AOF持久化(append only file)
    原理是將Redis的操作日志以追加的方式寫入文件,類似于mysql的binlog。
    由于AOF持久化的實時性更好,即當進程意外退出時丟失的數據更少,因此AOF是目前主流的持久化方式,不過RDB持久化仍然有其用武之地。

3. RDB 持久化

??RDB持久化是指在指定的時間間隔內將內存中當前進程中的數據生成快照保存到硬盤(因此也稱為快照持久化),用二進制壓縮存儲,保存的文件后綴是rdb;當Redis重新啟動時,可以讀取快照文件恢復數據。

3.1 觸發條件

RDB持久化的觸發分為手動觸發和自動觸發兩種。

3.1.1 手動觸發

  • save命令和bgsave命令都可以生成RDB文件。
  • save命令會阻塞Redis服務器進程,直到RDB文件創建完畢為止,在Redis服務器阻塞期間,服務器不能處理任何命令請求。
  • bgsave命令會fork()一個子進程,由子進程來負責創建RDB文件,父進程(即Redis主進程)則繼續處理請求。
  • bgsave命令執行過程中,只有fork子進程時會阻塞服務器,而對于save命令,整個過程都會阻塞服務器,因此save已基本被廢棄,線上環境要杜絕save的使用。

3.1.2 自動觸發

  • 在自動觸發RDB持久化時,Redis也會選擇bgsave而不是save來進行持久化。

3.2 配置方式

  • 通過修改配置文件進行設定:save m n
  • 自動觸發最常見的情況是在配置文件中通過save m n,指定當m秒內發生n次變化時,會觸發bgsave。
[root@localhost ~]# vim /etc/redis/6379.conf ##219行,以下三個save條件滿足任意一個時,都會引起bgsave的調用save 900 1	##當時間到900秒時,如果redis數據發生了至少1次變化,則執行bgsavesave 300 10	##當時間到300秒時,如果redis數據發生了至少10次變化,則執行bgsavesave 60 10000	##當時間到60秒時,如果redis數據發生了至少10000次變化,則執行bgsave##254行,指定RDB文件名dbfilename dump.rdb##264行,指定RDB文件和AOF文件所在目錄dir /var/lib/redis/6379##242行,是否開啟RDB文件壓縮rdbcompression yes

3.3 其他自動觸發機制

除了save m n以外,還有一些其他情況會觸發bgsave:

  • 在主從復制場景下,如果從節點執行全量復制操作,則主節點會執行bgsave命令,并將rdb文件發送給從節點。
  • 執行shutdown命令時,自動執行rdb持久化。

3.4 執行流程

一文詳解redis中的高可用與持久化

  • Redis父進程首先判斷:當前是否在執行save,或bgsave/bgrewriteaof的子進程,如果在執行則bgsave命令直接返回。bgsave/bgrewriteaof的子進程不能同時執行,主要是基于性能方面的考慮;兩個并發的子進程同時執行大量的磁盤寫操作,可能引起嚴重的性能問題。
  • 父進程執行fork操作創建子進程,這個過程中父進程是阻塞的,Redis不能執行來自客戶端的任何命令。
  • 父進程fork后,bgsave命令返回“background saving started”信息并不再阻塞父進程,并可以響應其他命令
  • 子進程創建RDB文件,根據父進程內存快照生成臨時快照文件,完成后對原有文件進行原子替換
  • 子進程發送信號給父進程表示完成,父進程更新統計信息

3.5 啟動時加載

??RDB文件的載入工作是在服務器啟動時自動執行的,并沒有專門的命令。但是由于AOF的優先級更高,因此當AOF開啟時,Redis會優先載入AOF文件來恢復數據;只有當AOF關閉時,才會在Redis服務器啟動時檢測RDB文件,并自動載入。服務器載入RDB文件期間處于阻塞狀態,直到載入完成為止。
??Redis載入RDB文件時,會對RDB文件進行校驗,如果文件損壞,則日志中會打印錯誤,Redis啟動失敗。

4. AOF 持久化

??RDB持久化是將進程數據寫入文件,而AOF持久化則是將Redis執行的每次寫、刪除命令記錄到單獨的日志文件中,查詢操作不會記錄;當Redis重啟時再次執行AOF文件中的命令來恢復數據。
??與RDB相比,AOF的實時性更好,因此已成為主流的持久化方案。

4.1 開啟 AOF

Redis服務器默認開啟RDB,關閉AOF;要開啟AOF,需要在配置文件中配置

[root@localhost ~]# vim /etc/redis/6379.conf ##700行,修改,開啟AOFappendonly yes##704行,指定AOF文件名稱appendfilename "appendonly.aof"##796行,是否忽略最后一條可能存在問題的指令aof-load-truncated yes[root@localhost ~]# /etc/init.d/redis_6379 restartStopping ... Redis stopped Starting Redis server...

4.2 執行流程

由于需要記錄Redis的每條寫命令,因此AOF不需要觸發,下面介紹AOF的執行流程。

AOF的執行流程包括:

  • 命令追加(append):將Redis的寫命令追加到緩沖區aof_buf;
  • 文件寫入(write)和文件同步(sync):根據不同的同步策略將aof_buf中的內容同步到硬盤;
  • 文件重寫(rewrite):定期重寫AOF文件,達到壓縮的目的。

4.2.1 命令追加(append)

Redis先將命令追加到緩沖區,而不是直接寫入文件,主要是為了避免每次有寫命令都直接寫入硬盤,導致硬盤IO稱為Redis負載的瓶頸。

命令追加的格式是Redis命令請求的協議格式,它是一種純文本格式,具有兼容性好、可讀性強、容易處理、操作簡單、避免二次開銷等優點。在AOF文件中,除了用于指定數據庫的select命令(如select 0為選中0號數據庫)是由Redis添加的,其他都是客戶端發送來的寫命令。

4.2.2 文件寫入(write)和文件同步(sync)

Redis提供了多種AOF緩存區的同步文件策略,策略涉及到操作系統的write和fsync函數,說明如下:
為了提高文件寫入效率,在現代操作系統中,當用戶調用write函數將數據寫入文件時,操作系統通常會將數據暫存到一個內存緩沖區里,當緩沖區被填滿或超過了指定時限后,才真正將緩沖區的數據寫入到硬盤里。這樣的操作雖然提高了效率,但也帶來了安全問題:如果計算機停機,內存緩沖區中的數據會丟失;因此系統同時提供了fsync、fdatasync等同步函數,可以強制操作系統立刻將緩沖區中的數據寫入到硬盤里,從而確保數據的安全性。

4.2.3 三種同步方式

AOF緩存區的同步文件策略存在三種同步方式,通過對/etc/redis/6379.conf的729行的修改進行配置。

4.2.3.1 appendfsync always

命令寫入aof_buf后立即調用系統fsync操作同步到AOF文件,fsync完成后線程返回。這種情況下,每次有寫命令都要同步到AOF文件,硬盤IO成為性能瓶頸,Redis只能支持大約幾百TPS寫入,嚴重降低了Redis的性能;即便是使用固態硬盤(SSD),每秒大約也就只能處理幾萬個命令,而且會大大降低SSD的壽命。

4.2.3.2 appendfsync no

命令寫入aof_buf后調用系統write操作,不對AOF文件做fsync同步;同步由操作系統負載,通常同步周期為30秒。這種情況下,文件同步的時間不可控,且緩沖區中積的數據會很多,數據安全性無法保證。

4.2.3.3 appendfsync everysec(推薦)

命令寫入aof_buf后調用系統write操作,write完成后線程返回:fsync同步文件操作由專門的線程每秒調用一次。everysec是前述兩種策略的折中,是性能和數據安全性的平衡,一次是Redis的默認配置,也是我們推薦的配置。

4.2.4 文件重寫(rewrite)

隨著時間流逝,Redis服務器執行的寫命令越來越多,AOF文件也會越來越大;過大的AOF文件不僅會影響服務器的正常運行,也會導致數據恢復需要的時間過長。
文件重寫是指定期重寫AOF文件,減小AOF文件的體積。需要注意的是,AOF重寫是把Redis進程內的數據轉化為寫命令,同步到新的AOF文件;不會對舊的AOF文件進行任何讀取、寫入操作。
關于文件重寫需要注意的另一點是:對于AOF持久化來說,文件重寫雖然是強烈推薦的,但并不是必須的;即使沒有文件重寫,數據也可以被持久化并在Redis啟動的時候導入;因此在一些現實中,會關閉自動的文件重寫,然后定時任務在每天的某一時刻定時執行。

4.2.4.1 具有壓縮功能的原因

文件重寫之所以能夠壓縮AOF文件,原因在于:

  • 過期的數據不再寫入文件。
  • 無效的命令不再寫入文件:如有些數據被重復設置(set mykey v1,set mykey v2)、有些數據被刪除了(set myset v1,del myset)等。
  • 多條命令可以合并為一個:如sadd myset v1,sadd myset v2,sadd myset v3可以合并為sadd myset v1 v2 v3。

通過上述原因可以看出,由于重寫后AOF執行的命令減少了,文件重寫既可以減少文件占用的空間,也可以加快恢復速度。

4.2.4.2 文件重寫的觸發

文件重寫分為手動觸發和自動觸發:

  • 手動觸發:直接調用bfrewriteaof命令,該命令的執行與bgsave有些類似,都是fork進程進行具體的工作,且都只有在fork時阻塞。
  • 自動觸發:通過設置auto-aof-rewrite-min-size選項和auto-aof-rewrite-percentage選項來自動執行bgrewriteaof。只有當auto-aof-rewrite-min-size和auto-aof-rewrite-percentage兩個選項同時滿足時,才會自動觸發AOF重寫,即bgrewriteaof操作。

自動觸發的配置位于/etc/redis/6379.conf的771行和772行

  • auto-aof-rewrite-percentage 100
    當前AOF文件大小(即aof_current_size)是上次日志重寫時AOF文件大小(aof_base_size)兩倍時,發生bgrewriteaof操作
  • auto-aof-rewrite-min-size 64mb
    當前AOF文件執行bgrewriteaof命令的最小值,避免剛開始啟動Redis時由于文件尺寸較小導致頻繁的bgrewriteaof
4.2.4.3 文件重寫的流程

一文詳解redis中的高可用與持久化
文件重寫的流程如下:

  • Redis父進程首先平判斷當前是否存在正在執行bgsave/bgrewriteaof的子進程;如果存在則bgrewriteaof命令直接返回,如果存在bgsave命令則等bgsave執行完成后再執行。
  • 父進程執行fork操作創建子進程,這個過程中父進程是阻塞的。
  • 父進程fork后,bgrewriteaof命令返回“Background append only file rewrite started”信息并不再阻塞父進程,并可以響應其他命令。Redis的所有寫命令依然寫入AOF緩沖區,并根據appendfsync策略同步到硬盤,保證原有AOF機制的正確。
  • 由于fork操作使用寫時復制技術,子進程只能共享fork操作時的內存數據。由于父進程依然在響應命令,因此Redis使用AOF重寫緩沖區(aof_rewrite_buf)保存這部分數據,防止新AOF文件生成期間丟失這部分數據。也就是說,bgrewriteaof執行期間,Redis的寫命令同時追加到aof_buf和aof_rewrite_buf兩個緩沖區。
  • 子進程根據內存快照,按照命令合并規則寫入到新的AOF文件。
  • 子進程寫完新的AOF文件后,向父進程發信號,父進程更新統計信息,具體可以通過info persistence查看。
  • 父進程把AOF重寫緩沖區的數據寫入到新的AOF文件,這樣就保證了新AOF文件所保存的數據庫狀態和服務器當前狀態一致。
  • 使用新的AOF文件替換老文件,文成AOF重寫。

關于文件重寫的流程,有兩點需要特別注意:

  • 重寫由父進程fork子進程進行
  • 重寫期間Redis執行的寫命令,需要追加到新的AOF文件中,為此Redis引入例如aof_rewrite_buf緩存

4.3 啟動時加載

  • 當AOF開啟時,Redis啟動時會優先載入AOF文件來恢復數據;只有當AOF關閉時,才會載入RDB文件恢復數據。
  • 當AOF開啟,但AOF文件不存在時,即使RDB文件存在也不會加載。
  • Redis載入AOF文件時,會對AOF文件進行校驗,如果文件損壞,則日志中會打印錯誤,Redis啟動失敗。但如果是AOF文件結尾不完整(機器突然宕機等容易導致文件尾部不完整),且aof_load_truncated參數開啟,則日志中會輸出警告,Redis忽略掉AOF文件的尾部,啟動成功。aof_load_truncated參數默認是開啟的。

5. RDB 和 AOF 的優缺點

RDB持久化

優點:RDB文件緊湊,體積小,網絡傳輸快,適合全量復制;恢復速度比AOF快很多。當然,與AOF相比,RDB最重要的優點之一是對性能的影響相對較小。
缺點:RDB文件的知名缺點在于其數據快照的持久化方式決定了必然做不到實時持久化,而在數據越來越重要的今天,數據的大量丟失很多時候是無法接受的,因此AOF持久化成為主流。此外,RDB文件需要滿足特定格式,兼容性差(如老版本的Redis不兼容新版本的RDB文件)。
對于RDB持久化,一方面是bgsave在進行fork操作時Redis主進程會阻塞,另一方面,子進程向硬盤寫數據也會帶來IO壓力。

AOF持久化

與RDB持久化相對應,AOF的優先在于支持秒級持久化、兼容性好,缺點是文件大、恢復速度慢,對性能影響大。

對于AOF持久化,向硬盤寫數據的頻率大大提高(everysec策略下為秒級),IO壓力更大,甚至可能在成AOF追加阻塞問題。

AOF文件的重寫與RDB的bgsave類似,會有fork時的阻塞和子進程的IO壓力問題。相對來說,由于AOF向硬盤中寫數據的頻率更高,因此對Redis主進程性能的影響會更大。

一般來說,建議關閉AOF的自動重寫功能,并在重寫操作設置計劃任務,放在凌晨業務量低的時候進行,以降低AOF對主進程性能的影響以及IO的讀寫壓力。

更多編程相關知識,請訪問:Redis視頻教程!!

以上就是一文詳解

? 版權聲明
THE END
喜歡就支持一下吧
點贊15 分享