背景
我們公司在用inotify+rsync做實時同步,來解決分布式集群文件一致性的問題。但當web文件越來越多(百萬級數量html,jpg等小 文件),同步就越來越慢,根本做不到實時,按照網上的調優方法都嘗試過,問題根本沒有解決。經過我一翻細致研究,終于把慢的核心問題研究明白,先總結一句 inotifywait響應不會有延遲,rsync也很快。大家同樣有慢的煩惱,那是因為網上的inotify+rsync的教程都是坑。下面我們來分 析。
inotifywait 單獨分析
/usr/local/bin/inotifywait?-mrq?--format?'%Xe?%w%f'?-e?modify,create,delete,attrib?/data/
執行上面命令,是讓inotifywait監聽/data/目錄,當監聽到有發生modify,create,delete,attrib等事件發生時,按%Xe %w%f的格式輸出。
在/data/目錄touch幾個文件
touch?/data/{1..5}
觀看inotify輸出
ATTRIB?/data/1???????????--?表示發生了ATTRIB事件?路徑為/data/1 ATTRIB?/data/2 ATTRIB?/data/3 ATTRIB?/data/4 ATTRIB?/data/5
知道上面的輸出效果之后 我們應該想得到,可以用rsync獲取inotifywait監控到的文件列表來做指定的文件同步,而不是每次都由rsync做全目錄掃描來判斷文件是否存在差異。
網上的inotify+rsync分析
我們來看網上的教程,我加了注釋。(網上所有的教程基本都一模一樣,盡管寫法不一樣,致命點都是一樣的)
#!/bin/bash? /usr/bin/inotifywait?-mrq?--format?'%w%f'-e?create,close_write,delete?/backup?|while?read?file #把發生更改的文件列表都接收到file?然后循環,但有什么鬼用呢?下面的命令都沒有引用這個$file?下面做的是全量rsync do? ????cd?/backup?&&?rsync?-az?--delete?/backup/?rsync_backup@192.168.24.101::backup/--password-file=/etc/rsync.password? done
#注意看 這里的rsync 每次都是全量的同步(這就坑爹了),而且 file列表是循環形式觸發rsync ,等于有10個文件發生更改,就觸發10次rsync全量同步(簡直就是噩夢),那還不如直接寫個死循環的rsync全量同步得了。
#有很多人會說 日志輸出那里明明只有差異文件的同步記錄。其實這是rsync的功能,他本來就只會輸出有差異需要同步的文件信息。不信你直接拿這句rsync來跑試試。
#這種在需要同步的源目錄文件量很大的情況下,簡直是不堪重負。不僅耗CPU還耗時,根本不可以做到實時同步。
備注:backup為rsync server配置module,除了編寫腳本以外,還需要配置一個rsync server,rsync server配置參考《》
改良方法
要做到實時,就必須要減少rsync對目錄的遞歸掃描判斷,盡可能的做到只同步inotify監控到已發生更改的文件。結合rsync的特性,所以這里要分開判斷來實現一個目錄的增刪改查對應的操作。
腳本如下
#!/bin/bash src=/data/???????????????????????????#?需要同步的源路徑 des=data?????????????????????????????#?目標服務器上?rsync?--daemon?發布的名稱,rsync?--daemon這里就不做介紹了,網上搜一下,比較簡單。 rsync_passwd_file=/etc/rsyncd.passwd????????????#?rsync驗證的密碼文件 ip1=192.168.0.18?????????????????#?目標服務器1 ip2=192.168.0.19?????????????????#?目標服務器2 user=root????????????????????????????#?rsync?--daemon定義的驗證用戶名 cd?${src}??????????????????????????????#?此方法中,由于rsync同步的特性,這里必須要先cd到源目錄,inotify再監聽?./?才能rsync同步后目錄結構一致,有興趣的同學可以進行各種嘗試觀看其效果 /usr/local/bin/inotifywait?-mrq?--format??'%Xe?%w%f'?-e?modify,create,delete,attrib,close_write,move?./?|?while?read?file?????????#?把監控到有發生更改的"文件路徑列表"循環 do ????????INO_EVENT=$(echo?$file?|?awk?'{print?$1}')??????#?把inotify輸出切割?把事件類型部分賦值給INO_EVENT ????????INO_FILE=$(echo?$file?|?awk?'{print?$2}')???????#?把inotify輸出切割?把文件路徑部分賦值給INO_FILE ????????echo?"-------------------------------$(date)------------------------------------" ????????echo?$file ????????#增加、修改、寫入完成、移動進事件 ????????#增、改放在同一個判斷,因為他們都肯定是針對文件的操作,即使是新建目錄,要同步的也只是一個空目錄,不會影響速度。 ????????if?[[?$INO_EVENT?=~?'CREATE'?]]?||?[[?$INO_EVENT?=~?'MODIFY'?]]?||?[[?$INO_EVENT?=~?'CLOSE_WRITE'?]]?||?[[?$INO_EVENT?=~?'MOVED_TO'?]]?????????#?判斷事件類型 ????????then ????????????????echo?'CREATE?or?MODIFY?or?CLOSE_WRITE?or?MOVED_TO' ????????????????rsync?-avzcR?--password-file=${rsync_passwd_file}?$(dirname?${INO_FILE})?${user}@${ip1}::${des}?&&?????????#?INO_FILE變量代表路徑哦??-c校驗文件內容 ????????????????rsync?-avzcR?--password-file=${rsync_passwd_file}?$(dirname?${INO_FILE})?${user}@${ip2}::${des} ?????????????????#仔細看?上面的rsync同步命令?源是用了$(dirname?${INO_FILE})變量?即每次只針對性的同步發生改變的文件的目錄(只同步目標文件的方法在生產環境的某些極端環境下會漏文件?現在可以在不漏文件下也有不錯的速度?做到平衡)?然后用-R參數把源的目錄結構遞歸到目標后面?保證目錄結構一致性 ????????fi ????????#刪除、移動出事件 ????????if?[[?$INO_EVENT?=~?'DELETE'?]]?||?[[?$INO_EVENT?=~?'MOVED_FROM'?]] ????????then ????????????????echo?'DELETE?or?MOVED_FROM' ????????????????rsync?-avzR?--delete?--password-file=${rsync_passwd_file}?$(dirname?${INO_FILE})?${user}@${ip1}::${des}?&& ????????????????rsync?-avzR?--delete?--password-file=${rsync_passwd_file}?$(dirname?${INO_FILE})?${user}@${ip2}::${des} ????????????????#看rsync命令?如果直接同步已刪除的路徑${INO_FILE}會報no?such?or?directory錯誤?所以這里同步的源是被刪文件或目錄的上一級路徑,并加上--delete來刪除目標上有而源中沒有的文件,這里不能做到指定文件刪除,如果刪除的路徑越靠近根,則同步的目錄月多,同步刪除的操作就越花時間。這里有更好方法的同學,歡迎交流。 ????????fi ????????#修改屬性事件?指?touch?chgrp?chmod?chown等操作 ????????if?[[?$INO_EVENT?=~?'ATTRIB'?]] ????????then ????????????????echo?'ATTRIB' ????????????????if?[?!?-d?"$INO_FILE"?]?????????????????#?如果修改屬性的是目錄?則不同步,因為同步目錄會發生遞歸掃描,等此目錄下的文件發生同步時,rsync會順帶更新此目錄。 ????????????????then ????????????????????????rsync?-avzcR?--password-file=${rsync_passwd_file}?$(dirname?${INO_FILE})?${user}@${ip1}::${des}?&&???????????? ????????????????????????rsync?-avzcR?--password-file=${rsync_passwd_file}?$(dirname?${INO_FILE})?${user}@${ip2}::${des} ????????????????fi ????????fi done
每兩小時做1次全量同步
因為inotify只在啟動時會監控目錄,他沒有啟動期間的文件發生更改,他是不知道的,所以這里每2個小時做1次全量同步,防止各種意外遺漏,保證目錄一致。
crontab?-e *?*/2?*?*?*?rsync?-avz?--password-file=/etc/rsync-client.pass?/data/?root@192.168.0.18::data?&&?rsync?-avz?--password-file=/etc/rsync-client.pass?/data/?root@192.168.0.19::data
改良后我們公司這種百萬級小文件也能做到實施同步了。
下面附上inotify的參數說明
inotify介紹– 是一種強大的、細顆粒的、異步的文件系統監控機制,###&0###&內核從2.6.13起,加入Inotify可以監控文件系統中添加、刪除、修改移動等各種事件,利用這個內核接口,就可以監控文件系統下文件的各種變化情況。
inotifywait 參數說明
參數名稱 | 參數說明 |
---|---|
-m,–monitor | 始終保持事件監聽狀態 |
-r,–recursive | 遞歸查詢目錄 |
-q,–quiet | 只打印監控事件的信息 |
–excludei | 排除文件或目錄時,不區分大小寫 |
-t,–timeout | 超時時間 |
–timefmt | 指定時間輸出格式 |
–format | 指定時間輸出格式 |
-e,–event | 后面指定刪、增、改等事件 |
inotifywait events事件說明
事件名稱 | 事件說明 |
---|---|
access | 讀取文件或目錄內容 |
modify | 修改文件或目錄內容 |
attrib | 文件或目錄的屬性改變 |
close_write | 修改真實文件內容 |
close_nowrite | |
close | |
open | 文件或目錄被打開 |
moved_to | 文件或目錄移動到 |
moved_from | 文件或目錄從移動 |
move | 移動文件或目錄移動到監視目錄 |
create | 在監視目錄下創建文件或目錄 |
delete | 刪除監視目錄下的文件或目錄 |
delete_self | |
unmount | 卸載文件系統 |
優化 Inotify
#在/proc/sys/fs/inotify目錄下有三個文件,對inotify機制有一定的限制
[root@web?~]#?ll?/proc/sys/fs/inotify/ 總用量0 -rw-r--r--1?root?root?09月923:36?max_queued_events -rw-r--r--1?root?root?09月923:36?max_user_instances -rw-r--r--1?root?root?09月923:36?max_user_watches
max_user_watches #設置inotifywait或inotifywatch命令可以監視的文件數量(單進程)
max_user_instances #設置每個用戶可以運行的inotifywait或inotifywatch命令的進程數
max_queued_events #設置inotify實例事件(event)隊列可容納的事件數量
—————————-
[root@web?~]#?echo?50000000>/proc/sys/fs/inotify/max_user_watches?--?把他加入/etc/rc.local就可以實現每次重啟都生效 [root@web?~]#?echo?50000000>/proc/sys/fs/inotify/max_queued_events