linux ha的意思是“高可用集群”,英文全稱為“High Availability Cluster”;高可用集群的出現(xiàn)是為了使集群的整體服務(wù)盡可能可用,從而減少由計(jì)算機(jī)硬件和軟件易錯(cuò)性所帶來的損失;高可用集群軟件的主要作用就是實(shí)現(xiàn)故障檢查和業(yè)務(wù)切換的自動(dòng)化。
本教程操作環(huán)境:linux5.9.8系統(tǒng)、Dell G3電腦。
linux ha 是什么意思?
高可用集群,英文原文為High Availability Cluster,簡(jiǎn)稱HACluster,簡(jiǎn)單的說,集群(cluster)就是一組計(jì)算機(jī),它們作為一個(gè)整體向用戶提供一組網(wǎng)絡(luò)資源。這些單個(gè)的計(jì)算機(jī)系統(tǒng) 就是集群的節(jié)點(diǎn)(node)。? ?
高可用集群的出現(xiàn)是為了使集群的整體服務(wù)盡可能可用,從而減少由計(jì)算機(jī)硬件和軟件易錯(cuò)性所帶來的損失。如果某個(gè)節(jié)點(diǎn)失效,它的備援節(jié)點(diǎn)將在幾秒鐘的時(shí)間內(nèi)接管它的職責(zé)。
因此,對(duì)于用戶而言,集群永遠(yuǎn)不會(huì)停機(jī)。 ?
高可用集群軟件的主要作用就是實(shí)現(xiàn)故障檢查和業(yè)務(wù)切換的自動(dòng)化。只有兩個(gè)節(jié)點(diǎn)的高可用集群又稱為雙機(jī)熱備,即使用兩臺(tái)服務(wù)器互相備份。當(dāng)一臺(tái)服務(wù)器出現(xiàn)故障時(shí),可由另一臺(tái)服務(wù)器承擔(dān)服務(wù)任務(wù),從而在不需要人工干預(yù)的 情況下,自動(dòng)保證系統(tǒng)能持續(xù)對(duì)外提供服務(wù)。雙機(jī)熱備只是高可用集群的一種,高可用集群系統(tǒng)更可以支持兩個(gè)以上的節(jié)點(diǎn),提供比雙機(jī)熱備更多、更高級(jí)的功能,更能滿足用戶不斷出現(xiàn)的需求變化。
高可用集群的衡量標(biāo)準(zhǔn)
高可用集群一般是通過系統(tǒng)的可靠性(reliability)和系統(tǒng)的可維護(hù)性(maintainability)來衡量的。通常用平均無故障時(shí)間(MTTF)來衡量系統(tǒng)的可靠性,用平均維護(hù) 時(shí)間(MTTR)來衡量系統(tǒng)的可維護(hù)性。因此,一個(gè)高可用集群服務(wù)可以這樣來定義:HA=MTTF/(MTTF+MTTR)*100%。
一般高可用集群的標(biāo)準(zhǔn)有如下幾種:
99%:表示 一年宕機(jī)時(shí)間不超過4天
99.9% :表示一年宕機(jī)時(shí)間不超過10小時(shí)
99.99%: 表示一年宕機(jī)時(shí)間不超過1小時(shí)
99.999% :表示一年宕機(jī)時(shí)間不超過6分鐘
高可用集群的三種方式
實(shí)現(xiàn)高可用集群有三種方式:
(1)、主從方式(非對(duì)稱)
這種方式組建的高可用集群通常包含2個(gè)節(jié)點(diǎn)和一個(gè)或多個(gè)服務(wù)器,其中一臺(tái)作為主節(jié)點(diǎn)(active),另一臺(tái)作為備份節(jié)點(diǎn)(standy)。備份節(jié)點(diǎn)隨時(shí)都在檢測(cè)主節(jié)點(diǎn)的健康狀況,當(dāng)主節(jié)點(diǎn)發(fā)生故障時(shí),服務(wù)會(huì)自動(dòng)切換到備份節(jié)點(diǎn)上以保證服務(wù)正常運(yùn)行。
這種方式下的高可用集群其中的備份節(jié)點(diǎn)平時(shí)不會(huì)啟動(dòng)服務(wù),只有發(fā)生故障時(shí)才會(huì)有用,因此感覺比較浪費(fèi)。
?
(2)、對(duì)稱方式
這種方式一般包含2個(gè)節(jié)點(diǎn)和一個(gè)或多個(gè)服務(wù),其中每一個(gè)節(jié)點(diǎn)都運(yùn)行著不同的服務(wù)且相互作為備份,兩個(gè)節(jié)點(diǎn)互相檢測(cè)對(duì)方的健康狀況,這樣當(dāng)其中一個(gè)節(jié)點(diǎn)發(fā)生故障時(shí),該節(jié)點(diǎn)上的服務(wù)會(huì)自動(dòng)切換到另一個(gè)節(jié)點(diǎn)上去。這樣可以保證服務(wù)正常運(yùn)行。
?
(3)、多機(jī)方式
這種集群包含多個(gè)節(jié)點(diǎn)和多個(gè)服務(wù)。每一個(gè)節(jié)點(diǎn)都可能運(yùn)行和不運(yùn)行服務(wù),每臺(tái)服務(wù)器都監(jiān)視著幾個(gè)指定的服務(wù),當(dāng)其中的一個(gè)節(jié)點(diǎn)發(fā)生故障時(shí),會(huì)自動(dòng)切換到這組服務(wù)器中的一個(gè)節(jié)點(diǎn)上去。
相關(guān)推薦:《Linux視頻教程》