本文在介紹如何處理影響實(shí)例運(yùn)行狀態(tài)的有計(jì)劃或非預(yù)期事件的基礎(chǔ)上,重點(diǎn)探討了其具體步驟,本文內(nèi)容很緊湊,希望大家耐心學(xué)習(xí)。
系統(tǒng)事件
系統(tǒng)事件是影響實(shí)例運(yùn)行狀態(tài)的有計(jì)劃或非預(yù)期事件。特指因探測(cè)到更新維護(hù)、違規(guī)操作、系統(tǒng)故障、軟硬件故障、因預(yù)付費(fèi)即將到期或賬號(hào)欠費(fèi)時(shí),發(fā)生的重啟、停止或者釋放ECS實(shí)例等操作的事件。
概述
實(shí)例是您構(gòu)建業(yè)務(wù)應(yīng)用的核心基礎(chǔ)組件,當(dāng)您完成了實(shí)例選型、購(gòu)買、初始化配置并開始部署業(yè)務(wù)后,實(shí)例的健康狀態(tài)對(duì)于您的業(yè)務(wù)連續(xù)性和系統(tǒng)可靠性有關(guān)鍵作用。為提升系統(tǒng)可靠性、系統(tǒng)性能和安全防護(hù)能力,ECS會(huì)主動(dòng)對(duì)實(shí)例所宿的物理服務(wù)器做日常維護(hù)并修復(fù)潛在的系統(tǒng)故障。當(dāng)探測(cè)到物理服務(wù)器出現(xiàn)故障或者隱患時(shí),ECS將實(shí)例在線熱遷移到健康的服務(wù)器,以保持實(shí)例的健康運(yùn)行狀態(tài)。這些維護(hù)是日常維護(hù)。日常維護(hù)有別于系統(tǒng)事件,日常維護(hù)通常是無(wú)感知完成的,不會(huì)發(fā)送維護(hù)通知,也不對(duì)實(shí)例造成影響。
發(fā)生系統(tǒng)事件時(shí),ECS及時(shí)給您發(fā)送通知、應(yīng)對(duì)措施和事件周期等信息。對(duì)于有計(jì)劃的系統(tǒng)事件,會(huì)提前告知該事件對(duì)實(shí)例的影響和預(yù)計(jì)執(zhí)行時(shí)間點(diǎn)等信息。您可以在執(zhí)行系統(tǒng)事件之前及時(shí)備份數(shù)據(jù)、做好應(yīng)用層面的準(zhǔn)備進(jìn)而防備對(duì)業(yè)務(wù)的可靠性和連續(xù)性的潛在影響。對(duì)于已處理的系統(tǒng)事件,您可以查詢過(guò)去兩個(gè)月內(nèi)實(shí)例的歷史系統(tǒng)事件,獲取故障診斷和復(fù)盤分析數(shù)據(jù)。
使用限制
除已停售的實(shí)例規(guī)格族之外,例如c1、c2、m1、m2、s1、s2、s3和t1等,所有的實(shí)例規(guī)格族均支持系統(tǒng)事件功能。更多詳情,請(qǐng)參閱實(shí)例規(guī)格族。
事件類型
系統(tǒng)事件類型如下表所示。
事件狀態(tài)
系統(tǒng)事件的生命周期中,有如下事件狀態(tài)。
事件窗口
系統(tǒng)事件有如下窗口期:
用戶操作窗口期:系統(tǒng)事件計(jì)劃發(fā)起到執(zhí)行之間的時(shí)間段。通常系統(tǒng)維護(hù)相關(guān)事件用戶操作窗口期為24~48小時(shí),預(yù)付費(fèi)實(shí)例即將到期而停止的操作窗口期為7至15天,賬號(hào)欠費(fèi)而停止的操作窗口期通常小于1小時(shí)。
您可以根據(jù)該事件對(duì)業(yè)務(wù)的影響情況,選擇推薦的應(yīng)對(duì)方式提前修復(fù)系統(tǒng)事件,或者等待執(zhí)行默認(rèn)應(yīng)對(duì)動(dòng)作。對(duì)于ECS主動(dòng)修復(fù)系統(tǒng)故障觸發(fā)的系統(tǒng)事件,ECS根據(jù)系統(tǒng)維護(hù)操作計(jì)劃安排提前一段時(shí)間向您發(fā)送事件通知。
事件執(zhí)行窗口期:若您沒有提前應(yīng)對(duì)系統(tǒng)事件,修復(fù)故障類系統(tǒng)事件通常會(huì)在進(jìn)入事件執(zhí)行窗口期的6小時(shí)內(nèi)自動(dòng)完成、因計(jì)費(fèi)問(wèn)題引發(fā)系統(tǒng)事件實(shí)例會(huì)被立刻停止、經(jīng)典網(wǎng)絡(luò)類型實(shí)例會(huì)在7天后被釋放以及VPC類型實(shí)例會(huì)在15天后被釋放。隨后您會(huì)收到系統(tǒng)事件的執(zhí)行結(jié)果。
說(shuō)明
對(duì)于突發(fā)故障或者違規(guī)操作等非技術(shù)因素導(dǎo)致的非預(yù)期系統(tǒng)事件,通常不會(huì)存在用戶操作窗口期,只有短暫的事件執(zhí)行窗口期。您可以查詢歷史系統(tǒng)事件用于故障診斷、原因分析或數(shù)據(jù)復(fù)原。
查看系統(tǒng)事件
如果存在有計(jì)劃的系統(tǒng)事件,ECS控制臺(tái)待處理事件按鈕上會(huì)出現(xiàn)顯著標(biāo)示提醒您查看。
登錄ECS管理控制臺(tái) 。
在左側(cè)導(dǎo)航欄里,單擊概覽。
在概覽 頁(yè)的常用操作區(qū)域,單擊待處理事件。
單擊系統(tǒng)計(jì)劃事件頁(yè)面,您可以看到實(shí)例ID、地域、實(shí)例運(yùn)行狀態(tài)、事件類型、推薦操作等相關(guān)信息。您可以在操作列執(zhí)行需要的操作。
API操作:DescribeInstancesFullStatus查詢實(shí)例的系統(tǒng)事件。
查看歷史系統(tǒng)事件
在全部事件頁(yè)面,您可以查看過(guò)去兩個(gè)月內(nèi)發(fā)生的全部系統(tǒng)事件記錄,為故障診斷和復(fù)盤分析提供數(shù)據(jù)支撐。
登錄ECS管理控制臺(tái) 。
在左側(cè)導(dǎo)航欄里,單擊概覽。
在概覽頁(yè)的常用操作區(qū)域,單擊待處理事件。
在左側(cè)導(dǎo)航欄中,單擊全部事件。在全部事件頁(yè)面,單擊系統(tǒng)計(jì)劃事件 > 實(shí)例,查看實(shí)例ID、事件類型和事件狀態(tài)等相關(guān)信息。
API操作:DescribeInstanceHistoryEvents查詢歷史系統(tǒng)事件。
訂閱事件通知
所有系統(tǒng)事件均可以通過(guò)云監(jiān)控配置報(bào)警規(guī)則,當(dāng)事件發(fā)生時(shí)會(huì)及時(shí)通知您。更多詳情,請(qǐng)參閱 云監(jiān)控 文檔云產(chǎn)品系統(tǒng)事件監(jiān)控。
應(yīng)對(duì)建議
您可以通過(guò)控制臺(tái)操作或者API調(diào)用應(yīng)對(duì)系統(tǒng)事件。從系統(tǒng)事件出發(fā)管理ECS,可以提高您對(duì)ECS的底層感知能力,優(yōu)化ECS實(shí)例運(yùn)維。