如何分析nrpe監控的對象和閥值部分

nrpe監控對象和閥值:

監控對象

監控閥值

主機存活:

check_ping

-w 3000.0,80% -c 5000.0,100% -p 5(3000毫秒響應時間內,

丟包率超過80%報警告,5000毫秒響應時間內,丟包率超過

100%報危急,一共發送5個包)

登錄用戶:

check_user

-w 5 -c 10(w為警告,c為危急)

系統負載:

check_load

-w 15,10,5 -c 30,25,20(1分鐘,5分鐘,15分鐘大于對應

的等待進程數則警告或危急)

磁盤占用率:

check_disk

-w 20% -c 10% -p /(根分區剩余空間為總大小的20%警告,

10%危急,-p后是根分區)

腳本檢測磁盤I/O:

check_iostat

-w 5 –c 10 (磁盤I/O的iowait超過5%報警告,超過10%報危急)

檢測僵尸進程:

check_zombie _procs

-w 5 -c 10 -s Z(有5個僵尸進程報警告,10個報危急)

檢測總進程數:

check_total_procs

-w 150 -c 200(總進程到150個警告,200個報危急)

腳本檢測內存剩余:

check_mem

-w 90% -c 95%(內存空閑率90%以上報警告,95%以上報危急)

檢測交換分區使用率:

check_swap

-w 20% -c 10%(交換分區剩余空間為總大小的20%警告,

10%危急)

監控服務端口:

check_tcp

-H localhost2 -p 80(主機與對應的端口號)

監控頁面響應時間:

check_http

-H localhost2 -u http://localhost2/test.jsp –w 5 –c 10(檢查頁面,超過5s報警告,超過10s報危急)

腳本檢測IP連接數:

check_ips

-w 200 –c 250(IP連接數超過200報警告,超過250報危急)

流量

監控

監控server流量:

Check_traffic

-V 2c -C public -H localhost2 -I 2 -w 12,30 -c 15,35 -M –b(snmp版本,用戶,主機,對應網卡,警告閥值,危急閥值)

? 版權聲明
THE END
喜歡就支持一下吧
點贊5 分享