nrpe監控對象和閥值:
監控對象 |
監控閥值 |
|
主 機 資 源 |
主機存活: check_ping |
-w 3000.0,80% -c 5000.0,100% -p 5(3000毫秒響應時間內, 丟包率超過80%報警告,5000毫秒響應時間內,丟包率超過 100%報危急,一共發送5個包) |
登錄用戶: check_user |
-w 5 -c 10(w為警告,c為危急) |
|
系統負載: check_load |
-w 15,10,5 -c 30,25,20(1分鐘,5分鐘,15分鐘大于對應 的等待進程數則警告或危急) |
|
磁盤占用率: check_disk |
-w 20% -c 10% -p /(根分區剩余空間為總大小的20%警告,
10%危急,-p后是根分區) |
|
腳本檢測磁盤I/O: check_iostat |
-w 5 –c 10 (磁盤I/O的iowait超過5%報警告,超過10%報危急) |
|
檢測僵尸進程: check_zombie _procs |
-w 5 -c 10 -s Z(有5個僵尸進程報警告,10個報危急) |
|
檢測總進程數: check_total_procs |
-w 150 -c 200(總進程到150個警告,200個報危急) |
|
腳本檢測內存剩余: check_mem |
-w 90% -c 95%(內存空閑率90%以上報警告,95%以上報危急) |
|
檢測交換分區使用率: check_swap |
-w 20% -c 10%(交換分區剩余空間為總大小的20%警告,
10%危急) |
|
應 用 服 務 監 控 |
監控服務端口: check_tcp |
-H localhost2 -p 80(主機與對應的端口號) |
監控頁面響應時間: check_http |
-H localhost2 -u http://localhost2/test.jsp –w 5 –c 10(檢查頁面,超過5s報警告,超過10s報危急) |
|
腳本檢測IP連接數: check_ips |
-w 200 –c 250(IP連接數超過200報警告,超過250報危急) |
|
流量
監控 |
監控server流量: Check_traffic |
-V 2c -C public -H localhost2 -I 2 -w 12,30 -c 15,35 -M –b(snmp版本,用戶,主機,對應網卡,警告閥值,危急閥值) |