成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Zabbix 如何監控服務器硬件信息?

運維 系統運維
做為Linux系統工程師,在服務器的維護管理當中,除了對系統進行維護管理之外,最重要的還要對服務器的硬件進行監控,比如服務器Raid狀態是否正常(如果Raid卡出問題,會影響數據的讀寫速度),服務器硬盤是否正常(如果硬盤壞掉,嚴重的情況會丟失數據),服務器電源是否有故障等。

做為Linux系統工程師,在服務器的維護管理當中,除了對系統進行維護管理之外,最重要的還要對服務器的硬件進行監控,比如服務器Raid狀態是否正常(如果Raid卡出問題,會影響數據的讀寫速度),服務器硬盤是否正常(如果硬盤壞掉,嚴重的情況會丟失數據),服務器電源是否有故障等。除此之外還要對服務器的CPU,內存,處理器等重要設備的溫度進行監控,如果溫度超過服務器的臨界溫度則進行報警通知。

HP的服務器在硬件管理方面提供了自己管理工具hpacucli,通過該工具可以查看HP服務器的RAID信息,服務器硬盤等信息。
1)安裝hpacucli工具(下載地址:HP hpacucli管理工具)

 

  1. [root@monitor ~]#rpm -ivh hpacucli-9.40-12.0.x86_64.rpm 

 

2)查看服務器RAID信息,硬盤是否正常。

  1. [root@monitor~]# hpacucli ctrl all show config 
  2. Smart Array P410i in Slot 0 (Embedded)    (sn: 5001438018042FF0) 
  3.    array A (SAS, Unused Space: 0 MB) 
  4.       logicaldrive 1 (279.4 GB, RAID 1, OK) 
  5.       physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 300 GB, OK) 
  6.       physicaldrive 1I:1:2 (port 1I:box 1:bay 2, SAS, 300 GB, OK) 

 

3)通過hpacucli ctrl all show config detail命令可以詳細地查看RAID和硬盤的信息。

  1. [root@monitor ~]# hpacucli ctrl all show config detail 
  2. Smart Array P410i in Slot 0 (Embedded) 
  3.    Bus Interface: PCI 
  4.    Slot: 0 
  5.    Serial Number: 5001438018042FF0 
  6.    Cache Serial Number: PBCDH0CRH1FH62 
  7.    RAID 6 (ADG) Status: Disabled 
  8.    Controller Status: OK 
  9.    Chassis Slot: 
  10.    Hardware Revision: Rev C 
  11.    Firmware Version: 5.14 
  12.    Rebuild Priority: Medium 
  13.    Expand Priority: Medium 
  14.    Surface Scan Delay: 15 secs 
  15.    Monitor and Performance Delay: 60 min 
  16.    Elevator Sort: Enabled 
  17.    Degraded Performance Optimization: Disabled 
  18.    Inconsistency Repair Policy: Disabled 
  19.    Post Prompt Timeout: 0 secs 
  20.    Cache Board Present: True 
  21.    Cache Status: OK 
  22.    Accelerator Ratio: 25% Read / 75% Write 
  23.    Drive Write Cache: Disabled 
  24.    Total Cache Size: 512 MB 
  25.    No-Battery Write Cache: Disabled 
  26.    Cache Backup Power Source: Capacitors 
  27.    Battery/Capacitor Count: 1 
  28.    Battery/Capacitor Status: OK 
  29.    SATA NCQ Supported: True 
  30.    Array: A 
  31.       Interface Type: SAS 
  32.       Unused Space: 0 MB 
  33.       Status: OK 
  34.       Logical Drive: 1 
  35.          Size: 279.4 GB 
  36.          Fault Tolerance: RAID 1 
  37.          Heads: 255 
  38.          Sectors Per Track: 32 
  39.          Cylinders: 65535 
  40.          Stripe Size: 128 KB 
  41.          Status: OK 
  42.          Array Accelerator: Enabled 
  43.          Unique Identifier: 600508B1001034373220202020200002 
  44.          Disk Name: /dev/cciss/c0d0 
  45.          Mount Points: /boot 99 MB 
  46.          Logical Drive Label: A00ADBD9PR7AMU1472     898D 
  47.          Mirror Group 0: 
  48.             physicaldrive 1I:1:1 (port 1I:box 1:bay 1, SAS, 300 GB, OK) 
  49.          Mirror Group 1: 
  50.             physicaldrive 1I:1:2 (port 1I:box 1:bay 2, SAS, 300 GB, OK) 
  51.       physicaldrive 1I:1:1 
  52.          Port: 1I 
  53.          Box: 1 
  54.          Bay: 1 
  55.          Status: OK 
  56.          Drive Type: Data Drive 
  57.          Interface Type: SAS 
  58.          Size: 300 GB 
  59.          Rotational Speed: 10000 
  60.          Firmware Revision: HPD4 
  61.          Serial Number: ECA1PC80GTS31234 
  62.          Model: HP      EG0300FBDSP 
  63.          PHY Count: 2 
  64.          PHY Transfer Rate: 6.0GBPS, Unknown 
  65.       physicaldrive 1I:1:2 
  66.          Port: 1I 
  67.          Box: 1 
  68.          Bay: 2 
  69.          Status: OK 
  70.          Drive Type: Data Drive 
  71.          Interface Type: SAS 
  72.          Size: 300 GB 
  73.          Rotational Speed: 10000 
  74.          Firmware Revision: HPD7 
  75.          Serial Number:         PMX6902D 
  76.          Model: HP      EG0300FBDBR 
  77.          PHY Count: 2 
  78.          PHY Transfer Rate: 6.0GBPS, Unknown 

 

HP官方還有一個hpasmcli管理工具,可以很詳細查看服務器CPU,內存,處理器,電源等的溫度信息。

1)安裝hpasmcli工具(下載地址:HP hpasmcli管理工具

 

  1. [root@monitor ~]#rpm -ivh hp-health-9.40-1602.44.rhel6.x86_64.rpm 

 

2)通過工具hpasmcli可以查看服務器各部件的溫度信息,其中Temp表示各部件當前的溫度,Threshold表示臨界溫度,當當前溫度超過臨界溫度的時候就要注意啦。

  1. [root@monitor ~]# hpasmcli -s 'show temp' 
  2. Sensor   Location              Temp       Threshold 
  3. ------   --------              ----       --------- 
  4. #1        AMBIENT              23C/73F    42C/107F 
  5. #2        CPU#1                40C/104F   82C/179F 
  6. #3        CPU#2                40C/104F   82C/179F 
  7. #4        MEMORY_BD            33C/91F    87C/188F 
  8. #5        MEMORY_BD            33C/91F    78C/172F 
  9. #6        MEMORY_BD             -         87C/188F 
  10. #7        MEMORY_BD            32C/89F    78C/172F 
  11. #8        MEMORY_BD            32C/89F    87C/188F 
  12. #9        MEMORY_BD            32C/89F    78C/172F 
  13. #10       MEMORY_BD             -         87C/188F 
  14. #11       MEMORY_BD            32C/89F    78C/172F 
  15. #12       POWER_SUPPLY_BAY     33C/91F    59C/138F 
  16. #13       POWER_SUPPLY_BAY     47C/116F   73C/163F 
  17. #14       MEMORY_BD            29C/84F    72C/161F 
  18. #15       PROCESSOR_ZONE       32C/89F    73C/163F 
  19. #16       PROCESSOR_ZONE       30C/86F    64C/147F 
  20. #17       MEMORY_BD            28C/82F    63C/145F 
  21. #18       PROCESSOR_ZONE       39C/102F   69C/156F 
  22. #19       SYSTEM_BD            35C/95F    69C/156F 
  23. #20       SYSTEM_BD            38C/100F   71C/159F 
  24. #21       SYSTEM_BD            44C/111F   65C/149F 
  25. #22       SYSTEM_BD            45C/113F   71C/159F 
  26. #23       SYSTEM_BD            39C/102F   69C/156F 
  27. #24       SYSTEM_BD            47C/116F   69C/156F 
  28. #25       SYSTEM_BD            35C/95F    63C/145F 
  29. #26       SYSTEM_BD            45C/113F   66C/150F 
  30. #27       SCSI_BACKPLANE_ZONE  35C/95F    60C/140F 
  31. #28       SYSTEM_BD            73C/163F   110C/230F 

 

3)通過hpasmcli -s 'show'查看類似于help的幫助信息,監控的時候要重點關注 DIMM(內存)、FANS(風扇)、POWERSUPPLY(電源模塊)、SERVER(系統)、CPU、TEMP(溫度)等信息。

  1. [root@monitor ~]# hpasmcli -s 'show' 
  2. Invalid Arguments 
  3.      SHOW ASR 
  4.      SHOW BOOT 
  5.      SHOW DIMM [ SPD ] 
  6.      SHOW F1 
  7.      SHOW FANS 
  8.      SHOW HT 
  9.      SHOW IML 
  10.      SHOW IPL 
  11.      SHOW NAME 
  12.      SHOW PORTMAP 
  13.      SHOW POWERMETER 
  14.      SHOW POWERSUPPLY 
  15.      SHOW PXE 
  16.      SHOW SERIAL [ BIOS | EMBEDDED | VIRTUAL ] 
  17.      SHOW SERVER 
  18.      SHOW TEMP 
  19.      SHOW TPM 
  20.      SHOW UID 
  21.      SHOW WOL 

 

4)hpasmcli幾種常用的例子。

  • 查看內存信息:hpasmcli -s 'show dimm'|egrep -i 'module|stat'
  • 查看風扇信息:hpasmcli -s 'show fans'
  • 查看硬件溫度:hpasmcli -s 'show temp'
  • 查看電源模塊:hpasmcli -s 'show powersupply'
  • 查看機器型號,序列號,CPU,內存大小:hpasmcli -s 'show server'

由于各種服務器的廠商不同,管理工具不同,因此Zabbix對服務器硬件方面沒有很詳細,全面的解決方案。之前dl528888寫過zabbix通過omsa工具監控DEL服務器,也是一種很好的思路,我也借鑒過,這里非常感謝。

Zabbix監控總結起來有兩種思路:第一就是server通過agentd方式獲取數據,這種方式需要定義UserParameter參數,即KEY。第二就是server通過trapper的方式獲取數據,即agentd將數據主動sender給server或者proxy。我這里是通過第二種traper的方式監控的。第一種方式server有時候會取不到數據:

  1. became not supported: Received value [] is not suitable for value type [Numeric (unsigned)] and data type [Decimal] 

會產生上面的錯誤。

首先查看我監控的腳本,由于是通過traper的思路進行監控,log_file文件依次定義了要監控服務器的主機名(hostname),監控項key以及監控的值。

  1. [root@monitor scripts]# cat hpacuclizabbix.sh 
  2. #!/bin/sh 
  3. #create by sfzhang 20140517 
  4. #This scripts monitoring HP server, such as smart array status,Hardware information and server temperature。 
  5. zabbix_server="*.*.*.*" #IP from Zabbix Server or proxy where data should be send to. 
  6. zabbix_sender="/usr/local/zabbix/bin/zabbix_sender" 
  7. log_file='/tmp/hpacuclizabbix.log' #In the file to define the monitor host, key and value 
  8. hpacucli='/usr/sbin/hpacucli' 
  9. options='ctrl all show config detail' 
  10. hpacucli_log="/tmp/result.log" 
  11. PATH=$PATH:/usr/sbin:/sbin 
  12. ${hpacucli} ${options} > ${hpacucli_log} 
  13. Cache_status=`cat ${hpacucli_log} |awk '/Cache Status:/{print $NF}'` 
  14. Controller_status=`cat ${hpacucli_log} |awk '/Controller Status:/{print $NF}'` 
  15. Battery_capacitor_status=`cat ${hpacucli_log} |awk '/Battery\/Capacitor Status:/{print $NF}'` 
  16. Physicaldrive_status=$(awk -v total=`hpacucli ctrl slot=0 pd all show status |grep physicaldrive |wc -l` -v normal=`hpacucli ctrl slot=0 pd all show status|awk '/physicaldrive/{if($NF=="OK") count+=1}END{print count}'` 'BEGIN{if(total==normal) {print "OK"} else {print "NO"}}') 
  17. Memory_status=$(awk -v total=`hpasmcli -s 'SHOW DIMM'|grep -i 'Status' |wc -l` -v normal=`hpasmcli -s 'SHOW DIMM' |awk '/Status:/{if($NF=="Ok") count+=1}END{print count}'` 'BEGIN{if(total==normal) {print "OK"} else {print "NO"}}') 
  18. Fans_status=$(awk -v total=`hpasmcli -s 'SHOW FANS' |grep "#" |wc -l` -v normal=`hpasmcli -s 'SHOW FANS'  |awk '/#/{if($3=="Yes") count+=1}END{print count}'` 'BEGIN{if(total==normal) {print "OK"} else {print "NO"}}') 
  19. Power_status=$(awk -v total=`hpasmcli -s 'SHOW POWERSUPPLY' |grep "Power supply" |wc -l` -v normal=`hpasmcli -s 'SHOW POWERSUPPLY' |awk '/Condition:/{if ($NF=="Ok") count+=1}END{print count}'` 'BEGIN{if(total==normal) {print "OK"} else {print "NO"}}') 
  20. Processor_status=$(awk -v total=`hpasmcli -s 'SHOW SERVER' |grep "Processor:" |wc -l` -v normal=`hpasmcli -s 'SHOW SERVER' |awk '/Status/{if ($NF=="Ok") count+=1}END{print count}'` 'BEGIN{if(total==normal) {print "OK"} else {print "NO"}}') 
  21. Power_temp_num=$(hpasmcli -s 'SHOW TEMP' |awk '/POWER_SUPPLY_BAY/{print $3}'|awk -F"C" '{print $1}'|awk 'BEGIN {max = 0} {if ($1>max) max=$1 fi} END {print max}') 
  22. Ambient_temp_num=$(hpasmcli -s 'SHOW TEMP' |awk '/AMBIENT/{print $3}'|awk -F"C" '{print $1}') 
  23. Cpu_temp_num=$(hpasmcli -s 'SHOW TEMP' |awk '/CPU/{print $3}'|awk -F"C" '{print $1}' |awk 'BEGIN {max = 0} {if ($1>max) max=$1 fi} END {print max}') 
  24. Memory_temp_num=$(hpasmcli -s 'SHOW TEMP' |awk '/MEMORY_BD/{print $3}'|awk -F"C" '{print $1}' |awk 'BEGIN {max = 0} {if ($1>max) max=$1 fi} END {print max}') 
  25. System_temp_num=$(hpasmcli -s 'SHOW TEMP' |awk '/SYSTEM_BD/{print $3}'|awk -F"C" '{print $1}' |awk 'BEGIN {max = 0} {if ($1>max) max=$1 fi} END {print max}') 
  26. Processor_temp_num=$(hpasmcli -s 'SHOW TEMP' |awk '/PROCESSOR_ZONE/{print $3}'|awk -F"C" '{print $1}' |awk 'BEGIN {max = 0} {if ($1>max) max=$1 fi} END {print max}') 
  27. echo $HOSTNAME hp_smart_array.cache_status $Cache_status >${log_file} 
  28. echo $HOSTNAME hp_smart_array.controller_status $Controller_status >>${log_file} 
  29. echo $HOSTNAME hp_smart_array.battery_capacitor_status $Battery_capacitor_status >>${log_file} 
  30. echo $HOSTNAME hp_hardware.hpysicaldrive_status $Physicaldrive_status >>${log_file} 
  31. echo $HOSTNAME hp_hardware.memory_status  $Memory_status >>${log_file} 
  32. echo $HOSTNAME hp_hardware.fans_status  $Fans_status >>${log_file} 
  33. echo $HOSTNAME hp_hardware.power_status  $Power_status >>${log_file} 
  34. echo $HOSTNAME hp_hardware.processor_status  $Processor_status >>${log_file} 
  35. echo $HOSTNAME hp_power.temp_num $Power_temp_num >> ${log_file} 
  36. echo $HOSTNAME hp_ambient.temp_num $Ambient_temp_num >> ${log_file} 
  37. echo $HOSTNAME hp_cpu.temp_num $Cpu_temp_num >> ${log_file} 
  38. echo $HOSTNAME hp_memory.temp_num $Memory_temp_num >> ${log_file} 
  39. echo $HOSTNAME hp_system.temp_num $System_temp_num >> ${log_file} 
  40. echo $HOSTNAME hp_processor.temp_num $Processor_temp_num >> ${log_file} 
  41. $zabbix_sender -z $zabbix_server -i ${log_file} > /tmp/zabbix.temp 

最后只需開啟crontab,5分鐘運行一次。

 

  1. [root@monitor~]echo "*/5 * * * * /etc/zabbix/scripts/hpacuclizabbix.sh"  >>  /var/spool/cron/root 

 

查看zabbix監控HP服務器硬件KEY的定義,數據的收集都是通過trapper的方式收集的。

wKiom1N3epvzdPRFAAVmeaGLRi4862.jpg

查看zabbix監控HP服務器硬件triggers定義,其中nodata(600)這個trigger是為了防止被監控端數據采集出問題而設置的,比如crontab不正常,腳本被誤刪除等等。如果server10分鐘之內收集不到被監控端的數據就會報警。

wKiom1N3gCiiEhgTAAZuwPbEbdQ699.jpg

在zabbix server lastdata查看zabbix server 通過trapper收到的數據。

wKiom1N3fLSAbxImAAN5ZKZqGV8998.jpg

查看被監控端服務器各部件溫度信息。

wKioL1N4DgWjWTSJAAVhVvMUuNE117.jpg

當被監控端出問題時Zabbix會及時報警。

wKiom1N3fmWjBHbhAAEj-BDN1PA998.jpg

說明:Zabbix監控HP服務器硬件操作方法:

  1)在HP服務器上面安裝hpacucli和hpasmcli管理工具。

  2)修改hpacuclizabbix.sh腳本的zabbix_server ip地址,指定為自己的server或者proxy的地址,并把該腳本添加到crontab。

  3)導入附件中的模板,Link到要監控的主機上面即可。

  4)如果有其它問題,歡迎多多交流。

責任編輯:黃丹 來源: 51CTO博客
相關推薦

2014-04-29 13:45:44

Zabbix服務器硬件監控

2014-12-29 12:27:43

ZabbixSNMP

2020-10-09 07:00:00

無服務器應用監控架構

2020-06-07 11:54:34

Linux服務器命令

2019-06-13 17:15:30

監控Linux服務器

2011-08-09 14:27:16

WindowsServ服務器ADDS

2011-03-23 15:13:08

Nagios監控oracle

2011-08-22 12:25:08

nagios

2011-03-29 15:30:20

Zabbix服務器

2009-09-17 13:42:48

WSUS服務器

2010-09-07 14:31:37

服務器升級硬件篇

2010-09-07 09:27:00

服務器升級硬件篇CPU

2010-09-08 15:10:15

服務器升級硬件篇

2018-09-03 09:22:25

監控服務器性能

2015-04-07 09:04:23

Monit服務器監控系統

2013-01-14 11:34:49

IBMdW

2013-09-23 10:05:40

2011-08-09 14:27:49

服務器DCADDS

2020-06-07 16:32:37

服務器數據中心技術

2011-03-23 10:17:26

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 在线久草| 成人在线精品 | 一级免费在线视频 | 性色网站 | 精品1区2区3区 | 黄色精品 | 色偷偷噜噜噜亚洲男人 | 成人激情视频免费观看 | 国产色99精品9i | 97人人澡人人爽91综合色 | 99资源 | 精品国产精品国产偷麻豆 | 久久久成人网 | 999久久久 | 91玖玖| 久久久123 | 超碰欧美 | 高清亚洲 | 中文字幕二区 | 国产成人精品一区二区三区四区 | 日日精品 | 福利视频网 | 九九亚洲| 在线观看免费av网站 | 日韩成人精品 | 午夜av电影院 | 国产一级在线 | 精品国产高清一区二区三区 | 91精品www | 精久久 | 日韩av高清在线 | 无码日韩精品一区二区免费 | 免费在线观看av网站 | h视频在线免费看 | 欧美毛片免费观看 | 成人在线观看免费观看 | 网站黄色在线免费观看 | 亚洲在线一区二区 | 99国产精品久久久久 | 国产精品有限公司 | 九九99精品 |