用Linux Shell腳本來(lái)監(jiān)控磁盤使用情況并發(fā)送郵件
市場(chǎng)上有很多用來(lái)監(jiān)控 Linux 系統(tǒng)的監(jiān)控工具,當(dāng)系統(tǒng)到達(dá)閥值后它將發(fā)送一封郵件。它監(jiān)控所有的東西例如 CPU 利用率、內(nèi)存利用率、交換空間利用率、磁盤空間利用率等等。然而,它更適合小環(huán)境和大環(huán)境。
想一想如果你只有少量系統(tǒng),那么什么是***的方式來(lái)應(yīng)對(duì)這種情況。
是的,我們想要寫一個(gè) shell 腳本 來(lái)實(shí)現(xiàn)。
在這篇指南中我們打算寫一個(gè) shell 腳本來(lái)監(jiān)控系統(tǒng)的磁盤空間使用率。當(dāng)系統(tǒng)到達(dá)給定的閥值,它將給對(duì)應(yīng)的郵件地址發(fā)送一封郵件。在這篇文章中我們總共添加了四個(gè) shell 腳本,每個(gè)用于不同的目的。之后,我們會(huì)想出其他 shell 腳本來(lái)監(jiān)控 CPU,內(nèi)存和交換空間利用率。
在此之前,我想澄清一件事,根據(jù)我觀察的磁盤空間使用率 shell 腳本使用情況。
大多數(shù)用戶在多篇博客中評(píng)論說(shuō),當(dāng)他們運(yùn)行磁盤空間使用率腳本時(shí)他們獲得了以下錯(cuò)誤。
# sh /opt/script/disk-usage-alert-old.sh
/dev/mapper/vg_2g-lv_root
test-script.sh: line 7: [: /dev/mapper/vg_2g-lv_root: integer expression expected
/ 9.8G
是的,這是對(duì)的。甚至,當(dāng)我***次運(yùn)行這個(gè)腳本的時(shí)候我遇到了相同的問(wèn)題。之后,我發(fā)現(xiàn)了根本原因。
當(dāng)你在基于 RHEL 5 & RHEL 6 的系統(tǒng)上運(yùn)行包含用于磁盤空間警告的 df -h
或 df -H
的 shell 腳本中時(shí),你會(huì)發(fā)現(xiàn)上述錯(cuò)誤信息,因?yàn)檩敵龈袷讲粚?duì),查看下列輸出。
為了解決這個(gè)問(wèn)題,我們需要用 df -Ph
(POSIX 輸出格式),但是默認(rèn)的 df -h
在基于 RHEL 7 的系統(tǒng)上運(yùn)行的很好。
# df -h
Filesystem Size Used Avail Use% Mounted on
/dev/mapper/vg_2g-lv_root
10G 6.7G 3.4G 67% /
tmpfs 7.8G 0 7.8G 0% /dev/shm
/dev/sda1 976M 95M 830M 11% /boot
/dev/mapper/vg_2g-lv_home
5.0G 4.3G 784M 85% /home
/dev/mapper/vg_2g-lv_tmp
4.8G 14M 4.6G 1% /tmp
方法一:Linux Shell 腳本來(lái)監(jiān)控磁盤空間使用率和發(fā)送郵件
你可以使用下列 shell 腳本在 Linux 系統(tǒng)中來(lái)監(jiān)控磁盤空間使用率。
當(dāng)系統(tǒng)到達(dá)給定的閥值限制時(shí),它將發(fā)送一封郵件。在這個(gè)例子中,我們?cè)O(shè)置閥值為 60% 用于測(cè)試目的,你可以改變這個(gè)限制來(lái)符合你的需求。
如果超過(guò)一個(gè)文件系統(tǒng)到達(dá)給定的閥值,它將發(fā)送多封郵件,因?yàn)檫@個(gè)腳本使用了循環(huán)。
同樣,替換你的郵件地址來(lái)獲取這份警告。
# vi /opt/script/disk-usage-alert.sh
#!/bin/sh
df -Ph | grep -vE '^Filesystem|tmpfs|cdrom' | awk '{ print $5,$1 }' | while read output;
do
echo $output
used=$(echo $output | awk '{print $1}' | sed s/%//g)
partition=$(echo $output | awk '{print $2}')
if [ $used -ge 60 ]; then
echo "The partition \"$partition\" on $(hostname) has used $used% at $(date)" | mail -s "Disk Space Alert: $used% Used On $(hostname)" [email protected]
fi
done
輸出:我獲得了下列兩封郵件警告。
The partition "/dev/mapper/vg_2g-lv_home" on 2g.CentOS7 has used 85% at Mon Apr 29 06:16:14 IST 2019
The partition "/dev/mapper/vg_2g-lv_root" on 2g.CentOS7 has used 67% at Mon Apr 29 06:16:14 IST 2019
最終添加了一個(gè) cronjob 來(lái)自動(dòng)完成。它會(huì)每 10 分鐘運(yùn)行一次。
# crontab -e
*/10 * * * * /bin/bash /opt/script/disk-usage-alert.sh
方法二:Linux Shell 腳本來(lái)監(jiān)控磁盤空間使用率和發(fā)送郵件
作為代替,你可以使用下列的 shell 腳本。對(duì)比上面的腳本我們做了少量改變。
# vi /opt/script/disk-usage-alert-1.sh
#!/bin/sh
df -Ph | grep -vE '^Filesystem|tmpfs|cdrom' | awk '{ print $5,$1 }' | while read output;
do
max=60%
echo $output
used=$(echo $output | awk '{print $1}')
partition=$(echo $output | awk '{print $2}')
if [ ${used%?} -ge ${max%?} ]; then
echo "The partition \"$partition\" on $(hostname) has used $used at $(date)" | mail -s "Disk Space Alert: $used Used On $(hostname)" [email protected]
fi
done
輸出:我獲得了下列兩封郵件警告。
The partition "/dev/mapper/vg_2g-lv_home" on 2g.CentOS7 has used 85% at Mon Apr 29 06:16:14 IST 2019
The partition "/dev/mapper/vg_2g-lv_root" on 2g.CentOS7 has used 67% at Mon Apr 29 06:16:14 IST 2019
最終添加了一個(gè) cronjob 來(lái)自動(dòng)完成。它會(huì)每 10 分鐘運(yùn)行一次。
# crontab -e
*/10 * * * * /bin/bash /opt/script/disk-usage-alert-1.sh
方法三:Linux Shell 腳本來(lái)監(jiān)控磁盤空間使用率和發(fā)送郵件
我更喜歡這種方法。因?yàn)椋ぷ髌饋?lái)很有魔力,你只會(huì)收到一封關(guān)于所有事的郵件。
這相當(dāng)簡(jiǎn)單和直接。
*/10 * * * * df -Ph | sed s/%//g | awk '{ if($5 > 60) print $0;}' | mail -s "Disk Space Alert On $(hostname)" [email protected]
輸出: 我獲得了一封關(guān)于所有警告的郵件。
Filesystem Size Used Avail Use Mounted on
/dev/mapper/vg_2g-lv_root 10G 6.7G 3.4G 67 /
/dev/mapper/vg_2g-lv_home 5.0G 4.3G 784M 85 /home
方法四:Linux Shell 腳本來(lái)監(jiān)控某個(gè)分區(qū)的磁盤空間使用情況和發(fā)送郵件
# vi /opt/script/disk-usage-alert-2.sh
#!/bin/bash
used=$(df -Ph | grep '/dev/mapper/vg_2g-lv_dbs' | awk {'print $5'})
max=80%
if [ ${used%?} -ge ${max%?} ]; then
echo "The Mount Point "/DB" on $(hostname) has used $used at $(date)" | mail -s "Disk space alert on $(hostname): $used used" [email protected]
fi
輸出: 我得到了下面的郵件警告。
The partition /dev/mapper/vg_2g-lv_dbs on 2g.CentOS6 has used 82% at Mon Apr 29 06:16:14 IST 2019
最終添加了一個(gè) cronjob 來(lái)自動(dòng)完成這些工作。它將每 10 分鐘運(yùn)行一次。
# crontab -e
*/10 * * * * /bin/bash /opt/script/disk-usage-alert-2.sh
注意: 你將在 10 分鐘后收到一封郵件警告,因?yàn)檫@個(gè)腳本被計(jì)劃為每 10 分鐘運(yùn)行一次(但也不是精確的 10 分鐘,取決于時(shí)間)。
例如這個(gè)例子。如果你的系統(tǒng)在 8:25 到達(dá)了限制,你將在 5 分鐘后收到郵件警告。希望現(xiàn)在講清楚了。