如今這服務(wù)器都成精了?
這天早晨,我?guī)鹤釉诠珗@里溜達(dá),迎著冬日朝陽(yáng)沐浴在晨輝下,感覺(jué)身心美滋滋。
正閉眼享受愜意時(shí)光的當(dāng)下,口袋突然震了起來(lái)。
7點(diǎn)剛過(guò)誰(shuí)打我電話(huà)?這日子還能不能過(guò)了?
拿起手機(jī)一看,咦~某游戲公司的運(yùn)維經(jīng)理王總?那么早找我干嘛?出于專(zhuān)(qiong)業(yè)(bi)的職業(yè)素養(yǎng)和精神,接了再說(shuō)!客戶(hù)滿(mǎn)意度***!
我: 喂,早呀!王總, 那么早就起來(lái)啦? 早飯吃了么?
王:沒(méi)吃!吃不下!你上午有空來(lái)次我們公司么?有些事情我要了解下!
我:啊!? 關(guān)于什么事情?需要我準(zhǔn)備什么資料么?
王:就兩個(gè)月前我們買(mǎi)的200多臺(tái)服務(wù)器的事情! 不用準(zhǔn)備,你來(lái)就可以了!
我:啊啊?? 怎么了?出故障了么?
嘟嘟嘟…….
撂下電話(huà),我火速抓住撒歡的兒子一路狂奔到家,背上雙肩包,坐上地鐵殺向客戶(hù)公司……
見(jiàn)面后我開(kāi)門(mén)見(jiàn)山:那200多臺(tái)服務(wù)器不是你們另一個(gè)項(xiàng)目組A的么?
王總:這半年來(lái)我們項(xiàng)目組的在線(xiàn)玩家數(shù)量和收入增長(zhǎng)都不錯(cuò),而且接下來(lái)會(huì)上新版本,所以我們就和采購(gòu)提了200臺(tái)擴(kuò)容需求。 而暑假期間項(xiàng)目組A的游戲流量只有預(yù)期的一半,于是大老板就把兩個(gè)月前買(mǎi)的那260臺(tái)服務(wù)器轉(zhuǎn)給我們了。
我:這不挺好的么?這樣一來(lái)你們項(xiàng)目組差不多有800臺(tái)服務(wù)器了吧?
王總:問(wèn)題是這260臺(tái)服務(wù)器目前的BIOS&RAID配置和預(yù)裝的系統(tǒng)是按照A項(xiàng)目組的要求做的,和我們要求不一樣啊。你也知道我們組算上我才3個(gè)人。以往需求都是你們出廠預(yù)設(shè)好,我上架就能用的,現(xiàn)在怎么辦?總監(jiān)要求3天內(nèi)就上線(xiàn)。你有啥辦法不? 愁死我了……
我:……就這事啊?(我還差點(diǎn)就坐火箭來(lái)了!)對(duì)戴爾易安信服務(wù)器來(lái)說(shuō),這都不叫事好嗎 !
對(duì)戴爾易安信服務(wù)器全生命周期管理來(lái)說(shuō),批量重新配置及部署是默認(rèn)的標(biāo)準(zhǔn)功能~
首先我來(lái)介紹批量部署及監(jiān)控的神器—— OME(OpenManage Essentials)
OpenManage Essentials 是戴爾營(yíng)銷(xiāo)硬件管理應(yīng)用程序,能夠?qū)ζ髽I(yè)網(wǎng)絡(luò)中的系統(tǒng)、設(shè)備和組件提供全面的監(jiān)控、部署及資源清冊(cè)。用戶(hù)可在設(shè)置并允許的網(wǎng)段內(nèi),通過(guò)SNMP協(xié)議管理及監(jiān)控最多可達(dá)8000臺(tái)服務(wù)器,前面王總說(shuō)的260臺(tái)服務(wù)器重新配置,完全可以靠OME實(shí)現(xiàn)。
在OME的部署門(mén)戶(hù)頁(yè)面,用戶(hù)可以執(zhí)行初始服務(wù)器及操作系統(tǒng)部署。通過(guò)該門(mén)戶(hù)用戶(hù)創(chuàng)建服務(wù)器配置模板,針對(duì)服務(wù)器有iDRAC、BIOS、RAID 和 NIC 的設(shè)置,以及針對(duì)刀片機(jī)箱有CMC 的設(shè)置。這些配置模板隨后可以部署到多個(gè)服務(wù)器或機(jī)箱以進(jìn)行初始配置,然后再?gòu)念A(yù)定義的可引導(dǎo) ISO 映像啟動(dòng)操作系統(tǒng)部署流程。通過(guò)設(shè)定多個(gè)模板,用戶(hù)可快速切換現(xiàn)有服務(wù)器的設(shè)置,極大地簡(jiǎn)化了日常運(yùn)維工作。
關(guān)鍵這個(gè)軟件是免費(fèi)的!!!
王總:哇塞!這么好的東西你怎么現(xiàn)在才告訴我,這個(gè)還能監(jiān)控和預(yù)警?我不用派人天天去機(jī)房巡檢了?
我: SNMP、WMI、WS-MAN可管理并監(jiān)控服務(wù)器、交換機(jī)、超融合存儲(chǔ)、防火墻等設(shè)備,具體內(nèi)容請(qǐng)看OME界面。
▲上圖,即為OME的操作界面,主要分為4個(gè)模塊:
○ 模塊1是頂部導(dǎo)航欄,模塊2為菜單欄和搜索框;
○ 主要看模塊3,這里是控制臺(tái)區(qū)域,清晰地顯示了設(shè)備狀態(tài)及報(bào)警餅圖,界面右側(cè)排列了一系列報(bào)警日志,對(duì)應(yīng)的時(shí)間、報(bào)警級(jí)別、設(shè)備IP地址一目了然;
○ 模塊4顯示了具體的報(bào)警內(nèi)容。
如果向OME管理服務(wù)器開(kāi)放外網(wǎng)訪問(wèn)戴爾易安信官方源的話(huà),OME還可提供對(duì)服務(wù)器的BIOS、固件、驅(qū)動(dòng)的更新,并在***時(shí)間通知用戶(hù)高優(yōu)先級(jí)補(bǔ)丁的更新情況。
另外,OME還可以幫助用戶(hù)盤(pán)點(diǎn)資產(chǎn)并生成資源清冊(cè)報(bào)告哦!
王總:資產(chǎn)報(bào)告?OME統(tǒng)計(jì)地全面和準(zhǔn)確么?我們現(xiàn)在是用表格手動(dòng)做資產(chǎn)管理系統(tǒng),經(jīng)常出錯(cuò)。報(bào)修換了主板或者網(wǎng)卡后,表格里的mac地址也經(jīng)常不準(zhǔn)。
我: OME做服務(wù)器資產(chǎn)盤(pán)點(diǎn)的效果可是杠杠的!它能對(duì)所有受管設(shè)備生成非常全面及詳盡的資源清冊(cè)報(bào)告,如下就是對(duì)于所有設(shè)備的NIC信息做出的統(tǒng)計(jì),其中IP、MAC、Vendor信息都清晰可見(jiàn)。
此外,清冊(cè)報(bào)告里還包括如下內(nèi)容▼:
服務(wù)器資源清冊(cè)類(lèi)別 |
說(shuō)明 |
服務(wù)器概覽 |
提供關(guān)于服務(wù)器的信息,例如:系統(tǒng)名稱(chēng)、服務(wù)器上安裝的操作系統(tǒng)、處理器和內(nèi)存 |
硬盤(pán)驅(qū)動(dòng)器信息 |
確定硬盤(pán)驅(qū)動(dòng)器的序列號(hào)、修訂版、制造商、總線(xiàn)類(lèi)型和自加密功能。 |
內(nèi)存信息 |
提供有關(guān)DIMM 的詳情,并確定特定 DIMM 在服務(wù)器中占用的插槽。 |
PCI 設(shè)備信息 |
確定每臺(tái)服務(wù)器中的型號(hào)、制造商 以及PCI 和PCIe 控制器的插槽。 |
存儲(chǔ)控制器信息 |
確定服務(wù)器上的存儲(chǔ)控制器,并提供控制器名稱(chēng)、供應(yīng)商、控制器類(lèi)型和控制器狀態(tài)。 |
虛擬磁盤(pán)信息 |
提供有關(guān)虛擬磁盤(pán)的信息,如大小、布局,條帶大小等等。 |
服務(wù)器組件和版本 |
標(biāo)識(shí)所有查找到的和進(jìn)行資源清冊(cè)的服務(wù)器上的BIOS、驅(qū)動(dòng)程序和固件版本 |
設(shè)備配置合規(guī)性 |
向關(guān)聯(lián)的設(shè)備配置模板提供與服務(wù)器或機(jī)箱的合規(guī)性有關(guān)的信息 |
我:利用這些OME功能,就算你們團(tuán)隊(duì)只有3人,管理好800多臺(tái)服務(wù)器也不在話(huà)下!
王總: OME的監(jiān)控、管理和部署確實(shí)非常不錯(cuò)!不過(guò)每次保修還是很麻煩,要聽(tīng)很久電腦語(yǔ)音,還要抓日志!
不過(guò)剛才我聽(tīng)你說(shuō)服務(wù)器能主動(dòng)報(bào)修,還能主動(dòng)換備件?難道服務(wù)器成精了嗎?如果這樣,那我們就省力了。哈哈~
我:哈哈,服務(wù)器當(dāng)然不會(huì)成精。主動(dòng)式報(bào)修和更換部件是通過(guò)SA實(shí)現(xiàn)的。
SA全稱(chēng)SupportAssist Enterprise,是一款可自動(dòng)為 Dell 服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)設(shè)備提供技術(shù)支持的軟件程序。在設(shè)置 SA 并正確配置待監(jiān)測(cè)設(shè)備后,任何受監(jiān)測(cè)設(shè)備發(fā)生硬件事件,SA便會(huì)收到警報(bào),并通過(guò)使用各種策略對(duì)收到的警報(bào)進(jìn)行篩選,以確定警報(bào)是否符合報(bào)修條件。符合報(bào)修條件的警報(bào)被安全地發(fā)送給 SA 服務(wù)器,創(chuàng)建或更新報(bào)修案例后,售后部門(mén)使用報(bào)警信息對(duì)問(wèn)題進(jìn)行故障排除,并提供適當(dāng)?shù)慕鉀Q方案。具體可參考下表▼:
SA 功能 |
說(shuō)明 |
主動(dòng)檢測(cè)硬件故障 |
SA 接收受監(jiān)測(cè)設(shè)備中發(fā)生的硬件事件的警報(bào),并主動(dòng)確定警報(bào)是否表明發(fā)生了硬件故障 |
預(yù)測(cè)性檢測(cè)硬件故障 |
對(duì)從受監(jiān)測(cè)設(shè)備收集的系統(tǒng)信息進(jìn)行智能分析,從而預(yù)測(cè)將來(lái)可能發(fā)生的硬件故障 |
自動(dòng)收集系統(tǒng)信息 |
自動(dòng)從設(shè)備收集對(duì)問(wèn)題進(jìn)行故障排除所需的系統(tǒng)信息,并將其安全地發(fā)送至戴爾 |
自動(dòng)創(chuàng)建支持案例 |
在主動(dòng)檢測(cè)到或預(yù)測(cè)性檢測(cè)到硬件故障時(shí),系統(tǒng)自動(dòng)向技術(shù)支持部門(mén)創(chuàng)建服務(wù)請(qǐng)求 |
自動(dòng)電子郵件通知 |
將關(guān)于支持案例或問(wèn)題的電子郵件通知自動(dòng)發(fā)送到貴公司的主要和第二 SA聯(lián)系人 |
主動(dòng)部件派發(fā) |
如需要更換部件才能解決問(wèn)題,SA中配置的派送***項(xiàng)向您派發(fā)更換部件 |
技術(shù)支持部門(mén)主動(dòng)回應(yīng) |
技術(shù)支持代理將就該支持案例主動(dòng)與您聯(lián)系,并幫助您解決此問(wèn)題 |
部分地區(qū)故障發(fā)生后4小時(shí),我們的售后工程師就可以帶著備件上門(mén)更換了。上次在一個(gè)部署了OME+SA的客戶(hù)那里,我們的售后工程師都帶著備件上門(mén)了,他的機(jī)房駐場(chǎng)工程師才發(fā)現(xiàn)原來(lái)一臺(tái)服務(wù)器的硬盤(pán)壞了一塊。
由此,SA的專(zhuān)業(yè)性可窺一斑。
綜上,OME+SA雙劍合璧,可打造一個(gè)集部署、故障監(jiān)控、資產(chǎn)清冊(cè)、自動(dòng)報(bào)障、自動(dòng)維修為一體的自動(dòng)化運(yùn)維平臺(tái),保障您運(yùn)維無(wú)憂(yōu)!