專訪運維與人才外包專家黃琨:運維工作最大的挑戰(zhàn)是什么?
原創(chuàng)【51CTO獨家特稿】運維是一個全面的工作,可以接觸到各種領域的技術和人。運維是一種實操類的技能,其經(jīng)驗積累很大程度上來自于真實項目的積累。因此,對于運維領域的新人而言,如果他們工作的環(huán)境并沒有提供一個良好的平臺,就經(jīng)常容易陷入困惑。
另一方面,那些在大型企業(yè)、外企工作過很長時間的資深運維工程師,他們當中的很多人都愿意分享自己的經(jīng)驗,并為廣大運維工程師們提供一些指點。黃琨就是他們當中的一員。以IT運維外包項目的形式,一方面完成企業(yè)的生產需求,另一方面提供給缺乏經(jīng)驗的運維們一些鍛煉的機會,正是黃琨與他的朋友們建立榮新IT培訓中心的目的。
今天,我們邀請到了黃琨老師到場,談談他自己的運維成長經(jīng)歷及挑戰(zhàn)。
嘉賓簡介:
黃琨,曾任知名外企SP公司運維經(jīng)理,多年網(wǎng)絡應用架構設計及運維管理經(jīng)驗。涉及技術包括:Linux/SUN小型機/Windows運維、互聯(lián)網(wǎng)應用平臺架構設計、Oracle/Mysql數(shù)據(jù)庫、開源分布式集群架構設計及調優(yōu)、網(wǎng)絡及安全設備架構及管理。現(xiàn)在任職于榮新IT培訓中心,擔任IT運維外包項目總監(jiān)、企業(yè)人才外包項目總監(jiān)。
51CTO:您是什么時候開始做的運維?對工作一開始的幾年有哪些深刻的記憶?
黃琨:我2002年之前的時候主要是從事系統(tǒng)集成項目的設計實施工作,之后進入石景山區(qū)信息中心負責全區(qū)各行政單位的網(wǎng)絡、中心IDC的維護工作。那個時候的工作有苦有樂,最重要的是能夠學到知識,有一個好的平臺對我來說非常重要。當時正處于互聯(lián)網(wǎng)業(yè)務發(fā)展的初期有些企業(yè)的業(yè)務平臺也陸續(xù)在中心IDC上線,為我的技術學習提供了良好的氛圍和實驗條件。
記憶最深刻的就是有一次中心機房要從教委遷移到區(qū)政府信息中心,那次遷移工作量相當大,包括:網(wǎng)絡設備、服務器、新老應用割接、新設備上線、對網(wǎng)絡和應用層做了鏈路冗余以及高可用等,讓我有機會一次性的把之前做過的實驗用到了真實的工作中。這次工作廠商方面以及中心骨干工程師都給予我大力支持,讓我深為感動。當時網(wǎng)絡設備用的是CISCO的6500系列兩臺做的冗余,匯聚層和接入層也都是cisco的產品35系列和25系列;服務器400臺左右,安全方面有天融信的防火墻、還有NIDS;規(guī)模大任務重,中心系統(tǒng)組負責人也是現(xiàn)在我的好朋友張琦老師對我的幫助非常大,從原中心業(yè)務系統(tǒng)整體梳理、備份、鏈路及服務割接工作的計劃設計、各別服務系統(tǒng)更新、重要服務應用高可用的設計、雙因素認證系統(tǒng)等等工作幫助我整理的井井有條,工作非常順利,當時還獲得中心同事的表揚,至今記憶猶新。
51CTO:能介紹一下您現(xiàn)在的工作情況么?您的職責包括哪些方面?
黃琨:現(xiàn)在和白璐、楊晨等開源和網(wǎng)絡方面的精英一起開辦了一家專門培養(yǎng)運維人才的培訓機構——榮新IT培訓中心,經(jīng)過這幾年的努力,培訓中心的規(guī)模已經(jīng)擴大了5倍。
我現(xiàn)在任CTO的職位,一方面負責企業(yè)項目及運維外包服務的工作,為企業(yè)提供優(yōu)良的技術服務之外將前沿技術引入到培訓中來;另一方面負責培訓學員到企事業(yè)單位的人才輸送工作。
51CTO:能否大致的描述一下您每天的工作內容?
黃琨:本人現(xiàn)在主要負責:
- IT運維外包項目計劃、項目方案設計監(jiān)督、估算、管理、跟蹤項目進度;
- 企業(yè)人才輸送,組織技術指導,收集問題回饋,協(xié)助教學部形成教材;
- Linux等相關運維人才市場的動向監(jiān)控。
運維一線現(xiàn)在已有600以上榮新學員,我也描述一下他們剛入行時候的工作內容吧:
- 快速分析整理公司業(yè)務及平臺設計邏輯架構,緩存、應用、數(shù)據(jù)庫、網(wǎng)絡設備及其他設備的運作原理;
- 平臺各層面監(jiān)控,避免監(jiān)控死角,實時了解平臺各層應用的運轉情況;處理突發(fā)問題,迅速做出問題響應,做好問題處理分析報告為后續(xù)自動化運維設計作補充;
- 平臺代碼更新,根據(jù)平臺規(guī)模設計部署更新源資源下載服務、補丁批量更新機制;
- 配合運維經(jīng)理設計實現(xiàn)運維支撐系統(tǒng),包括系統(tǒng)監(jiān)控、報警、管理功能;實現(xiàn)數(shù)據(jù)圖形報表、整合手機短信、郵件、聲音報警功能,根據(jù)監(jiān)控排障反映上來的問題不斷完善自動化運維機制;
- 配合運維經(jīng)理對平臺架構進行分析,不斷提升整體應用的可靠性與健壯性、提高性能及安全性;
51CTO:您覺得您目前的運維生涯當中最大的挑戰(zhàn)是什么?
黃琨:運維這個工作所涉及的內容多,工作范圍又處于企業(yè)生產平臺,任務重壓力很大。
本人認為挑戰(zhàn)主要分為技術和溝通兩方面,當然由于我現(xiàn)在從事培訓和運維外包工作,所以另一個轉型的挑戰(zhàn):
1、技術方面的挑戰(zhàn)是運維工作的職責體現(xiàn)出來的,簡單的說產品從需求收集、開發(fā)及網(wǎng)絡系統(tǒng)架構設計、開發(fā)測試階段、產品上線聯(lián)調、問題反饋、正式商用后運維階段等等,因篇幅有限我無法說得太詳細,這些工作運維都需要跟下來。前幾項工作中如果沒有搞清楚產品的技術細節(jié)(比如:軟/硬件資源評估確定硬件采購需求、平臺性能的評估、服務性能調優(yōu)安全加固、根據(jù)應用對服務器系統(tǒng)層的優(yōu)化等等),將直接影響最后運維工作的正常開展。
從我看來,由于生產平臺是企業(yè)的命脈所以運維工作上沒有最大的挑戰(zhàn)只有不斷地挑戰(zhàn),例如平臺上線后如果出現(xiàn)了瓶頸問題那么就需要快速鎖定問題排查瓶頸,在最快的時間解決,尤其對于做互聯(lián)網(wǎng)應用的企業(yè),用戶體驗最重要,三天兩頭出問題,用戶就會流失,企業(yè)利益就會受損。
2、溝通方面的挑戰(zhàn)。一個合格的運維工程師不但工作要做好,與本職工作職責在一條鏈上的部門同事之間的溝通也至關重要,直接制約工作的效率與結果。比如平臺運行中遭遇問題,經(jīng)過排查也鎖定了,但是之前與同事溝通不暢造成問題解決滯后,這個影響很大。
當然很多企業(yè)非常重視產品上線后的問題響應,從人力上設定了績效,從技術上利用內部工單來配合解決,效果也是非常顯著。不過制度始終是需要去遵守的,是死的,工作的人是活的,所以人與人之間的有效溝通也是非常重要的一項必修課,這對于運維工作人員來說是挑戰(zhàn),處理不好經(jīng)常出現(xiàn)由于部門間工作性質不同帶來的信息孤島和溝通鴻溝。
3、最后一點,我希望將“Linux高效運維”這項本領和更多的人分享,如何把最難理解的知識通過最平凡易懂的方式教授給學生,這才是當前工作的重中之重。
51CTO:您現(xiàn)在關注哪些技術領域?
黃琨:就運維所關注的技術領域來說,我只想用一句“多而雜”來形容。因為運維是保證企業(yè)業(yè)務平臺穩(wěn)定運行的基石。從開發(fā),測試,整個平臺架構中的緩存、應用、中間件、數(shù)據(jù)庫、網(wǎng)絡方面數(shù)據(jù)傳輸效率、平臺監(jiān)控報警、硬件層面等等方面都需要了解并且深入。
根據(jù)我現(xiàn)在的工作性質,要不斷關注最新的技術,最重要的就是如何能夠提高運維團隊的工作效率以及組織學習興趣小組總結運維工作中的技術難點,達到不斷提高的目的,畢竟運維技術更新很快但是學習資源相對比開發(fā)來說是有差距的。
另外,我們已經(jīng)成立的的、定期的Linux運維工程師沙龍活動,最近連續(xù)3期都是CDN網(wǎng)絡加速的內容,以一個視頻網(wǎng)站為原型進行細致的運維探討。這里也希望51CTO的網(wǎng)友有空和我們一起來將沙龍的范圍擴大。
51CTO:能否大致談談您對于未來三年的個人發(fā)展計劃?
黃琨:其實技術和業(yè)務是分不開的,關注互聯(lián)網(wǎng)行業(yè)/3G融合之后殺手級業(yè)務相關技術是我的主攻目標,并且在這個范圍內提高自己的技術,能夠為未來的發(fā)展提供一個很好的路線引導。
未來3年我將繼續(xù)做好Linux及其相關的開源運維培訓工作,在IT培訓領域做出一番成績。
【編輯推薦】