Fair Isaac:謹防虛擬化帶來的下一波問題
原創【51CTO獨家 11月16號外電】在費埃哲(Fair Isaac)這家打出的FICO評分評定許多公司資信狀況的公司,虛擬化技術帶來許多好處的同時,也帶來了一些意想不到的問題。
費埃哲公司將其70%的服務器進行了虛擬化處理,服務器數量因而從5000臺減少至1500臺,減少了資金和電力開支。此外,它過去常派一名系統管理員負責管理30至50臺服務器,而現在一名管理員就能管理150臺服務器。IT副總裁Tom Grahek說:“將來我們能夠把這個數字提高到多達250臺。”Grahek表示,費埃哲在每臺服務器上能夠平均運行30個虛擬機,耗用的可用處理器周期卻只有總周期的一半。他的團隊現在能夠在短短30分鐘內配置好一臺新的Web服務器、數據庫服務器和應用服務器,“這個過程以前需要好幾個星期”,他表示,而停用這些服務器完全一樣快。
問題的一方面恰恰也出在這里。由于容易配置,這“給人造成了一種錯覺,以為虛擬服務器就是免費的。”Grahek說。過去,要不要批準對服務器容量提出的申請由IT部門來決定,因為好幾個星期的準備時間讓IT部門自然有機會來看管。而現在,費埃哲的IT團隊把服務器模板放到目錄中,業務部門的最終用戶可以根據該目錄,自行開始使用服務器容量。IT部門衡量服務器容量的使用情況后,向使用容量的業務部門分攤成本,所以業務部門經理能夠了解成本、誰在使用容量。
Grahek說:“現在你把權力從IT部門交給了”最有能力決定如何分配資源的人。消除了“虛擬服務器是免費”的觀念后,Grahek對服務器虛擬化有了一個新的目標:“我們在力爭實現100%虛擬化。”
《信息周刊》雜志近日對410名企業技術專業人員所作的VMware vSphere 5調查發現,大約51%的公司把一半或一半以上的工作負載進行了虛擬化處理。費埃哲后來明白,但是這也加大了復雜性,不但加大了IT運營方面的復雜性,還加大了與業務經理的相互關系方面的復雜性。
虛擬化在繼續保持發展的勢頭:據《信息周刊》在2011年對396名企業技術專業人員所作的虛擬化管理調查顯示,63%的公司計劃在2012年年底之前將一半或一半以上的服務器進行虛擬化處理。生產系統一度是虛擬化技術的禁區,現在也經常采用虛擬化,以便增強管理靈活性,從而提高可用性、實現負載均衡以滿足峰值要求,以及提供更容易的災難恢復。對數據庫系統進行虛擬化處理仍然很少見,尤其是對事務處理而言,但是一些公司正在大步前進。埃森哲北美基礎架構和整合業務主管Jay Corn說:“對數據庫系統不采用虛擬化是沒有技術理由的。我們已經對甲骨文數據庫服務器成功地進行了虛擬化處理。根本不存在與數據庫虛擬化有關的數據問題。”
但是隨著虛擬化的力度越來越大,它給整個數據中心帶來了變化。一臺主機服務器上運行10至20個虛擬機,會產生很大的輸入/輸出流量。如果那些虛擬機里面運行數據庫,網絡就得滿足許多磁盤調用的要求,另外還有正常的存儲區域網(SAN)數據存儲流量和以太網通信流量。這樣一來,數據中心的下一大瓶頸就有可能暴露出來。過去IT部門受制于處理器周期、甚至內存資源,而現在變成了受制于服務器邊緣、輸入/輸出端口以及鄰近的網絡設備。
Corn說:“高度虛擬化的服務器仍使用遺留的網絡和存儲系統,結果在輸入/輸出方面卡住了。”這意味著,面對比較密集的虛擬機環境,千兆以太網交換設備無力滿足要求;就需要升級到萬兆交換設備。作為一種虛擬化資源,網絡也在拖后腿;網絡可能會繼續拖后腿,除非出現了能夠將網絡當作匯集、可配置資源來處理的新一代交換機,這新一代交換機可能基于OpenFlow協議。
盡管虛擬化技術會帶來復雜性,但是IT主管們決不能采取觀望的態度。沒錯,管理軟件和標準可能會改進,尤其是對跨平臺虛擬化而言,跨平臺虛擬化在今天是個冒險的舉動。但是IT團隊表明了他們現在如何能夠克服技術上和組織上的問題。
#p#
極端虛擬化
Bluelock 是一家總部設在印第安納波利斯的基礎架構即服務提供商,競爭對手包括亞馬遜、微軟和谷歌等業界巨頭。信息技術主管Aaron Branham表示,說到最大限度地提升服務器性能,他公司走在大多數公司的前頭。《信息周刊》的調查發現,55%的公司每個主機運行6至20個虛擬機;而Bluelock通常每個主機運行約100個虛擬機,甚至把136個虛擬機放在一臺四插座48核512 GB內存的惠普DL 585服務器上。Branham表示,該服務器運行良好。
Bluelock的業務需要同時運行好多獨立的工作負載,需求又不可預測。在許多虛擬化架構中,一個虛擬機試圖與另一個虛擬機進行對話,就會通過虛擬機管理程序交換機,將消息向外發送到網絡上,哪怕另一個虛擬機就在同一個物理機器上的附近也是如此。
于是Bluelock與惠普和Xsigo一起構建了自己的架構,而Xsigo公司提供的Xsigo Director是一款專門用于對輸入/輸出進行虛擬化處理的服務器。當流量不需要向外發送到網絡上,比如數據庫調用磁盤、數據存儲流量和虛擬機之間的通信,Director將InfiniBand連接組成一對一對,通過惠普虛擬交換機、而不是通過虛擬機管理程序的軟件交換機,將流量從主機上卸載。
這樣一種架構對于每個主機僅運行五六個虛擬機的環境來說可能大材小用了, 而接受調查的公司中大約五分之一每個主機運行至少21個虛擬機。隨著虛擬機的數量不斷增加,許多公司不得不應對這個復雜問題:數據中心的瓶頸在不斷變化。高度虛擬化的服務器導致了更頻繁地使用每一個相關設備,虛擬機管理員就得兼顧各方面。Branham遇到過這種情況:數據中心的某個部分:輸入/輸出、網絡和存儲系統在拖后腿,從而迫使他想方設法提升相應部分的速度。
他說:“我們在舊環境中遇到了瓶頸,iSCSI存儲系統引起了各種各樣的問題。”現在,每臺服務器只使用兩條InfiniBand線纜,外加一條比較小的100Mb管理網絡線纜,而不是像以前那樣用九條線纜將網卡和主機總線適配器與存儲和網絡交換機連接起來。每個虛擬化主機的可用帶寬從500 Mbps增加到了40 Gbps,而且虛擬化輸入/輸出可以根據需要重新配置。
Branham的確擔心一個新問題:要是服務器即將出現運行異常,他公司的冠群Nimsoft監控系統會提醒哪個部件即將出現故障,但是他仍得在災難發生之前,將所有那些虛擬機遷移到另一臺服務器上。他可以在六七分鐘內,通過VMware的vMotion實時遷移功能,將一臺運行100個虛擬機的服務器騰出來——如果是一臺運行136個虛擬機的服務器,這個過程可能需要10分鐘。
隨著許多公司設計出這些更先進的虛擬架構,Branham認為有一項技能越來越重要:精確的容量規劃。這項技能之前不是那么重要,因為許多公司配置過度,認為可用性比效率更重要。
但是公共云提供商和企業數據中心都越來越普遍地使用計量系統,這將使得提供正好適合任務所需要的資源成為必需,而不是非必需。Branham說:“云環境激勵用戶合理減少資源;你需要多少資源,就用多少。”
#p#
98%的虛擬化
將來,不是只有像Bluelock這樣的高產量公共云公司才需要容量規劃技能。隨著大大小小的公司對生產系統進行虛擬化處理,峰值需求會讓新的瓶頸暴露出來。
Raymond DeCrescente就擔心這個問題,他是紐約奧爾巴尼醫學中心旗下首都區整形外科中心(Capital Region Orthopaedics)的首席技術官。DeCrescente的團隊為32名執行醫生提供診所管理和后臺服務。他們需要AllScripts診所管理和AdvantX外科手術中心管理系統隨時可用,這套系統包括幾個SQL Server數據庫。該團隊很快將往一系列必要軟件當中添加電子病歷軟件。
就在一年多前,DeCrescente決定圍繞一個高度虛擬化的數據中心對他的小型IT部門進行重組,希望提高效率,讓他可以在20英里之外的地方建立災難恢復中心。他說服了公司的管理層,對八套SQL Server系統和診所管理系統進行了虛擬化處理。這些系統運行在八塊思科統一計算系統(UCS)刀片和兩臺普通的機架M200服務器上,而這些服務器運行著28個虛擬服務器;最終將運行39個虛擬服務器。購買和實施費用花了200萬美元,包括硬件、支持、VMware虛擬化軟件和災難恢復軟件。
這對這家公司來說是筆大費用,但是由于每塊刀片上有96GB內存和12個至強2.93GHz核心,DeCrescente有非常多的備用容量,他預計在可預見的將來不需要追加資金投入。他的SQL Server數據庫運行順暢,幾乎感覺不到性能有任何下降,而且所有相互關聯的部件:服務器、網絡和存儲系統與之前各自是獨立的物理系統相比,更容易通過vCenter管理控制臺來管理。這種架構讓他的人員有時間來建立那個新的災難恢復中心、測試故障切換能力以及開展其他長期被忽視的項目。
一旦DeCrescente逐步淘汰一套診所管理系統(他將該系統與甲骨文數據庫放在一臺獨立服務器上),他會將首都區整形外科中心環境中98%的系統進行虛擬化處理。將來只會剩下一臺無法從虛擬機里面來運行的傳真服務器不采用虛擬化。
DeCrescente聽到了質疑聲,質疑聲主要來自對生產系統虛擬化持謹慎態度的軟件開發商,而不是來自他公司內部。他說:“我們發現一些開發商非常擔心我們對其產品盡量提高虛擬化力度。”
對大多數公司來說,什么都進行虛擬化處理并不明智。在虛擬化數據中心做到資源與需求動態精確配合仍是個挑戰,這需要IT和業務部門的相關人員加大合作,才能克服這個挑戰。埃森哲的Corn表示,這還需要數據——大概是一年下來的IT運營數據,才能知道某個虛擬機因不同的原因而需要多少內存及其他資源。而這種數據常常不具備,公司應該現在就要考慮評估應該收集哪些信息,才能作出虛擬化方面的下一波決策。
【51CTO.com獨家譯稿,未經授權謝絕轉載!合作媒體轉載請注明原文出處及出處!】
譯文來源: http://www.informationweek.com/news/global-cio/interviews/231901240?ct=1022