不學谷歌 浪潮建設公有云的四個新思維
【IT168 評論】談到云計算領域里的公有云,大家往往會先想到谷歌、亞馬遜等,國內也有一些企業在向它們學習,構建類似的云計算服務平臺。然而,谷歌的模式是唯一的方法嗎?是否還存在另外一條甚至多條建設公有云的道路?
日前,浪潮在其云計算戰略發布會上[專題],提出了建設中國公有云的新思路:首次定義“行業云”,并認為行業云將是未來我國云計算的主要形態,區別于谷歌為代表的公眾云模式。浪潮還詳細分析了行業云數據中心對包括服務器、存儲、系統軟件在內的軟硬件基礎架構的需求挑戰,提出了用大服務器和海量存儲打造云計算硬件核心,構建新型云計算中心操作系統等具體對策。
新思維1:行業云是公有云發展的新形式
對云計算模式的劃分,一般可分為公有云、私有云和混合云。業界關于哪一種模式最有商業前景的爭論也是此起彼伏,非常激烈[參見:誰將勝出?私有云與公有云激辯十回合]。
此次浪潮提出“行業云”概念,可謂幫公有云陣營增添了一個砝碼,也引發業界對于云計算發展前景的新一輪思考。
根據浪潮的定義,所謂“行業云”,是由行業內或某個區域內起主導作用或者掌握關鍵資源的組織建立和維護,以公開或者半公開的方式,向行業內部或相關組織和公眾提供有償或無償服務的云平臺,因此,行業云也是一種公有云,但區別于谷歌、亞馬遜那樣的“公眾云”。
▲浪潮集團高級副總裁王恩東在解釋“行業云”
其實,在筆者看來,這類行業云的雛形已經在市場上出現,比如北京市計算中心正在搭建的“北京云”,主要是為北京地區的企業提供包括設計、模擬在內的高性能計算服務;IBM在無錫軟件園搭建的軟件測試云,幫助園區內軟件企業快速搭起測試環境,加快軟件開發速度??梢?,這些模式既不是類似谷歌、亞馬遜那樣面向全世界人民開放的公眾云,也不是某個企業內部的私有云,而是由某個行業或區域性組織建立的為有限用戶或普通公眾提供服務的平臺。
浪潮此番還給出了行業云與公眾云的具體區別。浪潮認為,按照數據獲取路徑和數據是否具有私密性,公有云可以繼續細分為公眾云和行業云,前者是數據來源和服務對象都是公開的公眾,例如Google,而后者數據具有私密性,但是服務對象卻是公開的,如環境衛星資源數據中心、政務系統、經濟/人口統計數據服務等。從服務對象的數量來看,行業云也是介于公眾云和私有云之間。企業私有云服務的規模為幾千人、幾萬人,象Google這樣的公眾云服務幾十億人,而行業云服務對象的規模介于兩者之間,可能是某省市關心該行業、該領域的幾十萬人、幾百萬人,也可能是全國關心某行業、某領域的幾千萬甚至上億人。
談到建設行業云的必要性,浪潮集團高級副總裁王恩東告訴IT168記者,“當前行業信息化還是以內部服務為主,只是解決辦公效率的問題,而對社會、對大眾提供的信息服務幾乎是空白,核心的有價值的數據大部分掌握在各個行業、各個垂直的部門中,把這些數據進行挖掘、及時提供服務是行業信息化的必然趨勢。因此,行業云將逐步成為云計算的主要形態。”
他指出,建設行業云的主導單位是各地政府機構或行業、區域性組織,如某省市的衛生局聯合下屬醫療機構合建“醫療云”,某省市交通局聯合公交公司、運輸公司等合建“交通云”,進而為公眾提供數據服務。
新思維2:行業云將推動數據服務應用大發展
如果說亞馬遜提供的是計算和存儲資源服務,微軟Windows Azure提供的是軟件開發和部署服務,用友偉庫網等SaaS廠商提供的是在線應用軟件服務,那么,浪潮所倡導的“行業云”將主要提供什么樣的服務呢?
對此,浪潮系統軟件總監兼云計算產品研發部總經理張東談到,建設行業云最關鍵的問題是如何將數據活化,將數據轉化為服務。“雖然各個行業過去十幾年里也建設了很多信息化系統,但這些系統都是封閉的,行業云的功能就在于實現從數據到服務的轉化。”
▲浪潮系統軟件總監兼云計算產品研發部總經理張東
他舉了這樣幾個例子,比如,在環境監控中,通過衛星遙感收集到的水、森林、土地等相在的海量數據,經過分析處理,可以得出土地利用率、自然災害預警等信息,進而提供給政府部門決策使用。在數字化醫療中,病人所有的健康信息都存在一張卡中,只要刷一下,以往的病歷、體檢記錄、在不同醫院的檢查結果都可以呈現在醫生的電腦中,從而幫助醫生做出更全面的診斷。又比如在食品衛生監控中,如果在食品生產、加工、運輸、銷售過程中各個環節的數據都公開、透明,食品安全就可以得到很大的保障。此外,像交通、遠程教育、工商、稅務、質監等行業,其公眾服務都可以通過云計算來實現,進而對國家決策、政府運作、行業監管、企業發展等都具有重要意義。
其實,筆者也注意到,谷歌一直在拓展自己的云服務范疇,除了大家熟知的搜索服務、Google App Engine等之外,它也在開始提供針對某行業或區域的數據分析服務。比如,谷歌的公共數據管理器(Public Data Explorer),它可以讓海量的數據表變得可視化、更加生動和易于溝通使用。目前谷歌所使用的數據庫來自多個途徑,包括世界銀行、美國經濟分析統計局、歐盟統計局、澳大利亞統計局、美國勞工統計局、美國人口統計局、能源信息管理局、加州教育局等。下面我們舉兩個例子來看一下:
比如,下面這個Flash動畫呈現了1969年-2007年美國加州數十個縣市人均收入的變化情況。從中可見,1969年,這些縣市之間的人均收入差距并不大,最高的加州Marin 郡是人均收入5811美元,最低的Yuba縣是3139美元,前者是后者的1.85倍,但近四十年之后,加州Marin郡人均收入仍然最高,達到91483美元,而最低是Kings縣,為23418美元,前者是后者的3.9倍。這一動畫讓幾十個縣市在過去幾十年間的人均收入變化非常清晰地呈現了出來,如果再配以其他經濟指標,這無疑對于政府決策和經濟形勢研判會帶來非常大的便利。
又比如,下面這個動畫通過對來自世界銀行的數據進行分析,展現了是世界不同地區在1960年-2008年間人口總量、每個女人所生嬰兒數量及人的平均壽命的變化情況。
如果你有興趣了解其他統計結果,如歐洲消費物價指數、世界發展指數、歐洲最低工資、歐洲政府債務、美國GDP和個人收入、美國零售收入、美國人口、美國性病傳播、美國人口死亡率、美國癌癥案例、美國溫室氣體排放、天然氣價格等信息,還可以訪問谷歌公共數據管理器直接點擊查看:http://www.google.com/publicdata/directory
對比分析來看,筆者認為,浪潮所描繪的“行業云”要提供的數據挖掘和分析服務,與目前的谷歌公共數據管理器有很大的類似之處。不同的是,前者所用的數據是有一定私密性的,不象公眾云那樣是大家可以隨便公開分享,一般不能輕易獲得,如醫療信息掌握在醫院手中,食品安全信息掌握在質監部門手中,而后者所用的數據是廣泛公開的,前者服務的對象可能更有針對性,可能會收費,后者面向的是普通公眾,完全免費。
張東也指出,“對行業云而言,數據未來就是第一生產力,誰掌握了數據,誰就可以推動整個行業的發展。”他還談到,要讓這些行業數據變成信息,并轉化成服務提供出去,用類似谷歌的公眾云模式是不完全可行的,比如谷歌雖然也在試圖做一些針對關鍵數據的服務,但實際上遭到了各國政府的反對。新思維3:云計算不是服務器農場,大服務器是核心
云計算的發展離不開數據中心基礎架構的支撐,行業云也不例外。
不過,浪潮認為,不同于谷歌、亞馬遜等公眾云服務供應商大量使用低端服務器來構建“服務器農場”的做法,在行業云數據中心里,雖然通用平臺仍會大規模使用低成本的高密度服務器,但核心卻是8路以上的“大服務器”。
▲一臺谷歌定制的服務器
早在今年6月份,浪潮集團高級副總裁王恩東就曾撰文指出,云計算后臺用海量的低端服務器做計算中心,其實是無奈之舉,也不適合所有的云計算應用。
從計算技術上看,“服務器農場”只適合分布式計算,比如谷歌,它提供的是搜索、新聞等類型的服務,這些服務依賴的都是一些分散數據,沒什么關聯性,可以分布到多個地點和設備上進行存儲,計算也可以拆分成多個任務由上千臺的低端服務器一起完成。但是在未來,面向一些關聯性很強的數據和運算,例如OLTP業務(聯機事務處理),才是更為廣泛的商業計算模式,而分布式技術受制于數據同步問題,在這種應用上就很困難。比如銀行的業務系統,其業務數據是強耦合的關系型數據,必須建立統一的數據庫系統,這也是為什么銀行一直是大服務器的忠實客戶。未來將會有越來越多的OLTP業務遷移到云計算中,發展面向OLTP的云計算業務會成為重要趨勢。
其次,即便是在分布式云計算平臺中,“服務器農場”也只是一種過渡階段。隨著云計算應用的成熟和深入,應用和數據的跨數量級整合是一個大趨勢,對服務器的性能、可靠性、擴展性等幾乎是永無止境的需求,集中規模的累積必然會使得云計算物理平臺發生質變,就好比現在電力行業小型發電機被大型發電機組取代一樣,分散的、過渡的模式將被逐步取代,大型服務器將成為云計算硬件基礎的核心。
在此次云計算戰略發布會上,張東則進一步從行業云數據中心的應用需求出發,詳細闡述了為什么大服務器才是云計算,尤其是行業云計算數據中心里的硬核?他指出,從需求特征來看,對行業云的技術要求體現在“高效率、大規模、高可用、易管理、低耗節能、安全”幾個方面:
首先,由于行業數據非常龐大,而且對于數據處理的時效性要求很高,因此要求行業云里要有強大、高效的大規模數據存儲和處理能力。
其次,由于行業云要對外提供服務,對服務質量的要求非常高,因此對行業云的高可用性要求也很高,要達到99.999%,也就是每年的服務中斷不能超過5分鐘。
再次,由于行業云數據中心非常龐大,涉及幾千上萬臺計算機、存儲和網絡設備,因此對易管理的要求也很高,比如要有集中管理、遠程管理等,以降低管理成本。
第四,大規模數據中心的能耗問題也很突出,因此要求數據中心采取低耗節能的技術。
最后,安全是永恒的話題,把所有的數據放到網上,如何保護這些數據的安全,如何保證個人數據的隱私,以及這些數據的完整性,都是非常重要的課題。
基于上述六個方面的需求分析,張東指出,行業云數據中心里的核心硬件設備非高端服務器和海量存儲莫屬,因為只有這樣的基礎硬件才能滿足“高性能、高可靠、易管理、易拓展”的要求。
首先,從數據處理能力來看,行業云需要更多更復雜、關聯性極強的結構化數據和大量的非結構化數據,需要計算機系統的多線程并發、緊耦合共享內存技術的支撐。比較來看,公眾云服務如搜索、共享等,數據之間的相關性是比較低的,比如搜索一個網頁和另一個網頁,不需要做關聯檢查,因此很多廠商采用低廉的服務器。但在行業云中,很多核心應用的數據關聯性非常復雜,低端服務器就不適用了。另外,在大規模數據處理中,I/O瓶頸問題一直很突出,因此需要大共享內存、高內部互聯的“胖節點”來支撐。比如,浪潮曾經測試過,對于數據庫應用,16臺低端服務器集群的處理能力還不如一臺8路高端服務器。
其次,從系統可用性方面看,行業云數據中心為了提供連續穩定的服務,往往需要99.999%以上的可用性,因此需要計算機系統的容錯技術和高可用技術的支撐。采用低端服務器集群,雖然通過冗余方式也可以提高可用性,但要達到99.999%至少需要3路冗余,設備利用率非常低。而且,如果采用備份-恢復方式恢復系統,系統恢復時間要長達幾分鐘,也無法滿足應用服務99.999%的要求。從管理的角度看,就算1臺服務器的MTBF是三年,那1000臺服務器加在一起的MTBF也就1天,即每天都有設備要更換,系統管理維護的難度可想而知。
第三,從系統高密度、低能耗、易管理角度看,大規模數據中心的占地和能耗越來越大,需要硬件設備單位性能占用更小的體積,消耗更少的能源;同時大規模數據中心的管理和維護難度及成本逐步提高,需要系統提供智能化、集中式的遠程管理技術。這些都使得簡單地堆積低成本服務器的方式很難滿足要求。
▲浪潮的產品路線圖
為此,浪潮已經在布局高端服務器和海量存儲設備的研發。在服務器方面,浪潮上半年推出了8路服務器天梭TS850,目前正在研制天梭32路高端服務器。其共同特點是高性能,8-32路緊耦合體系結構,支持1TB以上的物理內存;通過軟硬件結合的高可用技術,單臺設備的可靠性可以達到99.999%;易拓展,集成硬件分區、虛擬化分區等,可以大大提高設備的利用率;集成帶外管理功能,即使在關機情況下也可以對設備進行監控和管理,大大減輕管理數據中心的難度。在海量存儲方面,最高容量可以達到1PB,并發帶寬非常高,可以實現多路冗余,整體可靠性達到99.999%,同時還支持遠程鏡像、快照、快速復制等高級功能。新思維4:云計算數據中心需要新型“操作系統”
如果說硬件是基礎,那么軟件就是靈魂。
在單臺計算機中,我們需要操作系統來協調管理底層硬件資源和服務應用,在一個云計算數據中心里,同樣也需要類似“操作系統”的系統軟件——實現軟硬件資源高效管理和利用、提供持續穩定的大規模數據處理服務,且安全可靠,定位于云計算基礎架構供應商的浪潮將其稱為“云計算中心操作系統”。
不過,在浪潮看來,目前的系統軟件難以應對云計算環境所帶來的諸多挑戰,為此,浪潮將自主設計云計算中心操作系統:云海OS。
▲浪潮云海OS架構
那么,從具體需求應用來分析,云計算中心對系統軟件的挑戰主要表現在哪些方面呢?張東談到,主要集中在以下五點:
1)資源的高效利用:在傳統的數據中心環境中,硬件是獨立的,一般每臺機器上裝一個操作系統,每幾臺機器裝一個集群、負載均衡或HA軟件,共同運行一個應用,比如這幾臺運行數據庫,那幾臺運行WEB,還有幾臺是跑郵件。當這些應用負載增加需要擴展資源時,往往只能增加機器,從而造成了平均利用率很低的局面。據統計,在分布式計算環境中,高達85%的計算資源被閑置,無法實現資源的有效調度,既造成了資源的低效,又造成了成本和能源的浪費。因此,如何提高資源的利用率是云計算數據中心首要解決的問題。
2)大規模數據處理:目前傳統操作系統以文件方式進行數據管理,而一般文件存放在本地或后端集中式存儲系統中,因此,在面臨大規模數據處理訪問時,瓶頸就會非常嚴重。由于數據供應不上,反過來也會影響計算資源的有效利用率。另外,傳統系統軟件缺乏標準化和抽象化的分布式數據處理接口,使得應用軟件在不同的系統中間遷移非常困難,進而使應用軟件的開發效率較低。
3)持續穩定的服務:采用傳統的HA方式,系統可用性很難達到99.999%,而且傳統HA方式切換時間較長,也無法完全滿足應用軟件永遠在線的要求。另外,采用集中式存儲,數據的可用性無法滿足要求,并對數據安全也帶來了挑戰。
4)方便易用的管理:沒有形成統一的軟硬件管理,龐大系統的管理運維困難,成本不斷攀升。
5)資源的安全可靠:傳統數據中心租戶間的資源是完全隔離的,系統軟件沒有考慮云計算環境下多租戶間資源共享情況下的安全隔離。另外,云計算環境對于數據隱私保護、數據安全、數據完整性的要求都非常高,傳統的系統軟件也難以應付。
此外,從產品形態上來講,云計算中心需要一個“產品化”的操作系統,且與硬件和應用相互獨立,而目前有一些云計算中心雖然有系統軟件,但卻是與硬件、應用捆綁在一起的,缺少獨立性。作為產品化的云計算操作系統,其特征表現在:可以單獨獲得,可以復制、易部署,與硬件與應用有清晰的接口,統一標準和規范,能夠支撐多種硬件與應用,采用模塊化設計,可以讓用戶根據需要選擇安裝不同功能模塊。
正是基于以上的理解,浪潮已經在研制新型的云計算中心操作系統,即“云海OS”,計劃在今年四季度發布1.0版本。據張東介紹,浪潮云海OS的主要特征包括:支持異構硬件平臺,基于塊設備的分布式存儲管理,支持資源動態流轉,單個數據中心管理計算機數量不少于5000,數據存儲容量不少于50PB,總體可用性達到99.99%,支持百萬量級虛擬資源與虛擬進程的管理。后記:在亂象中尋找出路
云計算作為一種新的IT商業模式和應用模式,已經得到了廣泛關注。據IDC預測,2012年全球云計算市場規模將達420億美元,相關產業總產值達4520億美元,未來幾年,云計算市場的增長率將在20%以上。
▲漫畫云計算
縱觀中國云計算產業這兩年的發展態勢,熱鬧的背后,卻是一片混沌:大大小小的廠商都在往云計算概念上靠,各地方的所謂云計算中心紛紛上馬,各種各樣的云計算觀點滿天飛。浪潮集團高級副總裁王恩東在接受采訪時也指出,雖然關于云計算的討論已經持續了近三年,但仍然存在一些亂象,具體表現在:一是IT廠商從自身利益角度出發“各說各話”,出現許多片面化的云計算觀點;二是客戶對云計算的理解陷入誤區,象“瞎子摸象”一樣,對整體架構不重視;三是云計算中心建設盲目跟風,人云亦云;四是缺少實際應用,雷聲大,雨點小。所以,云計算產業發展首先要理清當前認知混亂的局面,化云為雨,腳踏實地。
當然,這或許是每個新興產業在發展前期都要經歷的過程。但正因為這樣,我們更應該拔開迷霧,看清本質,理清優劣勢和發展思路,小到一家企業,大至一個國家,莫不如此。
▲根據Gartner,目前云計算仍然處在概念膨脹階段,離主流應用仍有2-5年
當前,中國的云計算產業可謂“危”、“機”并存。一方面,中國發展云計算有自己的優勢,中國電子學會云計算專家委員會副主任委員倪光南院士在這次發布會上就總結了四點:一是市場基礎好,互聯網和有線電視網全球第一;二是云計算服務透明化給國產CPU和操作系統提供了產業化機會;三是云計算大大節省硬件設備和電力消耗,符合節約型社會發展需求;四是云計算可以推動我國實現安全、低成本的信息化進程。
另一方面,中國云計算產業也面臨許多問題??萍疾扛呒夹g研究發展中心信息技術處處長嵇智源就指出,發展云計算不僅是加快結構調整和轉變發展方式的重要途徑和舉措,同時更是提升國家競爭力、搶占新一輪全球競爭制高點的戰略選擇。但跟歐美日等發達國家比,我國云計算技術起步較晚,而且正呈現“頭重腳輕”的發展趨勢,即云計算應用種類繁多,但基礎核心技術缺失,如果長此以往,就宛如“空中樓閣”,前景不容樂觀。國內企業必須要在云計算的核心技術領域實現自主可控,才能在新一輪的信息變革中掌握話語權。
可見,中國的云計算產業,尤其是公有云的建設,不能總是跟在谷歌、亞馬遜后面,要想在彎道中實現超越,必須另辟蹊徑,自主創新,“行業云”或許不失為一種選擇,但其技術實現、運行機制、商業模式等問題還需要進一步探討落實。