DriveScale聲稱,大數據需要一種新的數據中心基礎設施
譯文【51CTO.com快譯】DriveScale是硅谷的一家數據中心技術初創公司,創始人是Sun和思科的一群老兵,他們在幕后開發了這兩家傳奇公司的核心數據中心產品系列,比如Sun的x86服務器和思科的Nexus交換機及統一計算系統(Cisco UCS)。這家公司已研制了一款向外擴展的IT解決方案,專門面向大數據應用。這家公司最近一舉成名,宣布在一輪融資活動中籌資1500萬美元。它在應對數據中心不斷增長的需求,這個創業團隊的技術能力毋容置疑,但是其目前產品只是第一代,想在市場上得到驗證仍有很長一段路要走。
先不妨探討為何面向大數據的向外擴展型解決方案很重要。構建能夠支持某種軟件定義平臺的虛擬控制器不是什么新鮮事。在存儲行業,我們之前就在Atlantis USX和VMware vSAN上見過這種產品;在網絡行業,則有思科ACI、Big Swtich和VMware NSX。然而,這些技術絕大多數是為傳統工作負載設計的,比如虛擬桌面基礎架構、數據庫、應用程序虛擬化和門戶網站等等。
如今,管理IT領域發展速度最快的其中一個方面怎么樣?控制業務價值的一個重要來源怎么樣?為大數據管理創建一個虛擬控制器怎么樣?
據Gartner最近的一項調查顯示,2015年,大數據方面的投入繼續增加。四分之三以上的公司在投入于或計劃在今后兩年投入于大數據技術。
Gartner的研究主任尼克·霍德克(Nick Heudecker)在聲明中說:“今年大數據本身開始已不再是個話題,而是成為標準實踐。由于大數據解決方案成為主流,之前定義大數據的話題變得耳熟能詳,比如海量數據量、不同的數據源和新技術。比如說,在已投入于大數據技術的公司當中,70%在分析或計劃分析位置數據,64%在分析或計劃分析自由格式的文本。”
據Gartner稱,企業組織對于大數據項目通常有多個目標,比如改善客戶體驗、簡化現有流程,實現更有針對性的營銷,并降低成本。與往年一樣,企業組織普遍將改善客戶體驗視為大數據項目的首要目標(64%)。流程效率和更有針對性的營銷如今持平,同為47%。由于數據泄露事件不斷成為頭條新聞,改善安全功能的增幅最大,從15%提高到23%。
Gartner的另一位研究主任麗薩·卡特(Lisa Kart)在聲明中說:“隨著大數據成為新的常態,信息和分析領導人將重點由辨別炒作變成尋找價值。雖然理解價值的長期挑戰依然存在,但是技能、管理、資金和投資回報率這些實際挑戰走到了前臺。”
下面是Gartner關于大數據的另一些重要預測:
·到2020年,信息將用于重新發明、數字化或消除十年前80%的業務流程和產品。
·在2016年,只有不到10%的自助式商業智能項目將得到充分管理,防止給業務帶來負面影響的不一致問題。
·到2017年,50%的信息治理項目將整合信息倡導(information advocacy)這個概念,確保它們是價值驅動的。
那么,DriveScale旨在在哪里大有作為呢?
向外擴展的機架數據中心架構
DriveScale的問世歸因于這三大趨勢:
1. 軟件向外擴展型堆棧的興起和大數據方面的需求。如今顯然需要讓大數據工作負載大大提高彈性、可用性和效率。最重要的是,這些工作負載需要能夠動態擴展。此外,還需要智能化工作負載管理,易出故障的硬件確保數據集安全、可用。最終,DriveScale旨在搭建一種更有彈性的生態系統,為數據提供更好的配置功能。
2. 商用技術和白盒技術。你的數據中心里面已經有網絡、存儲和計算系統。如果你完全可以針對大數據項目更有效地管理它們,何必要更換?一些企業組織期望部署更好的大數據管理生態系統,它們面臨的一大挑戰是,它們在使用傳統手段來管理龐大數據集。DriveScale推出了一種虛擬控制器,定位于軟件定義管理層,可以為大數據項目統一關鍵資源。
3. 網絡層不斷發展。1GbE連接是很久以前的技術了。我們看到更多的連接功能,網絡層智能大大提高。DriveScale的技術旨在抓住這種大好形勢,大大加快交付大數據工作負載的速度。深入了解機架里面的連接和拓撲結構讓DriveScale得以獲得驅動器、它們處理的數據以及信息優先級等方面的更多信息。比如說,他們可以看到哪些驅動器與服務器間隔的跳數(hop)比較少,基本上創建與數據管理和資源分配有關的“機架內以太網”。
DriveScale的首席科學家兼聯合創始人湯姆·萊昂(Tom Lyon)說:“我們的看法是,10GbE及之后的網絡技術變得更便宜、更普及了。所以,數量更多的帶寬和網絡控制器讓新型架構得以問世。”
在過去,萊昂在Nuova Systems擔任過重要的技術崗位,2008年這家初創公司被思科收購,其技術后來成為思科的UCS服務器和Nexus交換機的基礎。
DriveScale并非一開始想解決全球的軟件定義基礎設施和融合問題。相反,它的戰略專注于克服兩大挑戰:
·難以管理龐大數據集和大數據環境。企業組織被迫管理孤立的大數據運營,常常使用傳統的計算、存儲和網絡機制。DriveScale不僅力求克服這些挑戰,還特別專注于向外擴展的應用程序市場。Hadoop、MapR、Cloudera及其他廠商的平臺可以與REST API架構集成起來。
·服務器管理員在管理Hadoop和向外擴展的環境面臨大麻煩。公司面臨的壓力是從它們處理的數據獲得價值。原因何在?這些數據變得對整個業務流程而言越來越有價值。不是部署磁盤“被束縛”的傳統服務器,DriveScale改變了管理員控制為大數據工作負載配置的資源的方式。使用軟件,你可以為一組大數據應用提供磁盤集群(和服務器)。而且,這些資源與來自常規機架式服務器的可用資源區分不開來。基本上,你不再受制于服務器機箱,實際上可以向外擴展。萊昂稱之為“軟件定義的金屬薄片”。
為了克服這些挑戰,DriveScale不得不構建一種新型的管理架構。DriveScale的產品管理主管蒂娜·諾爾特(Tina Nolte)說:“我們發明了一種機架規模的架構,可最大限度地利用網絡、計算和存儲環境。這是一種新型的邏輯層,讓你可以構建軟件定義節點,進而管理復雜的、不斷擴展的大數據環境。”
大體上來看,這種架構相當簡單:
·存儲、網絡和計算完全取決于你。有青睞的廠商?很好,DriveScale可能會與他們合作,沒有問題。
·你的網絡層充當連接器。你使用現有的網絡部件,能夠實現資源之間的聯系。之后,你可以管理節點中鏈路之間的負載,打造集群級管理,那樣你可以造反并構建自己的細粒度規則,并創建基于權限和應用層策略的訪問控制機制。
·神奇之處體現在軟件。DriveScale軟件讓你可以構建上述的軟件定義大數據節點。此外,它讓你可以細粒度地重新平衡計算與存儲比。基本上,隨著你的大數據環境因新的業務要求而不斷發展擴大,它可以動態調整。
那么,DriveScale和其他基于軟件的超融合基礎設施解決方案之間有什么區別?超融合系統使用向外擴展的架構和虛擬控制器,專注于傳統工作負載。DriveScale專注于向外擴展的工作負載(比如大數據),使用商用硬件,并借助向外擴展的軟件。
結束語
再說一下,DriveScale的產品和業務仍處于早期階段。這家公司仍在努力達成戰略合作伙伴關系,構建經過驗證的參考架構。構建這些參考架構,并與惠普企業、思科、戴爾、Super Micro及其他公司結為聯盟,對于促進進一步采用、得到更廣泛的認可大有幫助。此外,要是有什么問題,這還有助于支持。許多企業組織喜歡戰略性合作伙伴關系,這讓它們得以只需要為單一支持渠道操心。
支持DriveScale的技術旨在解決業界一個日益嚴重的問題。向外擴展的應用市場在非常迅速地發展,企業組織在這方面需要幫助。大數據在不斷地越來越大,并且在改變商業智能塑造現代企業組織的方式。眼下,DriveScale這家公司正在采取一種特定的“軟件定義”解決方案,著眼于向外擴展的應用行業。然而從趨勢來看,它不可能寂寞太久。
原文標題:DriveScale Says Big Data Needs a New Kind of Data Center Infrastructure,作者:BILL KLEYMAN
【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】