前沿報道 Cloudera發布Hadoop云計算服務,主要面向”普通人”
本節和大家一起學習一下Hadoop云計算方面的知識,Cloudera發布了Hadoop云計算服務,主要面對“普通人”,歡迎大家一起來學習有關Hadoop云計算的內容。
Cloudera發布面向”普通人”的Hadoop云計算服務
硅谷企業Cloudera日前發布了一款免費的,基于Linux軟件環境下的個人用面向云計算的分布式軟件,該軟件降低了對使用人員的要求,使“普通開發者”也可用該軟件搭建云計算平臺,處理海量數據。“Hadoop提供了無可匹敵的收集、存儲和分析數據的功能,但是直到現在,有一些企業還是回避它,”Burlingameg公司的創建人之一Jeff Hammerbacher,在與Betanews的一場新聞發布會上說。“以前,擁有博士學位背景的人才能使用Hadoop。但是例如醫院和銀行這樣的機構,并沒有這樣的人員。 Hadoop的配置和管理的確很讓人痛苦。但是現在我們提供了更容易的可以讓“普通人”使用Hadoop,”Hammerbacher說,他曾經在 Facebook創建并領導了一個Hadoop數據工作組。
Facebook、Google和Yahoo這樣的網站,最初開發Hadoop的目的是,通過數以千記的計算機將文本和日志數據集中在一起,將數據放在他們的網站上,觀察用戶的使用習慣,Hammer如是說。但是所有處理萬億字節非結構化的信息的公司,也必將在更多的領域使用Hadoop云計算。
例如,一個早期的顧客,現在使用新版的Hadoop Cloudera Distribution分析基因序列,也用于做簡報用。另一個公司的共同創辦人,Cisciglia曾經在Google倡議并與國家科學基金(NSF)合作開發Google主辦的Hadoop簇集,用于科研和教育。
根據Hammerbacher的說法,Cloudera計劃從圍繞軟件的服務和支持獲利,而不是軟件本身。“紅帽對Linux所做的,正是我們對Hadoop所做的。”Hammerbacher如是說。
Cloudera正在分發軟件的RPM,這對大多數Linux管理員和開發人原來說再熟悉不過了,還有在Apache軟件許可下的Amazon EC2許可,Bisciglia介紹說。
該軟件的主要組成部分包括Hadoop 分布式文件系統,一個容錯文件系統用于處理商品硬件出現的錯誤;一個數據存儲基礎設施叫做Hive;以及一個MapReduce軟件的執行,用于將應用程序分解成一些小的工作組,并在大型主機上自動并行執行。
為了使Hadoop distribution的安裝和配置更容易,Cloudera建立了一個新的門戶網站,也是免費的,叫做my.cloudera.com,在這個網站上,大家可以使用一個基于網絡的配置工具生成客戶軟件包,并可優化符合他們的特殊需求。用戶也可設置保存簇集信息的設置以便自動更新。
Cloudera提供了同樣免費的關于軟件的基礎培訓,并提供了可下載的VMware圖像測試軟件在Linux,Windows或Macintosh平臺上的效果。
公司的其他共同創建人包括甲骨文公司的前副總裁mike Olson ,以及Yahoo的前總工程師Amr Awadallah博士。本節有關Hadoop云計算的內容介紹到這里。
【編輯推薦】