Hadoop成功實(shí)施案例之旅游行業(yè)
譯文前言:上文講過《Hadoop成功部署案例之eBay篇》與《Hadoop成功部署案例之eBay篇》后,為大家?guī)淼谌狧adoop成功案例介紹。在本文中為大家介紹的是Orbitz Worldwide旗下的全球消費(fèi)者旅游品牌每天要處理數(shù)以百萬計(jì)的搜索和交易。
Orbitz Worldwide旗下的全球消費(fèi)者旅游品牌每天要處理數(shù)以百萬計(jì)的搜索和交易。通過關(guān)系數(shù)據(jù)庫等傳統(tǒng)系統(tǒng),存儲(chǔ)和處理這類活動(dòng)生成的越來越龐大的數(shù)據(jù)量變得越來越難,因而這家公司求助于Hadoop,幫助消除部分復(fù)雜性。
這家公司的首席軟件工程師Jonathan Seidman和另一名工程師Ramesh Venkataramiah一向樂于討論這家旅游網(wǎng)站的基礎(chǔ)設(shè)施如何加以管理。他們倆在最近面向多位聽眾的一次交流中討論了Hive的作用,尤其是對一些關(guān)鍵搜索功能所起的作用。
Hadoop和Hive幫助這家在線旅游中心處理各項(xiàng)事務(wù):改進(jìn)讓游客可以迅速篩選和分類酒店的功能,到查看更宏觀內(nèi)部趨勢的功能,不一而足。據(jù)這兩位工程師聲稱,Orbitz的大數(shù)據(jù)問題讓它成為運(yùn)用Hadoop的“典型”。他們倆表示,面對很分散的服務(wù)網(wǎng)絡(luò)——這些服務(wù)每天生成數(shù)百GB大小的當(dāng)天日志,處理每天數(shù)百萬的這些搜索和交易,這絕非易事。
在上面的幻燈片中,他們倆演示了如何利用Hadoop和Hive來處理數(shù)據(jù);可能更重要的是,演示了什么使得這家公司的特定問題最適合用Hadoop來處理(因?yàn)樾枰嵝训氖且稽c(diǎn),并非所有業(yè)務(wù)都有Hadoop的用武之地。)