成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

初創(chuàng)公司Citus Data將CitusDB擴(kuò)展到Hadoop

云計(jì)算 Hadoop
大數(shù)據(jù)已經(jīng)打開了企業(yè)數(shù)據(jù)分析以及選擇性數(shù)據(jù)存儲(chǔ)的視野。那么這兩項(xiàng)的結(jié)合往往意味著需要學(xué)習(xí)新的語(yǔ)言,使用多工具處理,而且在分析平臺(tái)上還可能需要犧牲一部分性能。

數(shù)據(jù)庫(kù)初創(chuàng)公司Citus Data在本周二實(shí)現(xiàn)了Hadoop數(shù)據(jù)上的快速SQL查詢,這并不算什么大事,因?yàn)樗鼈冞€有更大的目標(biāo)。Citus Data已超越Postgres將其高速、分析數(shù)據(jù)庫(kù)CitusDB擴(kuò)展到Hadoop上,接著可能擴(kuò)張到MongoDB以及其它你已經(jīng)想到的數(shù)據(jù)庫(kù)產(chǎn)品。GigaOM的記者Derrick Harris認(rèn)為,它是所有人都需要的唯一分析型數(shù)據(jù)庫(kù),它能夠數(shù)據(jù)的查詢,無(wú)論存儲(chǔ)任何環(huán)境之中——關(guān)系型數(shù)據(jù)庫(kù)、Hadoop、MongoDB、 Amazon S3或者還有其他的地方。

大數(shù)據(jù)已經(jīng)打開了企業(yè)數(shù)據(jù)分析以及選擇性數(shù)據(jù)存儲(chǔ)的視野。那么這兩項(xiàng)的結(jié)合往往意味著需要學(xué)習(xí)新的語(yǔ)言,使用多工具處理,而且在分析平臺(tái)上還可能需要犧牲一部分性能。

Citus Data公司的旗艦產(chǎn)品就是CitusDB,它通常建立在PostgreSQL之上,第一代的目的就是為關(guān)系型數(shù)據(jù)設(shè)計(jì)像谷歌Dremel這種規(guī)模和速度的數(shù)據(jù)庫(kù)。由于其中的一項(xiàng)功能“foreign data wrappers”,所以它能夠在多種數(shù)據(jù)類型(像CSV, log以及JSON files,而且這些數(shù)據(jù)類型在原生的Postgres上是并不匹配的)上運(yùn)行SQL。所以當(dāng)CitusDB除了Postgres之外,還官方支持Hadoop文件分布式系統(tǒng)(HDFS),這就意味著絕不僅限于這些。

Matt Ocko是數(shù)據(jù)收集的負(fù)責(zé)人,也是Citus Data早期的投資者之一,他認(rèn)為數(shù)據(jù)庫(kù)從技術(shù)來(lái)來(lái)講應(yīng)該支持任何使用ODBC驅(qū)動(dòng)的數(shù)據(jù)源,甚至能夠直接從存儲(chǔ)的數(shù)據(jù)中直接查詢?nèi)罩疚募J聦?shí)上,Citus正在致力對(duì)MongoDB的支持——這種能力現(xiàn)在已經(jīng)在測(cè)試版上了。Ocko強(qiáng)調(diào)了CitusDB像“網(wǎng)”一樣的能力,它能夠連接各種數(shù)據(jù)源,而不需要用戶進(jìn)行獨(dú)立的查詢,然后再手動(dòng)地連接數(shù)據(jù)。他舉了一個(gè)例子,使用CitusDB跨Postgres和Hadoop做join查詢。

另外一點(diǎn)就是,CitusDB不僅具有良好的靈活性而且很快。Ocko說(shuō)到CitusDB已經(jīng)超越甲骨文Exadata machine上引以為豪的一個(gè)TPC-H基準(zhǔn)測(cè)試(數(shù)據(jù)直接存儲(chǔ)在硬盤上)。上文中提及的運(yùn)行在亞馬遜EC2云上的Postgres-Hadoop查詢僅僅在幾秒鐘之內(nèi)就完成了。

Citus的聯(lián)合創(chuàng)始人Umur Cubukcu告訴Derrick,CitusDB之所以如此之快是因?yàn)樗募軜?gòu):取代將數(shù)據(jù)在網(wǎng)絡(luò)中傳輸,它將焦點(diǎn)聚集到數(shù)據(jù)位置的計(jì)算,并且在資源間具有強(qiáng)大的負(fù)載平衡能力。比如,需要一個(gè)很慢節(jié)點(diǎn)上儲(chǔ)存的資源去完成完成一個(gè)任務(wù),取代一味的等待它會(huì)去其它的節(jié)點(diǎn)上尋求相同的資源。

以Hadoop舉例,MapReduce把計(jì)算帶給了數(shù)據(jù),但是每一個(gè)Job需要對(duì)整個(gè)數(shù)據(jù)集進(jìn)行掃描。這就是早期的Hadoop上的SQL查詢工具Hive現(xiàn)在仍然很慢的原因。曾經(jīng)在Cloudera工作的Citus的軟件工程師Carl Steinbach表示,CitusDB比Hive查詢數(shù)據(jù)類型的速度快3到20倍。在一個(gè)典型的互動(dòng)環(huán)境中,短查詢的實(shí)際的速度可能還會(huì)更快。但是他同時(shí)指出,這些并不是Hive真正的設(shè)計(jì)目的所在。

 

 

然而,CitusDB真正的競(jìng)爭(zhēng)對(duì)手是SQL-On-Hadoop的項(xiàng)目,產(chǎn)品還有很多初創(chuàng)公司。下個(gè)月“Structure: Data”有一系列的話題為圍繞于此展開,屆時(shí)Aster Data,Platfora,Cloudera(Impala),Apache Drill,Drawn to Scale以及Hadapt都會(huì)展現(xiàn)各自的風(fēng)采。

這些都是令人印象深刻的技術(shù)(至少在理論上,它們?nèi)匀惶幵诎l(fā)展階段),Citus可能會(huì)不小心的忽視他們。但是除了可以查詢多個(gè)數(shù)據(jù)源之外,Citus仍然還有自己獨(dú)特的產(chǎn)品,這是其他的公司所不具備的。“當(dāng)你在談?wù)撘粋€(gè)企業(yè)級(jí)的數(shù)據(jù)庫(kù)的時(shí)候”Steinbach表示,“那么談?wù)摰膬?nèi)容絕對(duì)不僅僅是一個(gè)查詢執(zhí)行引擎。”

責(zé)任編輯:王程程 來(lái)源: GigaOM
相關(guān)推薦

2015-08-13 13:44:21

優(yōu)化多核

2009-11-12 15:19:54

2009-11-12 15:30:44

2009-02-26 10:50:04

NetApp虛擬化VMware ESX

2023-03-08 14:14:51

微軟ChatGPT

2017-05-26 23:09:47

2022-03-23 16:28:18

微軟NVIDIAGPU

2009-02-25 16:50:00

2021-01-01 09:46:43

微軟Windows 10Windows

2022-11-10 08:02:41

GitOpsDevOpsKubernetes

2020-06-05 14:30:03

CephCPU 線程

2023-03-03 14:08:51

網(wǎng)絡(luò)安全首席信息安全官

2022-11-01 08:00:00

2024-05-24 15:53:20

視覺圖像

2024-07-30 11:20:00

圖像視覺

2023-11-16 16:33:43

谷歌人工智能

2024-06-13 11:44:43

2024-01-23 12:57:00

模型數(shù)據(jù)

2023-03-16 14:17:56

無(wú)線技術(shù)5G

2020-06-16 11:12:26

醫(yī)療物聯(lián)網(wǎng)IOT
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 男女视频在线免费观看 | 中文字幕乱码视频32 | 国产精品夜间视频香蕉 | 久久久免费电影 | 精品一区久久 | 亚洲国产精品久久久 | 国产成人精品综合 | 日韩在线视频一区二区三区 | 成在线人视频免费视频 | 国产亚韩| 国产精品一区二区av | 99只有精品| 国产99小视频 | 成人免费视频观看视频 | 国产精品日韩欧美一区二区 | 91视频久久久久 | 日本啊v在线 | 亚洲综合色自拍一区 | 国产免费一区 | 一级大片 | 一级片片| 日韩福利在线 | 日本一区二区在线视频 | 国产a区 | 欧美一级在线观看 | 国产乱码精品1区2区3区 | 在线伊人 | 一区中文字幕 | 九九热在线免费视频 | 99免费看 | 天天操天天射综合 | 99精品免费视频 | av网站观看 | 91精品久久久久久久久久入口 | 久久精品中文字幕 | 日韩快播电影 | aaaaaaa片毛片免费观看 | 91精品国产一区二区三区蜜臀 | 国产一区二区三区视频 | 亚洲精品福利视频 | 超碰免费在 |