成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

開源第一彈:什么是HBASE?

數(shù)據(jù)庫 其他數(shù)據(jù)庫
大數(shù)據(jù)工具很少單獨工作,它是一個工具和數(shù)據(jù)庫,以幫助數(shù)據(jù)研究人員能夠更有效地分析他們的集合(或只是有利于加快速度)。

[[130262]]

在數(shù)據(jù)研究人員的工具集上有著大量的工具可以使用,這對于大數(shù)據(jù)技術(shù),既是一件好事也是一件壞事。

當(dāng)我們談?wù)搹氖麓髷?shù)據(jù)工作所使用的工具時,絕大部分討論的會是Hadoop,Apache基金會關(guān)于Map Reduce和分布式存儲系統(tǒng)的實現(xiàn)(HDFS是由Doug Cutting 閱讀相關(guān)論文后在其供職于Yahoo時(他目前在Cloudera)建立的。但大數(shù)據(jù)工具很少單獨工作,它是一個工具和數(shù)據(jù)庫,以幫助數(shù)據(jù)研究人員能夠更有效地分析他們的集合(或只是有利于加快速度)。

其中一項技術(shù)就是HBase。HBase的是一個非關(guān)系(NoSQL的)數(shù)據(jù)庫,是Google BigTable的Java實現(xiàn)。它是柱狀數(shù)據(jù)庫中的一種。相對于關(guān)系數(shù)據(jù)庫基于行存儲數(shù)據(jù),HBASE基于列存儲。

不過這說起來容易,但其究竟是什么意思。讓我們從對谷歌關(guān)于BigTable的相關(guān)文檔的研究開始:

“Bigtable是一個具有稀疏性,分布性,持續(xù)性的多維有序映射。”

讓我們深入其中,看看到底是什么意思。

稀疏

直覺上認(rèn)為數(shù)據(jù)庫稀疏的定義是數(shù)據(jù)庫具有較少的數(shù)據(jù)項,但實際上,稀疏的意義是指數(shù)據(jù)庫中數(shù)據(jù)項的數(shù)據(jù)列缺乏足夠的數(shù)據(jù)。對于HBASE,之所以說它具有稀疏性,是因為它可以在其實體中容納稀疏性數(shù)據(jù)。而對于關(guān)系表,將要求您填寫的所有字段(或大部分)(想想你的關(guān)系數(shù)據(jù)庫中客戶資料表)。柱狀數(shù)據(jù)庫可以為空或NULL且不影響數(shù)據(jù)庫的功能。此外,這也給你帶來了其他好處,使你能夠快速的添加其它你想捕捉的數(shù)據(jù)。在關(guān)系數(shù)據(jù)庫中,創(chuàng)建一個架構(gòu)(FirstName,LastName,SS#,TelephoneNumber),并希望在創(chuàng)建時已經(jīng)得到所有你需要捕獲的數(shù)據(jù)。NoSQL數(shù)據(jù)庫無需設(shè)計過于復(fù)雜的架構(gòu),允許您根據(jù)需要在不中斷業(yè)務(wù)正常流動時添加字段。

分布式和持久化

HBase的使用HDFS(Hadoop分布式文件系統(tǒng)),以實現(xiàn)在多個商用服務(wù)器分發(fā)數(shù)據(jù)。這是Hadoop和HBase能夠處理海量數(shù)據(jù)工作的基礎(chǔ)。它基于另一篇關(guān)于谷歌文件系統(tǒng)的文章(點擊閱讀),google文件系統(tǒng)是Doug Cutting 建立HDFS的基礎(chǔ)。我們將在另一篇文章中詳細(xì)討論HDFS和DFS。

多維排序Map

一個Map(有時被稱為關(guān)聯(lián)數(shù)組)其中存儲的鍵值索引不必是整數(shù),可以是任意的字符串。其實質(zhì)是鍵值對集合,且要求鍵具有惟一性。其中鍵按照字典序排列。(需要注意的是:此處的字典序不是按字母順序排列,也不是按數(shù)字順序,而是按字符串的Unicode值進行排序)

你的得與失

使用HBase可以讓你對存儲在Hbase的數(shù)據(jù)進行預(yù)處理和后處理操作,并給予你更大的靈活性和快速處理數(shù)十億行數(shù)據(jù)的能力。不利的一面是,當(dāng)您使用 HDFS的替代HBase,使用像Hive(類SQL數(shù)據(jù)檢索)那樣的工具會比在普通的HDFS慢4-5倍。此外,可以容納數(shù)據(jù)的***容量約為1 PB而不是HDFS中的30PB。

原文鏈接:www.searchdatabase.com.cn/showcontent_88365.htm

 

責(zé)任編輯:Ophira 來源: TechTarget中國
相關(guān)推薦

2025-02-26 00:02:59

2012-02-27 15:44:18

戴爾

2014-04-28 17:26:00

2021-11-22 16:30:30

分布式一致性分布式系統(tǒng)

2025-04-01 08:45:15

2020-11-19 11:36:24

HarmonyOS

2016-11-02 16:16:50

阿里云雙十一

2025-05-19 02:00:00

MCPFigma前端

2024-07-22 08:46:00

2018-07-02 17:48:31

視頻

2013-07-19 10:35:01

開源精神開源

2013-07-22 10:21:51

開源

2018-11-01 13:49:59

百度大腦AI

2020-10-24 17:44:57

LinuxFOSS自由和開源軟件

2010-03-25 14:12:19

2013-01-06 11:00:52

通信網(wǎng)絡(luò)電信行業(yè)

2016-05-05 10:15:19

云計算移動AI

2024-02-26 00:40:00

AIGPT

2020-05-29 14:10:23

軟件開發(fā) 開源

2015-01-21 15:35:58

開源
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 国产精品区一区二 | 国产午夜精品视频 | 97国产精品视频 | 精品国产乱码一区二区三 | 亚洲欧美激情视频 | 亚洲国产高清高潮精品美女 | 伊人网站在线 | 久久精品小视频 | 亚洲精品区 | 一区二区国产精品 | 国产伊人久久久 | 狠狠干2020| 91久久综合 | 国产高清性xxxxxxxx | 亚洲一区二区三区免费观看 | 日韩精品一区二区三区中文在线 | 久久不射网 | 国产精品久久久久一区二区三区 | 成人精品久久日伦片大全免费 | 亚洲一区 | 户外露出一区二区三区 | 在线午夜 | 99视频免费看 | 成人在线视频网站 | 精品99在线 | 夜夜爽99久久国产综合精品女不卡 | 欧美一区二区二区 | 免费看av大片 | 日韩精品一区二区三区中文在线 | 久久精品a级毛片 | 欧美一区二区三区在线播放 | 国产特级毛片aaaaaa喷潮 | 91国内在线观看 | 亚洲精品国产电影 | 免费欧美视频 | 国产精品欧美一区二区三区不卡 | 嫩草影院网址 | 一区二区在线不卡 | 岛国av一区二区 | 色综合av| 久久精品国产久精国产 |