成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Atlas:百度Key-value云數(shù)據(jù)存儲系統(tǒng)設(shè)計揭秘

云計算 其他數(shù)據(jù)庫 數(shù)據(jù)庫
本文介紹百度云使用的key-value存儲系統(tǒng)atlas的設(shè)計,思路相當(dāng)贊。

MSST 2015的論文(論文在這里)介紹百度云使用的key-value存儲系統(tǒng)atlas的設(shè)計,思路相當(dāng)贊。簡單總結(jié)一下,建議想深入學(xué)習(xí)的同學(xué)直接閱讀論文。

存儲場景

百度云94%的文件在[128KB-256KB]之間,所以atlas主要針對小文件存儲

百度云前面有CDN,到達atlas的請求基本都是隨機訪問,atlas是隨機訪問的存儲引擎,不支持range操作

總體架構(gòu)

 

enter image description here

atlas主要由PIS和RBS兩個部分組成,下面將分別介紹

PIS存儲接口

 

enter image description here

atlas的PIS模塊(patch and index slice)直接面向用戶,與其他KV存儲引擎類似,暴露put/get/delete接口,不同的是atlas的key是規(guī)定長度128字節(jié)的GUID。

PIS以slot(slice)為單位進行數(shù)據(jù)管理,用戶的key-value會分散存儲到多個slot里,put時atlas的客戶端會根據(jù)key計算hash,并對slot數(shù)量取模,將key路由至某個slot,每個slot單獨進行數(shù)據(jù)管理。

 

enter image description here

PIS的primary副本接收到用戶的put請求,會將請求轉(zhuǎn)發(fā)至多個secondary副本,每個副本都將value追加至本地patch(類似于log文件),并記錄key的value在patch里的位置信息(offset、length),當(dāng)patch到達64MB時,patch將不再寫入數(shù)據(jù),PIS會產(chǎn)生一個新的patch文件用于寫,同時會將寫滿的patch以block的形式存儲到RBS里,patch存儲至RBS時,RBS會分配一個唯一的blockid,此時PIS將key==>(blockid、length、offset)的映射關(guān)系寫入index模塊(一個類似于 google leveldb的系統(tǒng))。

PIS接收到get請求時,首先在patch里查找key是否存儲,如果存在則直接從patch讀取value,返回給用戶;如果key在 patch里不存在,則在index里查找,如果index里未找到,則說明atlas并沒有存儲這個key;如果在index里找到,則根據(jù)(blockid、length、offset)從RBS里讀取value,返回給用戶。

PIS處理delete請求與leveldb類似,會新寫入一條該key的記錄,標示為key已刪除。

#p#

RBS接口

 

enter image description here

RBS(raid-like block storage)提供block的讀寫刪接口,block長度固定為64MB,RBS里block只能整個寫入和刪除,但支持部分讀取。

RBS包含一個中心管理節(jié)點(master-slave結(jié)構(gòu)),以及一組存儲節(jié)點(part-server),寫入block時,RBS不再使用傳統(tǒng)的多副本來保證數(shù)據(jù)可靠性,而是通過erasure-code來保證,極大的節(jié)省存儲成本。

64MB的block會被RBS的客戶端切分成8個8MB的part,通過8+4的erasure code計算出4個4MB的part,總共12個part;寫入時,首先從中心節(jié)點請求分配一個唯一的blockid,同時分配12個 part-server用于寫入12個part(實際上給了15個part-server信息,3個是備用的,如果存儲12個part時,有某些part 存儲失敗,直接使用備用的part-server,而不用重新向中心節(jié)點發(fā)送新的請求,減少了與中心節(jié)點的交互次數(shù));當(dāng)12個part存儲成功后,將 part與part-server的對應(yīng)關(guān)系更新至中心節(jié)點。

當(dāng)需要訪問某個block時,RBS客戶端向從中心管理節(jié)點查詢block所在的part-server,然后從part-server讀取數(shù)據(jù);如果讀取的part-server當(dāng)時處于故障狀態(tài),會讀取block內(nèi)其他至少8個part,來恢復(fù)該part-server里的數(shù)據(jù)。

刪除空間回收

PIS里index里的key==>(block, length, offset)信息、RBS里的block==>create-time信息會被推送到離線的hadoop集群,每天計算哪些block是比較老的 (比如2周以前創(chuàng)建的),并且有效的使用空間低于某個閾值(比如80%),這批block被認為是需要回收的,atlas將block里有效的數(shù)據(jù)(沒被刪除或覆蓋)重新寫入一份,即可將block刪除掉。

博文出處:http://blog.yunnotes.net/index.php/baidu-atlas-key-value-store/

責(zé)任編輯:Ophira 來源: Yun Notes
相關(guān)推薦

2010-07-19 10:05:56

ibmdw存儲系統(tǒng)

2016-04-15 13:45:48

2016-06-15 14:21:09

2018-03-07 10:35:45

云計算存儲系統(tǒng)

2016-11-17 11:24:32

數(shù)據(jù)庫大數(shù)據(jù)

2014-07-25 17:12:39

數(shù)據(jù)庫WOT2014MongoDB

2020-12-31 20:32:47

AI

2013-06-27 10:23:30

百度云百度開放云

2024-02-27 07:27:58

云原生推薦系統(tǒng)架構(gòu)云原生技術(shù)棧

2016-10-13 15:19:34

百度

2018-06-15 08:23:55

Key-Value數(shù)據(jù)庫MVCC

2013-04-24 10:37:38

百度地圖云存儲

2012-05-28 22:51:53

百度

2013-07-01 16:36:26

百度云推送免費云推送移動開發(fā)

2013-07-16 15:05:03

云推送極光推送

2020-05-29 11:03:21

IBM

2012-10-19 09:47:30

百度云百度音樂云計算

2015-07-29 16:49:47

百度

2013-01-16 09:56:48

點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 久久精品视频99 | 天天夜碰日日摸日日澡 | 91精品在线播放 | 免费在线国产视频 | 久草在线视频中文 | 久久国产精品99久久久久 | 五月综合激情在线 | 99久久精品一区二区成人 | 国产色网 | 欧美精品国产一区二区 | 97色在线视频 | 成人av鲁丝片一区二区小说 | 欧美成人精品 | 欧美国产一区二区三区 | 午夜精品久久久久久久星辰影院 | 正在播放国产精品 | 狠狠干美女 | 天天干天天操天天看 | 美女天堂 | 欧美精品被 | 亚洲免费在线观看av | 一二三四av | 国产中文字幕在线 | 国产精品18久久久久久久 | 亚洲国产精品久久久久秋霞不卡 | 一区二区三区国产精品 | 国产精品99久久免费观看 | 久久久精品日本 | 久久五月婷 | 色播久久 | 国产精品免费在线 | 久久国产精品色av免费观看 | 久久国产一区二区三区 | 天天看天天爽 | 精品视频成人 | 亚洲一区二区三区四区五区午夜 | 正在播放国产精品 | 久久99久久98精品免观看软件 | 欧美在线观看免费观看视频 | 91麻豆精品一区二区三区 | 欧美日在线 |