成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

云存儲產品淺析

云計算
云上存儲產品主要有對象存儲,塊存儲,網絡文件系統(tǒng)(NAS),還有最賺錢的CDN,我們將針對這些主流產品,講講他們產品特點,有云上存儲時候知道如何選型。

云上存儲產品主要有對象存儲,塊存儲,網絡文件系統(tǒng)(NAS),還有***錢的CDN,我們將針對這些主流產品,講講他們產品特點,有云上存儲時候知道如何選型,當然我們是技術型作者也會簡單講講實現(xiàn)思路,出于信息安全,不可能完全闡述工業(yè)界方案。 工業(yè)界各大廠商很多上層存儲產品都重度依賴底層文件系統(tǒng),我們也捎帶說說存儲祖師爺DFS。

一、Linux IO STACK

Linux IO STACK

云計算本質就是單機計算能力的***擴展,我們先看看單機的文件及IO管理。 linux操作系統(tǒng)一個IO操作要經由文件系統(tǒng)vfs,調度算法,塊設備層,最終落盤

  • 其中vfs層有具體的NFS/smbfs 支持網絡協(xié)議派生出來NAS產品
  • VFS還有一個fuse文件系統(tǒng),可切換到用戶態(tài)上下文。上層分布式存儲只要適配了Libfuse接口,就可訪問后端存儲
  • 在設備層,通過擴展ISCSI網絡協(xié)議,衍生出了塊存儲

二、存儲產品架構流派

1. 分層或平層

如hbase,底層基于hdfs文件系統(tǒng),hbase不用考慮replication,專注于自身領域問題

特點:大大降低開發(fā)成本,穩(wěn)定性依賴底層存儲,底層不穩(wěn)定,上層遭殃。

2. 豎井

自己做replication,自己做副本recover,自己做寫時recover

master-slave體系架構

master-slave體系架構

兩層索引體系,解決lots of small file:

  • ***層,master維護一個路由表,通過fileurl找到對應slave location(ip+port)
  • 第二層,slave單機索引體系,找到具體的location,讀出raw data

DFS

DFS

3. 特點

豐富類posix語意,特點Append-only存儲,不支持pwrite

4. 可能存在問題

  • Pb級別存儲方案,非EB級別。 原因namenode集中式server,內存&qps瓶頸,bat體量公司需運維上百個集群
  • 默認三副本,成本高
  • 強一致寫,慢節(jié)點問題

5. 演進

GFS2拆分了namenode,拆分成目錄樹,blockservice,外加ferdaration,但namespace集中式server缺陷依舊,同時切分image是要停服,水平擴展不是那么友好。

三、對象存儲

對象存儲

1. 元數(shù)據(jù)管理

Blobstorage: blobid->[raw data]

Metastore,aws s3又稱為keymap,本質上是個kv系統(tǒng)。存儲內容file_url->[blobid list]

2. I/O 路徑

  • httpserver收到muti-part form,收到固定大小raw data,切成K份等長條帶
  • 條帶做EC,生成(N-K)份編碼塊,共得到N份shard。現(xiàn)在的問題變成了這N份數(shù)據(jù)存哪
  • 客戶端的代理繼續(xù)向blobstorage申請一個全局的id,這個id代表了了后端實際node的地址,以及這個node管理的實際物理卷,我們的每個分片數(shù)據(jù)均等的存在這些物理卷上。
  • 分發(fā)寫N份數(shù)據(jù),滿足安全副本數(shù)即可返回寫成功,寫失敗的可延時EC方式修復
  • httpserver將文件file及對應的分片列表以KV形式寫入metastore。

3. 特點

基于http協(xié)議 ws服務,接口簡單,put/get,延時高。 EB級別存儲方案,適合云上產品形態(tài)。深度目錄樹變成兩層目錄結構(bucket+object)。

4. 缺點

posix語意接口太少,不提供append語意(其實是通過覆蓋寫提供),更別說隨機寫。

四、塊存儲

1. iscsi模型

與后端交互的的部分在內核實現(xiàn),后端target解析iscsi協(xié)議并將請求映射到后端分布式存儲

2. 特點

  • 絕大多數(shù)請求大小是4K對齊的blocksize. 塊設備的使用一般上層文件系統(tǒng),而大多數(shù)主流文件系統(tǒng)的塊大小是4KB,文件最小操作粒度是塊,因此絕大多數(shù)的IO請求是4KB對齊的。
  • 強一致. 塊設備必須提供強一致,即寫返回后,能夠讀到寫進去的數(shù)據(jù)。
  • 支持隨機寫,延時要低 用戶基于虛擬塊設備構建文件系統(tǒng)(ext4),對于文件編輯操作很頻繁,所以需要支持隨機寫。 比NAS/Fuse類產品性能好,只hack塊設備讀寫,上層dentry lookup還是走原來的IO path,沒有像NAS/FUSE dentry的lookup發(fā)起多次rpc問題
  • 產品層面需要預先購買容量,擴容需要重新掛載,跟NAS比容易浪費空間

3. 實現(xiàn)模型

云盤邏輯卷按block切分,為了便于recover,按1G切分,***層路由由blockManager管理,按volumeid+offset 映射到邏輯block,邏輯block location在三臺blockserver上。Blockserver預先創(chuàng)建一個1G文件(falloc,防止寫過程中空間不夠),稱為物理block。對于邏輯卷這段區(qū)間所有的IO操作都會落到這個物理block文件上,很容易實現(xiàn)pwrite。當然也可以基于裸盤,在os看來是一個大文件,分割成不同的1G文件

4. IO路徑

塊設備上層會有文件系統(tǒng),經過io調度算法,合并io操作,isici協(xié)議發(fā)出的IO請求的都是對扇區(qū)LBA的操作,所以可以簡單抽象成對于卷id加上偏移的操作,我們簡單講講EBS(Elastic Block Store)層IO路徑:

  • 網絡發(fā)出來的IO請求是針對volume+offerset操作,假定是個寫請求
  • 通過blockManager查找到邏輯block
  • 在內存中找到block對應的物理地址(ip+port),block的replicationGroup
  • 使用業(yè)界通用復制鏈方式如raft協(xié)議向replicationGroup發(fā)送io請求,raft幫我們解決寫時失敗tuncate問題
  • 單節(jié)點接到IO請求,把LBA換算成真實的文件偏移,pwrite寫下去

5. 優(yōu)化

  • 可想而知,這種存儲模型下,后端node會有大量的隨機寫,吞吐肯定不高,有很大的優(yōu)化空間 可以通過類似LSM引擎方式,將隨機寫變成順序寫,讀者可深入思考,本文不詳細探討了。
  • 虛擬磁盤可以切條掉,相當于raid盤思路,單塊盤的IO變成多多塊盤,增大吞吐。

五、NAS

用戶通過mount目錄訪問共享文件,mount點掛在的是一個NFS協(xié)議的文件系統(tǒng),會通過tcp訪問到NFS server。

NFS server是一個代理,通過libcfs最終會訪問到我們后端的存儲系統(tǒng)。

1. 后端存儲系統(tǒng)

DS包含管理inode的metastore和datastore

(1) metastore

我們充分吸取業(yè)界DFS缺點,解決Namenode集中式server瓶頸,充分考慮bigtable的各種優(yōu)點。Metastore可基于分布式數(shù)據(jù)庫(newsql),回想一下bigtable,一個用戶的文件散落在多個tabletserver上,允許用戶跨tabletserver rename操作,所以需要分布式事務完成上述保證,出于對DFS改進,我們把目錄樹持久化 模仿linux fs dentry管理,映射規(guī)則如下 兩張表,dentry表和inode表,dentry表描述目錄樹,inode表描述文件block列表及atime,mtime,uid,gid等源信息,一般來講硬鏈夠用,該場景下dentry可以多份,共同指向一個inode。 dentry通過外健關聯(lián)到inode表

(2) Dentry表

Dentry表

(3) Inode表

比如lookup 子節(jié)點

  1. SELECT i.* FROM Dentry d, Inode i WHERE d.PARENT_DID=$PARENT_ID AND d.NAME=$NAME AND d.FSID=$FSID and i.inode_id = d.inode_id; 

(4) datastore

特點:要求提供隨機寫,所以跟塊存儲EBS設計思路是一樣的,大文件切塊,按塊組織,dataserver上有真實的物理block文件,提供pwrite操作。

2. 特點

彈性容量,不限容量,多機掛載并行讀寫,IO線性增長,支持隨機寫 比塊存儲優(yōu)勢在于用多少花多少,不需要提前申請容量,真彈性

3. 缺點

vfs層 dentry lookup每個層級目錄會發(fā)起rpc,延時高。

六、總結

【本文為51CTO專欄作者“大數(shù)據(jù)和云計算”的原創(chuàng)稿件,轉載請通過微信公眾號獲取聯(lián)系和授權】

戳這里,看該作者更多好文

責任編輯:趙寧寧 來源: 51CTO專欄
相關推薦

2018-11-13 09:49:11

存儲云存儲云備份

2019-07-17 10:40:13

云存儲數(shù)據(jù)存儲

2016-11-03 13:35:00

云產品購買攻略雙十一

2009-01-16 15:29:37

CTERANAS云直連存儲

2013-01-08 14:51:49

阿里云開放存儲OSS

2018-09-12 10:10:11

云存儲種類特征

2018-01-17 22:44:46

云存儲云服務存儲

2012-06-20 09:22:14

云存儲

2014-11-21 13:44:56

對象存儲服務云存儲華為

2012-06-18 15:12:58

云存儲

2023-03-17 08:04:15

云存儲安全Veritas

2021-09-29 12:45:04

存儲CDS阿里云

2016-11-08 13:03:51

新東方 存儲

2013-01-08 14:45:22

2010-09-27 13:32:18

選擇DLP產品

2017-07-24 18:35:16

華為

2012-06-15 09:26:21

云存儲

2012-01-06 10:08:57

云計算云存儲

2013-08-01 11:31:50

存儲虛擬化虛擬化

2010-06-30 10:38:05

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 成人免费观看男女羞羞视频 | 91精品国产欧美一区二区 | 天堂中文在线观看 | 欧美日韩电影在线 | 亚洲三区在线观看 | 欧美一区二区三区在线视频 | 欧美成人精品一区二区男人看 | 日本网站在线看 | 日日摸夜夜添夜夜添特色大片 | 日本精品一区二区 | 一区二区三区免费 | 黑人巨大精品欧美一区二区免费 | 欧美黄色免费网站 | 国产精品久久久久久久岛一牛影视 | 亚洲午夜视频在线观看 | 亚洲精品一区二区三区中文字幕 | 精品视频一区二区在线观看 | 97人人澡人人爽91综合色 | 手机看片在线播放 | 国产一区亚洲 | 日韩免费av | 国产精品免费在线 | 国产精品久久国产精品久久 | 91av免费版 | 国产精品免费一区二区三区 | 91免费在线播放 | 国产精品日韩一区二区 | 日韩一区二区久久 | 电影午夜精品一区二区三区 | 久久九 | 国产高清久久久 | 91香蕉| 亚洲高清在线观看 | 中文在线一区二区 | 91精品久久久久久久久中文字幕 | 91精品国产乱码久久久久久久久 | 亚洲激情综合 | 亚洲免费一区二区 | 日本免费在线观看视频 | 91社区在线观看高清 | www精品美女久久久tv |