成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Hadoop分布式文件系統-從RAID說起

存儲 存儲軟件 分布式 Hadoop
大數據技術主要要解決的問題的是大規模數據的計算處理問題,那么首先要解決的就是大規模數據的存儲問題。大規模數據存儲要解決的核心問題有三個方面:

 大數據技術主要要解決的問題的是大規模數據的計算處理問題,那么首先要解決的就是大規模數據的存儲問題。大規模數據存儲要解決的核心問題有三個方面:

數據存儲容量的問題,既然大數據要解決的是數以PB計的數據計算問題,而一般的服務器磁盤容量通常1-2TB,那么如何存儲這么大規模的數據。

數據讀寫速度的問題,一般磁盤的連續讀寫速度為幾十MB,以這樣的速度,幾十PB的數據恐怕要讀寫到天荒地老。

數據可靠性的問題,磁盤大約是計算機設備中最易損壞的硬件了,在網站一塊磁盤使用壽命大概是一年,如果磁盤損壞了,數據怎么辦?

在大數據技術出現之前,人們就需要面對這些關于存儲的問題,對應的解決方案就是RAID技術。

[[235495]]

從RAID說起

RAID(獨立磁盤冗余陣列)技術主要是為了改善磁盤的存儲容量,讀寫速度,增強磁盤的可用性和容錯能力。目前服務器級別的計算機都支持插入多塊磁盤(8塊或者更多),通過使用RAID技術,實現數據在多塊磁盤上的并發讀寫和數據備份。

常用RAID技術有以下幾種,如圖所示。

假設服務器有N塊磁盤。

RAID0

數據在從內存緩沖區寫入磁盤時,根據磁盤數量將數據分成N份,這些數據同時并發寫入N塊磁盤,使得數據整體寫入速度是一塊磁盤的N倍。讀取的時候也一樣,因此RAID0具有極快的數據讀寫速度,但是RAID0不做數據備份,N塊磁盤中只要有一塊損壞,數據完整性就被破壞,所有磁盤的數據都會損壞。

RAID1

數據在寫入磁盤時,將一份數據同時寫入兩塊磁盤,這樣任何一塊磁盤損壞都不會導致數據丟失,插入一塊新磁盤就可以通過復制數據的方式自動修復,具有極高的可靠性。

RAID10

結合RAID0和RAID1兩種方案,將所有磁盤平均分成兩份,數據同時在兩份磁盤寫入,相當于RAID1,但是在每一份磁盤里面的N/2塊磁盤上,利用RAID0技術并發讀寫,既提高可靠性又改善性能,不過RAID10的磁盤利用率較低,有一半的磁盤用來寫備份數據。

RAID3

一般情況下,一臺服務器上不會出現同時損壞兩塊磁盤的情況,在只損壞一塊磁盤的情況下,如果能利用其他磁盤的數據恢復損壞磁盤的數據,這樣在保證可靠性和性能的同時,磁盤利用率也得到大幅提升。

在數據寫入磁盤的時候,將數據分成N-1份,并發寫入N-1塊磁盤,并在第N塊磁盤記錄校驗數據,任何一塊磁盤損壞(包括校驗數據磁盤),都可以利用其他N-1塊磁盤的數據修復。

但是在數據修改較多的場景中,任何磁盤修改數據都會導致第N塊磁盤重寫校驗數據,頻繁寫入的后果是第N塊磁盤比其他磁盤容易損壞,需要頻繁更換,所以RAID3很少在實踐中使用。

RAID5

相比RAID3,更多被使用的方案是RAID5。

RAID5和RAID3很相似,但是校驗數據不是寫入第N塊磁盤,而是螺旋式地寫入所有磁盤中。這樣校驗數據的修改也被平均到所有磁盤上,避免RAID3頻繁寫壞一塊磁盤的情況。

RAID6

如果數據需要很高的可靠性,在出現同時損壞兩塊磁盤的情況下(或者運維管理水平比較落后,壞了一塊磁盤但是遲遲沒有更換,導致又壞了一塊磁盤),仍然需要修復數據,這時候可以使用RAID6。

RAID6和RAID5類似,但是數據只寫入N-2塊磁盤,并螺旋式地在兩塊磁盤中寫入校驗信息(使用不同算法生成)。

在相同磁盤數目(N)的情況下,各種RAID技術的比較如下表所示。

RAID技術有硬件實現,比如專用的RAID卡或者主板直接支持,也可以通過軟件實現,在操作系統層面將多塊磁盤組成RAID,在邏輯視作一個訪問目錄。RAID技術在傳統關系數據庫及文件系統中應用比較廣泛,是改善計算機存儲特性的重要手段。

RAID技術只是在單臺服務器的多塊磁盤上組成陣列,大數據需要更大規模的存儲空間和訪問速度。將RAID技術原理應用到分布式服務器集群上,就形成了Hadoop分布式文件系統HDFS的架構思想。

責任編輯:武曉燕 來源: 死磕Java與Scala技術棧
相關推薦

2010-06-04 18:45:43

Hadoop分布式文件

2011-07-15 17:48:27

Platform

2010-11-01 05:50:46

分布式文件系統

2018-03-01 16:26:30

HDFSHadoop系統

2017-10-17 08:33:31

存儲系統分布式

2012-08-31 16:04:11

HDFS分布式文件系統

2013-06-18 14:00:59

HDFS分布式文件系統

2010-11-15 13:24:07

分布式文件系統

2013-01-07 10:29:31

大數據

2012-09-19 15:05:24

MogileFS分布式文件系統

2012-09-19 13:43:13

OpenAFS分布式文件系統

2016-09-14 23:51:23

2018-08-14 10:44:58

HadoopHDFS命令

2013-06-18 14:33:13

HDFS分布式文件系統

2013-05-27 14:46:06

文件系統分布式文件系統

2012-10-09 16:43:47

FastDFS分布式文件系統

2011-03-16 14:23:38

分布式文件

2012-05-10 15:23:53

分布式文件系統測試

2020-01-03 08:33:57

Ceph硬件系統

2012-05-10 14:04:07

分布式文件系統架構
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 涩涩视频在线看 | 在线视频中文字幕 | 亚洲最大成人综合 | 亚洲精品国产电影 | 日本中文字幕在线观看 | 91精品午夜窝窝看片 | 国产电影一区二区在线观看 | 在线精品亚洲欧美日韩国产 | 中文字幕第二十页 | 精品一区二区三区四区在线 | 99精品网 | 精品人伦一区二区三区蜜桃网站 | 日韩国产一区二区三区 | av日日操 | 九九久久精品视频 | 欧美日韩成人影院 | 国产精品国产三级国产aⅴ原创 | av手机在线播放 | 一区2区| 国产精品99久久久久久久vr | 成年人免费看的视频 | 日本三级电影在线看 | 999国产视频 | 成人一区在线观看 | 产真a观专区 | 美国av毛片 | 二区在线视频 | 国产aⅴ| 成人精品鲁一区一区二区 | 国产亚洲一区二区三区在线观看 | 日韩精品久久久久久 | 亚洲欧美综合精品另类天天更新 | 免费亚洲婷婷 | 一区二区三区四区av | 精品久久久久久亚洲国产800 | 国产精品99久久久久久久vr | 羞羞网站免费观看 | 男人天堂午夜 | www.色综合 | 日韩国产精品一区二区三区 | 久久精品这里 |