成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

云計算背后的秘密(2)-GFS

云計算
由于搜索引擎需要處理海量的數據,所以Google的兩位創始人Larry Page和Sergey Brin在創業初期設計一套名為“BigFiles”的文件系統,而GFS(全稱為“Google File System”)這套分布式文件系統則是“BigFiles”的延續。

由于周日Linode在加州機房出現停電事故,所以這兩天PeopleYun沒法訪問,在這里向大家表示歉意

由于搜索引擎需要處理海量的數據,所以Google的兩位創始人Larry Page和Sergey Brin在創業初期設計一套名為“BigFiles”的文件系統,而GFS(全稱為“Google File System”)這套分布式文件系統則是“BigFiles”的延續。

技術概覽

首先,介紹它的架構,GFS主要分為兩類節點:其一是Master節點,其主要存儲與數據文件相關的元數據,而不是Chunk(數據塊)。元數據包括一個能將64位標簽映射到數據塊的位置及其組成文件的表格,數據塊副本位置和哪個進程正在讀寫特定的數據塊等。還有Master節點會周期性地接收從每個Chunk節點來的更新(“Heart-beat”)來讓元數據保持最新狀態;其二是Chunk節點,它主要用于存儲數據。在每個Chunk節點上,數據文件會以每個默認大小為64MB Chunk的方式存儲,而且每個Chunk有唯一一個64位標簽,并且每個Chunk都會在整個分布式系統被復制多次,默認次數為3。下圖就是GFS的架構圖:

 

圖1. GFS的架構圖

接著,在設計上,GFS主要有八個特點:

大文件和大數據塊:數據文件的大小普遍在GB級別,而且其每個數據塊默認大小為64MB,這樣做的好處是減少了元數據的大小,從而能使Master節點能夠非常方便地將元數據都放置在內存中以提升訪問效率。

操作以添加為主:文件很少會被刪減或者覆蓋,通常只是進行添加或者讀取操作,這樣能充分考慮到硬盤線性吞吐量大,但隨機讀寫慢的特點。

支持容錯:首先,雖然當時為了設計方便,采用了單Master的方案,但是整個系統會保證Master節點會有其相對應的替身(Shadow),以便于當Master節點出現問題時進行切換。其次,在Chunk層,GFS已經在設計上將節點失敗視為常態,所以能非常好地處理Chunk節點失效的問題。

高吞吐量:雖然以單個節點來看,GFS的性能無論是從吞吐量還是延遲都很普通,但因為其支持上千的節點,所以總的數據吞吐量是非常驚人的。

保護數據:文件被分割成固定尺寸的數據塊以便于保存,而且每個數據塊都會被系統至少復制三份。

擴展能力強:因為元數據偏小,使得一個Master節點能控制和管理上千個存數據的Chunk節點。

支持壓縮:對于那些稍舊的文件,可以通過對它進行壓縮,來節省硬盤空間,并且壓縮率非常驚人,有時甚至接近90%。

基于用戶空間:GFS主要運行于系統的用戶空間(User Time),雖然在效率方面,用戶空間比內核空間略低,但是更便于開發和測試,還有,就是能更好利用Linux的自帶的一些POSIX API。

優劣點

由于GFS主要是為了存儲海量搜索數據而設計的,所以它在吞吐量(Throughput)和伸縮性(Scalability)這兩方面表現非常優異,可謂業界的“翹楚”,但是由于其主要以64MB數據塊形式存儲,所以在隨機訪問方面速度并不優秀,雖然這點可謂是它的“軟肋”,但是這本身也是其當初為了吞吐量和伸縮性所做的權衡。

相關產品

和MapReduce相似的是,GFS在開源界也有其對應的產品,最出名的是HDFS分布式文件系統,在功能和設計上,HDFS從GFS身上借鑒了很多東西,而且由于其本身就是Hadoop系列的一部分,所以它為了更好Hadoop這個MapReduce框架做了很多優化。

實際用例

現在Google內部至少運行著200多個GFS集群,最大的集群有幾千臺服務器,數據量是PB級別的,并且服務于多個Google服務,包括Google搜索和Google Earth等。同時,在最近幾年,由于上面提到的高延遲問題,所以GFS并不很適合新的一些Google產品,比YouTube、Gmail和非常強調實時性的Caffeine搜索引擎等,所以Google已經在開發下一代GFS,代號為“Colossus”,并且在設計方面有許多不同,比如,支持分布式Master節點來提升高可用性并支撐更多文件和chunk節點能支持1MB大小的chunk以支撐低延遲應用的需要等,希望等Colossus成熟的時候,Google也能像當初GFS那樣,將其設計的細節和經驗拿出來和大家分享。

【編輯推薦】

  1. 從Qualcomm公司實施云計算說起
  2. 咖啡館里的云 打印機的新模樣
  3. 了解云的多租戶是云采用的關鍵一步
  4. 云計算背后的秘密(1)-MapReduce

 

責任編輯:王勇 來源: 博客
相關推薦

2010-11-25 09:54:14

云計算MapReduce

2010-11-29 10:28:32

云計算BigTable

2010-12-06 14:28:56

云計算Chubby

2011-02-17 09:45:40

云計算RPC框架

2011-01-04 10:00:41

云計算YunTable

2010-12-23 10:19:14

云計算NoSQL數據庫

2011-01-06 16:36:05

云計算Google

2020-04-15 13:55:28

Kubernetes容器

2022-12-29 08:00:00

Transforme架構深度學習

2020-02-17 21:04:47

在線辦公教育

2020-06-19 12:06:12

云計算云平臺IT

2016-06-27 16:29:04

戴爾閃存

2010-10-25 10:13:16

ibmdwWebSphere

2013-03-01 10:45:36

Nike大數據

2012-05-21 21:53:05

2010-05-24 18:22:56

SNMP協議

2017-09-18 08:52:34

2012-02-24 09:07:53

云計算成本

2024-10-29 14:00:21

云計算虛擬網絡

2013-11-19 09:22:01

企業云計算IBM
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品国产乱码久久久久久88av | zzzwww在线看片免费 | aaa综合国产 | 久久久影院 | 欧美亚洲一区二区三区 | 天天色图| 黄片毛片免费看 | 黄色免费网址大全 | 黑人巨大精品 | 欧美视频第三页 | 日韩在线视频观看 | 欧美精品成人一区二区三区四区 | 精品1区| 四虎免费视频 | 一级一级一级毛片 | 一级做a爰片性色毛片视频停止 | 精品国产乱码久久久久久果冻传媒 | 精品欧美一区二区三区久久久 | 久久久精品| 亚洲欧美网| 日本不卡免费新一二三区 | 成年网站在线观看 | 国产精品jizz在线观看老狼 | 欧美在线一区二区三区 | 国产一区 日韩 | 中文av网站 | 精精国产xxxx视频在线播放 | 欧美三级电影在线播放 | 国产精品一区在线观看 | 精品成人一区二区 | 蜜桃特黄a∨片免费观看 | 亚洲精品福利视频 | 日韩aⅴ在线观看 | 91在线影院 | 一区二区三区视频在线观看 | 久久亚洲春色中文字幕久久久 | 久久国产成人午夜av影院武则天 | 久久久久国产精品一区三寸 | 国产视频在线观看一区二区三区 | 九色在线观看 | 国产精品极品美女在线观看免费 |