成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Docker基礎技術:做DeviceMappee做分層鏡像

云計算
DeviceMapper自Linux 2.6被引入成為了Linux最重要的一個技術。它在內(nèi)核中支持邏輯卷管理的通用設備映射機制,它為實現(xiàn)用于存儲資源管理的塊設備驅(qū)動提供了一個高度模塊化的內(nèi)核架構。

因為Docker***的AUFS并不在Linux的內(nèi)核主干里,所以,對于非Ubuntu的Linux分發(fā)包,比如CentOS,就無法使用AUFS作為Docker的文件系統(tǒng)了。于是作為第二優(yōu)先級的 DeviceMapper就被拿出來做分層鏡像的一個實現(xiàn)。

Device Mapper 簡介

DeviceMapper自Linux 2.6被引入成為了Linux最重要的一個技術。它在內(nèi)核中支持邏輯卷管理的通用設備映射機制,它為實現(xiàn)用于存儲資源管理的塊設備驅(qū)動提供了一個高度模塊化的內(nèi)核架構,它包含三個重要的對象概念,Mapped Device、Mapping Table、Target device。

Mapped Device 是一個邏輯抽象,可以理解成為內(nèi)核向外提供的邏輯設備,它通過Mapping Table描述的映射關系和 Target Device 建立映射。Target device 表示的是 Mapped Device 所映射的物理空間段,對 Mapped Device 所表示的邏輯設備來說,就是該邏輯設備映射到的一個物理設備。

Mapping Table里有 Mapped Device 邏輯的起始地址、范圍、和表示在 Target Device 所在物理設備的地址偏移量以及Target 類型等信息(注:這些地址和偏移量都是以磁盤的扇區(qū)為單位的,即 512 個字節(jié)大小,所以,當你看到128的時候,其實表示的是128*512=64K)。

DeviceMapper 中的邏輯設備Mapped Device不但可以映射一個或多個物理設備Target Device,還可以映射另一個Mapped Device,于是,就是構成了一個迭代或遞歸的情況,就像文件系統(tǒng)中的目錄里除了文件還可以有目錄,理論上可以***嵌套下去。

DeviceMapper在內(nèi)核中通過一個一個模塊化的 Target Driver 插件實現(xiàn)對 IO 請求的過濾或者重新定向等工作,當前已經(jīng)實現(xiàn)的插件包括軟 Raid、加密、多路徑、鏡像、快照等,這體現(xiàn)了在 Linux 內(nèi)核設計中策略和機制分離的原則。如下圖所示。從圖中,我們可以看到DeviceMapper只是一個框架,在這個框架上,我們可以插入各種各樣的策略(讓我不自然地想到了面向?qū)ο笾械牟呗阅J?,在這諸多“插件”中,有一個東西叫Thin Provisioning Snapshot,這是Docker使用DeviceMapper中最重要的模塊。

圖片來源:http://people.redhat.com/agk/talks/FOSDEM_2005/

(圖片來源:http://people.redhat.com/agk/talks/FOSDEM_2005/)

Thin Provisioning 簡介

Thin Provisioning要怎么翻譯成中文,真是一件令人頭痛的事,我就不翻譯了。這個技術是虛擬化技術中的一種。它是什么意思呢?你可以聯(lián)想一下我們計算機中的內(nèi)存管理中用到的——“虛擬內(nèi)存技術”——操作系統(tǒng)給每個進程N多N多用不完的內(nèi)址地址(32位下,每個進程可以有最多2GB的內(nèi)存空間),但是呢,我們知道,物理內(nèi)存是沒有那么多的,如果按照進程內(nèi)存和物理內(nèi)存一一映射來玩的話,那么,我們得要多少的物理內(nèi)存啊。所以,操作系統(tǒng)引入了虛擬內(nèi)存的設計,意思是,我邏輯上給你***多的內(nèi)存,但是實際上是實報實銷,因為我知道你一定用不了那么多,于是,達到了內(nèi)存使用率提高的效果。(今天云計算中很多所謂的虛擬化其實完全都是在用和“虛擬內(nèi)存”相似的Thin Provisioning的技術,所謂的超配,或是超賣)

好了,話題拉回來,我們這里說的是存儲。看下面兩個圖(圖片來源),***個是Fat Provisioning,第二個是Thin Provisioning,其很好的說明了是個怎么一回事(和虛擬內(nèi)存是一個概念)

thin-provisioning-1
thin-provisioning-2

那么,Docker是怎么使用Thin Provisioning這個技術做到像UnionFS那樣的分層鏡像的呢?答案是,Docker使用了Thin Provisioning的Snapshot的技術。下面我們來介紹一下Thin Provisioning的Snapshot。

#p#

Thin Provisioning Snapshot 演示

下面,我們用一系列的命令來演示一下Device Mapper的Thin Provisioning Snapshot是怎么玩的。

首先,我們需要先建兩個文件,一個是data.img,一個是meta.data.img:

  1. ~hchen$ sudo dd if=/dev/zero of=/tmp/data.img bs=1K count=1 seek=10M 
  2. 1+0 records in 
  3. 1+0 records out 
  4. 1024 bytes (1.0 kB) copied, 0.000621428 s, 1.6 MB/s 
  5.   
  6. ~hchen$ sudo dd if=/dev/zero of=/tmp/meta.data.img bs=1K count=1 seek=1G 
  7. 1+0 records in 
  8. 1+0 records out 
  9. 1024 bytes (1.0 kB) copied, 0.000140858 s, 7.3 MB/s

注意命令中seek選項,其表示為略過of選項指定的輸出文件的前10G個output的 bloksize的空間后再寫入內(nèi)容。因為bs是1個字節(jié),所以也就是10G的尺寸,但其實在硬盤上是沒有占有空間的,占有空間只有1k的內(nèi)容。當向其寫入內(nèi)容時,才會在硬盤上為其分配空間。我們可以用ls命令看一下,實際分配了12K和4K。

  1. ~hchen$ sudo ls -lsh /tmp/data.img 
  2. 12K -rw-r--r--. 1 root root 11G Aug 25 23:01 /tmp/data.img 
  3.   
  4. ~hchen$ sudo ls -slh /tmp/meta.data.img 
  5. 4.0K -rw-r--r--. 1 root root 101M Aug 25 23:17 /tmp/meta.data.img

然后,我們?yōu)檫@個文件創(chuàng)建一個loopback設備。

  1. ~hchen$ sudo losetup /dev/loop2015 /tmp/data.img 
  2. ~hchen$ sudo losetup /dev/loop2015 /tmp/meta.data.img 
  3.   
  4. ~hchen$ sudo losetup -a 
  5. /dev/loop2015: [64768]:103991768 (/tmp/data.img) 
  6. /dev/loop2016: [64768]:103991765 (/tmp/meta.data.img) 

現(xiàn)在,我們?yōu)檫@個設備建一個Thin Provisioning的Pool,用dmsetup命令:

  1.  ~hchen$ sudo dmsetup create hchen-thin-pool \ 
  2.                   --table "0 20971522 thin-pool /dev/loop2016 /dev/loop2015 \ 
  3.                            128 65536 1 skip_block_zeroing" 

其中的參數(shù)解釋如下(更多信息可參看Thin Provisioning的man page):

dmsetup create是用來創(chuàng)建thin pool的命令

hchen-thin-pool 是自定義的一個pool名,不沖突就好。

–table是這個pool的參數(shù)設置

  • 0代表起的sector位置
  • 20971522代碼結句的sector號,前面說過,一個sector是512字節(jié),所以,20971522個正好是10GB
  • /dev/loop2016是meta文件的設備(前面我們建好了)
  • /dev/loop2015是data文件的設備(前面我們建好了)
  • 128是最小的可分配的sector數(shù)
  • 65536是最少可用sector的water mark,也就是一個threshold
  • 1 代表有一個附加參數(shù)
  • skip_block_zeroing是個附加參數(shù),表示略過用0填充的塊

然后,我們就可以看到一個Device Mapper的設備了:

  1. ~hchen$ sudo ll /dev/mapper/hchen-thin-pool 
  2. lrwxrwxrwx. 1 root root 7 Aug 25 23:24 /dev/mapper/hchen-thin-pool -> ../dm-4 

接下來,我們的初始還沒有完成,還要創(chuàng)建一個Thin Provisioning 的 Volume:

  1. ~hchen$ sudo dmsetup message /dev/mapper/hchen-thin-pool 0 "create_thin 0" 
  2. ~hchen$ sudo dmsetup create hchen-thin-volumn-001 \ 
  3.             --table "0 2097152 thin /dev/mapper/hchen-thin-pool 0" 

其中:

  • ***個命令中的create_thin是關鍵字,后面的0表示這個Volume的device 的 id
  • 第二個命令,是真正的為這個Volumn創(chuàng)建一個可以mount的設備,名字叫hchen-thin-volumn-001。2097152只有1GB

好了,在mount前,我們還要格式化一下:

 

  1. ~hchen$ sudo mkfs.ext4 /dev/mapper/hchen-thin-volumn-001 
  2. mke2fs 1.42.9 (28-Dec-2013) 
  3. Discarding device blocks: done 
  4. Filesystem label= 
  5. OS type: Linux 
  6. Block size=4096 (log=2) 
  7. Fragment size=4096 (log=2) 
  8. Stride=16 blocks, Stripe width=16 blocks 
  9. 65536 inodes, 262144 blocks 
  10. 13107 blocks (5.00%) reserved for the super user 
  11. First data block=0 
  12. Maximum filesystem blocks=268435456 
  13. 8 block groups 
  14. 32768 blocks per group, 32768 fragments per group 
  15. 8192 inodes per group 
  16. Superblock backups stored on blocks: 
  17. 32768, 98304, 163840, 229376 
  18.   
  19. Allocating group tables: done 
  20. Writing inode tables: done 
  21. Creating journal (8192 blocks): done 
  22. Writing superblocks and filesystem accounting information: done 

 

好了,我們可以mount了(下面的命令中,我還創(chuàng)建了一個文件)

  1. ~hchen$ sudo mkdir -p /mnt/base 
  2. ~hchen$ sudo mount /dev/mapper/hchen-thin-volumn-001 /mnt/base 
  3. ~hchen$ sudo echo "hello world, I am a base" > /mnt/base/id.txt 
  4. ~hchen$ sudo cat /mnt/base/id.txt 
  5. hello world, I am a base 

好了,接下來,我們來看看snapshot怎么搞:

  1. ~hchen$ sudo dmsetup message /dev/mapper/hchen-thin-pool 0 "create_snap 1 0" 
  2. ~hchen$ sudo dmsetup create mysnap1 \ 
  3.                    --table "0 2097152 thin /dev/mapper/hchen-thin-pool 1" 
  4.   
  5. ~hchen$ sudo ll /dev/mapper/mysnap1 
  6. lrwxrwxrwx. 1 root root 7 Aug 25 23:49 /dev/mapper/mysnap1 -> ../dm-5 

上面的命令中:

  • ***條命令是向hchen-thin-pool發(fā)一個create_snap的消息,后面跟兩個id,***個是新的dev id,第二個是要從哪個已有的dev id上做snapshot(0這個dev id是我們前面就創(chuàng)建了了)
  • 第二條命令是創(chuàng)建一個mysnap1的device,并可以被mount。

下面我們來看看:

  1. ~hchen$ sudo mkdir -p /mnt/mysnap1 
  2. ~hchen$ sudo mount /dev/mapper/mysnap1 /mnt/mysnap1 
  3.   
  4. ~hchen$ sudo ll /mnt/mysnap1/ 
  5. total 20 
  6. -rw-r--r--. 1 root root 25 Aug 25 23:46 id.txt 
  7. drwx------. 2 root root 16384 Aug 25 23:43 lost+found 
  8.   
  9. ~hchen$ sudo cat /mnt/mysnap1/id.txt 
  10. hello world, I am a base 

我們來修改一下/mnt/mysnap1/id.txt,并加上一個snap1.txt的文件:

  1. ~hchen$ sudo echo "I am snap1" >> /mnt/mysnap1/id.txt 
  2. ~hchen$ sudo echo "I am snap1" > /mnt/mysnap1/snap1.txt 
  3.   
  4. ~hchen$ sudo cat /mnt/mysnap1/id.txt 
  5. hello world, I am a base 
  6. I am snap1 
  7.   
  8. ~hchen$ sudo cat /mnt/mysnap1/snap1.txt 
  9. I am snap1 

我們再看一下/mnt/base,你會發(fā)現(xiàn)沒有什么變化:

  1. ~hchen$ sudo ls /mnt/base 
  2. id.txt      lost+found 
  3. ~hchen$ sudo cat /mnt/base/id.txt 
  4. hello world, I am a base 

你是不是已經(jīng)看到了分層鏡像的樣子了?

你還要吧繼續(xù)在剛才的snapshot上再建一個snapshot

  1. ~hchen$ sudo dmsetup message /dev/mapper/hchen-thin-pool 0 "create_snap 2 1" 
  2. ~hchen$ sudo dmsetup create mysnap2 \ 
  3.                    --table "0 2097152 thin /dev/mapper/hchen-thin-pool 2" 
  4.   
  5. ~hchen$ sudo ll /dev/mapper/mysnap2 
  6. lrwxrwxrwx. 1 root root 7 Aug 25 23:52 /dev/mapper/mysnap1 -> ../dm-7 
  7.   
  8. ~hchen$ sudo mkdir -p /mnt/mysnap2 
  9. ~hchen$ sudo mount /dev/mapper/mysnap2 /mnt/mysnap2 
  10. ~hchen$ sudo  ls /mnt/mysnap2 
  11. id.txt  lost+found  snap1.txt 

好了,我相信你看到了分層鏡像的樣子了。

看完演示,我們再來補點理論知識吧:

  • Snapshot來自LVM(Logic Volumn Manager),它可以在不中斷服務的情況下為某個device打一個快照。
  • Snapshot是Copy-On-Write的,也就是說,只有發(fā)生了修改,才會對對應的內(nèi)存進行拷貝。

另外,這里有篇文章Storage thin provisioning benefits and challenges可以前往一讀。

#p#

Docker的DeviceMapper

上面基本上就是Docker的玩法了,我們可以看一下docker的loopback設備:

  1. ~hchen $ sudo losetup -a 
  2. /dev/loop0: [64768]:38050288 (/var/lib/docker/devicemapper/devicemapper/data) 
  3. /dev/loop1: [64768]:38050289 (/var/lib/docker/devicemapper/devicemapper/metadata) 

其中data 100GB,metadata 2.0GB

  1. ~hchen $ sudo ls -alhs /var/lib/docker/devicemapper/devicemapper 
  2. 506M -rw-------. 1 root root 100G Sep 10 20:15 data 
  3. 1.1M -rw-------. 1 root root 2.0G Sep 10 20:15 metadata 

下面是相關的thin-pool。其中,有個當一大串hash串的device是正在啟動的容器:

  1. ~hchen $ sudo ll /dev/mapper/dock* 
  2. lrwxrwxrwx. 1 root root 7 Aug 25 07:57 /dev/mapper/docker-253:0-104108535-pool -> ../dm-2 
  3. lrwxrwxrwx. 1 root root 7 Aug 25 11:13 /dev/mapper/docker-253:0-104108535-deefcd630a60aa5ad3e69249f58a68e717324be4258296653406ff062f605edf -> ../dm-3 

我們可以看一下它的device id(Docker都把它們記下來了):

  1. ~hchen $ sudo cat /var/lib/docker/devicemapper/metadata/deefcd630a60aa5ad3e69249f58a68e717324be4258296653406ff062f605edf 
  2. {"device_id":24,"size":10737418240,"transaction_id":26,"initialized":false

device_id是24,size是10737418240,除以512,就是20971520 個 sector,我們用這些信息來做個snapshot看看(注:我用了一個比較大的dev id – 1024):

  1. ~hchen$ sudo dmsetup message "/dev/mapper/docker-253:0-104108535-pool" 0 \ 
  2.                                     "create_snap 1024 24" 
  3. ~hchen$ sudo dmsetup create dockersnap --table \ 
  4.                     "0 20971520 thin /dev/mapper/docker-253:0-104108535-pool 1024" 
  5. ~hchen$ sudo mkdir /mnt/docker 
  6. ~hchen$ sudo mount /dev/mapper/dockersnap /mnt/docker/ 
  7. ~hchen$ sudo ls /mnt/docker/ 
  8. id lost+found rootfs 
  9. ~hchen$ sudo ls /mnt/docker/rootfs/ 
  10. bin dev etc home lib lib64 lost+found media mnt opt proc root run sbin srv sys tmp usr var 

我們在docker的容器里用findmnt命令也可以看到相關的mount的情況(因為太長,下面只是摘要):

  1. # findmnt 
  2. TARGET                SOURCE                
  3. /                 /dev/mapper/docker-253:0-104108535-deefcd630a60[/rootfs] 
  4. /etc/resolv.conf  /dev/mapper/centos-root[/var/lib/docker/containers/deefcd630a60/resolv.conf] 
  5. /etc/hostname     /dev/mapper/centos-root[/var/lib/docker/containers/deefcd630a60/hostname] 
  6. /etc/hosts        /dev/mapper/centos-root[/var/lib/docker/containers/deefcd630a60/hosts] 

Device Mapper 行不行?

Thin Provisioning的文檔中說,這還處理實驗階段,不要上Production.

"These targets are very much still in the EXPERIMENTAL state. Please do not yet rely on them in production."

另外,Jeff Atwood在Twitter上發(fā)過這樣的一推

 

Jeff.Atwood.DeviceMapper

這個推指向的這個討論中,其中指向了這個code diff,基本上就是說,DeviceMapper這種東西問題太多了,我們應該把其加入黑名單。Doker的Founder也這樣回復到:

 

所以,如果你在使用loopback的devicemapper的話,當你的存儲出現(xiàn)了問題后,正確的解決方案是:

rm -rf /var/lib/docker

原文鏈接:http://coolshell.cn/articles/17200.html

責任編輯:Ophira 來源: coolshell
相關推薦

2017-03-21 10:02:12

Docker鏡像分層

2022-05-05 09:14:41

AlpineDocker鏡像開發(fā)

2022-09-26 11:32:14

用戶分層服務業(yè)務

2021-03-18 12:16:44

用戶分層業(yè)務

2018-01-12 16:41:50

技術人轉(zhuǎn)行管理

2015-07-30 11:21:16

代碼審查

2022-05-09 09:07:47

JavaScript框架開發(fā)

2014-04-15 13:16:00

Code Review

2013-11-29 10:15:48

國產(chǎn)虛擬化

2017-11-02 08:54:13

數(shù)據(jù)存儲架構

2013-12-02 11:11:04

騰訊微信

2023-06-25 12:42:00

2013-01-17 16:30:33

褚霸技術

2023-11-03 09:05:53

2013-07-30 17:16:00

產(chǎn)品經(jīng)理

2020-04-01 11:01:57

工程師技術裁員

2021-03-11 17:36:51

架構分模塊分層

2021-03-06 16:16:15

分模塊分層

2022-08-30 19:11:12

Docker虛擬化技術
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 天天射天天干 | 久久亚 | 神马久久久久久久久久 | 一区二区三区不卡视频 | 亚洲+变态+欧美+另类+精品 | 中文字幕日韩一区 | 国产1区 | 成人免费一级 | 日韩综合在线视频 | 黄片毛片免费观看 | 青娱乐自拍 | 日本成人在线观看网站 | 国产久| 粉嫩高清一区二区三区 | 欧美日韩国产一区二区三区不卡 | 国产精品日韩在线观看 | 国产美女一区二区 | 欧美操操操 | 成人深夜福利 | xx视频在线观看 | 九九免费视频 | 欧美福利在线 | 在线āv视频 | 成人免费一区二区 | 日韩伦理电影免费在线观看 | 91视频网 | 成人精品一区二区三区中文字幕 | 不卡的av在线 | 爱综合 | 成人精品视频99在线观看免费 | 国产精品三级 | 欧美99 | 欧美影院| 99热精品在线观看 | 麻豆91av | 国产色网 | 国产精品久久久久久久7电影 | 久久久久网站 | 手机av免费在线 | 亚洲一区二区在线 | 韩国毛片视频 |