成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

MySQL的零拷貝技術

數據庫 MySQL
Buffer為了讓不同速度的設備能夠同步,建立的一個緩沖區域,寫進Buffer的數據是為了從中拿出寫入其他設備。

原文:https://spongecaptain.cool/post/mysql/zerocopyofmysql

1.先需要了解Buffer 與 cache 的區別:

Bbuffer 與 Cache 非常類似,因為它們都用于存儲數據數據,被應用層讀取字節數據。在很多場合它們有著相同的概念:

首先從翻譯上,Buffer應該翻譯為“緩沖”,Cache應該翻譯為“緩存”,兩個完全不是一個東西。

在硬件這一層看,Buffer應該為內存,Cache為CPU集成的告訴緩存。

Buffer為了讓不同速度的設備能夠同步,建立的一個緩沖區域,寫進Buffer的數據是為了從中拿出寫入其他設備。

Cache是為了提高讀取速度,將經?;蝰R上需要的數據預讀到緩存中,寫進Cache的數據是為了其他設備從中去讀取。

從軟件這一層來說,Buffer是塊設備的緩沖,Cache是文件系統的緩存。以Linux為例,

Buffer(Buffer Cache)以塊形式緩沖了塊設備的操作,定時或手動的同步到硬盤,它是為了緩沖寫操作然后一次性將很多改動寫入硬盤,避免頻繁寫硬盤,提高寫入效率。

Cache(Page Cache)以頁面形式緩存了文件系統的文件,給需要使用的程序讀取,它是為了給讀操作提供緩沖,避免頻繁讀硬盤,提高讀取效率。

總而言之,Buffer里面的東西是為了寫到別處去,Cache里面的東西是為了給別處讀。

Buffer 與 Cache 的用途有所不一定:

  • Buffer 的主要目的是在不同應用、線程、進程之間共享字節數據,例如為了讓不同速度的設備能夠進行數據同步,就會使用共享 Buffer;
  • Cache 的主要目的是提高字節數據的讀取/寫入速度,例如根據時間局部性、地址局部性操作系統提供 page cache 機制;當然,在很多場合下 Buffer 與 Cache 有著相同的語義,因此我們可以認為緩沖區既用于提高讀寫速度,又用于數據共享與同步。

關于零拷貝深入理解:

深入理解零拷貝技術

2. MySQL 緩沖區設計

MySQL 的緩沖區設計如下圖所示:

Figure1.MySQL 的緩沖區設計

如上圖所示,MySQL 在不同層次使用了與緩存機制不同的配套技術。其中有:

  • 應用層:

Redo Log Buffer:對寫操作進行緩存,用于實現 MySQL InnoDB 的事務性;

InnoDB Buffer Pool:用于對 MySQL table 的數據進行緩存。讀內存而不是磁盤,通過減少磁盤讀操的方式提高讀操作性能;寫內存而不是磁盤,通過減少磁盤寫操的方式提高寫操作性能;

  • 操作系統的 VFS(Virtual file system,虛擬文件系統)層:

Page Cache:操作系統通過緩存以及預讀機制對文件系統中的 block 基于 page 進行緩存管理;

Direct Buffer:當使用 Direct I/O 提供的相關 API 時,操作系統不再提供基于 Page Cache 機制的緩存,而是直接使用 Direct Buffer;磁盤的 Disk Buffer:

  • 磁盤也可以提供磁盤緩存,通常在 MySQL 中會關閉磁盤緩存,我們僅僅需要了解有 Disk Buffer 這一概念即可。

3. Write Through/Back 與 Direct I/O;

  • Write Through 與 Write Back 指的是在使用內存空間作為緩存的應用在處理寫操作時是否直接落盤:
  • Write Through:寫操作"穿過"緩存區直接落盤,這種策略能夠確保數據不會因為宕機而丟失內存緩沖區的數據;

Write Back:一次寫操作僅僅更新了內存緩存區中的數據,數據落盤通常通過間隔一個時間進行落盤一次;MySQL 為此提供了一些參數來控制 Page Cache 數據落盤的具體行為,例如:

(1)innodb_flush_log_at_trx_commit

innodb_flush_log_at_trx_commit 參數用于控制基于 Page Cache 的 Redo Log Buffer 的數據落盤機制[2]。此參數用于控制以下兩個特性之間的平衡:

  • 嚴格的事務管理機制;
  • 事務提交 commit 操作執行時的高性能;

innodb_flush_log_at_trx_commit 有三個可選配置值:

  • 1(默認值):每次事務提交時都日志必須刷新到磁盤上,提供了最可靠的事務性保證;
  • 0:日志每間隔 1 秒刷新到磁盤上,這意味著在緩存中還沒有來得及刷新到磁盤上的數據在宕機時會丟失;
  • 2:日志在事務提交后以及每間隔 1 秒刷新到磁盤上,這意味著在緩存中還沒有來得及刷新到磁盤上的數據在宕機時會丟失;注意事項:配置 0 與 2 并不能保證 100% 每間隔一秒刷新到磁盤一次,這是因為 DDL 的修改以及 InnoDB 活動可能會導致日志刷新更頻繁。另一方面,由于事務調度問題,刷新頻率甚至會降低。

刷新頻率默認為 1 s,由參數 innodb_flush_log_at_timeout 進行配置。

(2)innodb_flush_method

innodb_flush_method 參數同時控制 redo log buffer 和 innodb buffer pool 緩沖區刷新策略,其中:

  • log files:redo log buffer 是 log files 在內存中的緩存區, log files 是磁盤上的 Redo Log 文件;
  • data files:innodb buffer pool 是 data files 在內存中的緩存區,data files 是磁盤上的數據文件(B+tree);innodb_flush_method 參數目前有 6 種可選配置值[3]:
  • fdatasync;
  • O_DSYNC
  • O_DIRECT
  • O_DIRECT_NO_FSYNC
  • littlesync

nosync這里只討論 Unix-like 操作系統,而不討論 Windows 系統。

其中,littlesync 與 nosync 僅僅用于內部性能測試,并不建議使用。

  • fdatasync,即取值 0,這是默認配置值。對 log files 以及 data files 都采用 fsync 的方式進行同步;
  • O_DSYNC,即取值 1。對 log files 使用 O_SYNC 打開與刷新日志文件,使用 fsync 來刷新 data files 中的數據;
  • O_DIRECT,即取值 4。利用 Direct I/O 的方式打開 data file,并且每次寫操作都通過執行 fsync 系統調用的方式落盤;
  • O_DIRECT_NO_FSYNC,即取值 5。利用 Direct I/O 的方式打開 data files,但是每次寫操作并不會調用 fsync 系統調用進行落盤;

補充說明:以 O_SYNC 方式打開文件意味著文件的每一次寫操作都直接導致將數據本身以及元數據刷新到磁盤上。

為什么有 O_DIRECT 與 O_DIRECT_NO_FSYNC 配置的區別?

首先,我們需要理解更新操作落盤分為兩個具體的子步驟:①文件數據更新落盤②文件元數據更新落盤。O_DIRECT 的在部分操作系統中會導致文件元數據不落盤,除非主動調用 fsync,為此,MySQL 提供了 O_DIRECT 以及 O_DIRECT_NO_FSYNC 這兩個配置[5]。

如果你確定在自己的操作系統上,即使不進行 fsync 調用,也能夠確保文件元數據落盤,那么請使用 O_DIRECT_NO_FSYNC 配置,這對 MySQL 性能略有幫助。否則,請使用 O_DIRECT,不然文件元數據的丟失可能會導致 MySQL 運行錯誤。

4. MySQL 日志的刷新策略

MySQL 日志刷新策略通過 sync_binlog 參數進行配置,其有 3 個可選配置:

  • sync_binlog=0:MySQL 應用將完全不負責日志同步到磁盤,將緩存中的日志數據刷新到磁盤全權交給操作系統來完成;
  • sync_binlog=1:MySQL 應用在事務提交前將緩存區的日志刷新到磁盤;
  • sync_binlog=N:當 N 不為 0 與 1 時,MySQL 在收集到 N 個日志提交后,才會將緩存區的日志同步到磁盤。事實上,這個參數也用于控制日志是通過 Write Through 還是 Write Back 策略刷新到磁盤上。

注意事項:使用 Page Cache 機制的數據刷盤機制,即使基于同步策略,即每次寫操作都要求數據直接落盤,但在數據落盤之前,數據總是先要寫于 Page Cache 中,再將 Page Cache 中的具體 Page 刷新到磁盤上。

5. MySQL 的典型配置

  • innodb_flush_log_at_trx_commit 參數配置為 1:Redo Log 走 Page Cache,并且每次寫操作的日志在事務提交前都通過 fsync 刷新到磁盤;
  • innodb_flush_method 參數配置為 O_DIRECT:InnoDB Buffer Pool 走 Direct I/O,并且每次寫操作導致的文件數據(包括文件元數據)都通過 fsync 系統調用刷新到磁盤;

寫一條 redo log 涉及到的步驟有:

  • 日志寫入 Redo Log buffer;志寫入 Redo Log buffer;
  • 日志寫入 Page Cache;
  • 通過系統調用 fsync 將 Page Cache 中的臟頁刷新到磁盤;
  • 日志提交;

修改表的一行記錄涉及到的步驟有:

  • 更新后的數據寫于 InnoDB Buffer Pool;
  • 定時進行如下邏輯(異步進行):

InnoDB Buffer Pool 臟數據進行刷新,通過文件的 write 方法進行;

文件的 write 方法直接導致數據寫于磁盤上;

定時進行文件的 fysnc 調用,確保文件元數據寫于磁盤上;

REFERENCE

[1]Buffer與Cache

[2]MySQL :: MySQL 8.0 Reference Manual :: 15.14 InnoDB Startup Options and System Variables

[3]MySQL 8.0 innodb_flush_method

[4]MySQL :: MySQL 8.0 Reference Manual :: 17.1.6.4 Binary Logging Options and Variables

[5] Why MYSQL still use fsync() to flush the data when the option is O_DIRECT?

責任編輯:武曉燕 來源: 極客重生
相關推薦

2020-07-06 15:10:05

Linux拷貝代碼

2020-07-23 15:40:54

Linux零拷貝文件

2021-08-26 06:57:53

零拷貝技術磁盤

2022-09-27 13:34:49

splice零拷貝原理

2020-11-27 09:20:56

零拷貝底層技術

2024-06-07 08:10:14

Netty操作系統零拷貝

2024-11-28 10:40:26

零拷貝技術系統

2021-03-12 13:57:13

零拷貝技術

2024-06-24 00:09:00

零拷貝技術MMapsendFile

2019-09-23 08:46:04

零拷貝 CPU內存

2024-12-04 14:45:14

零拷貝技術CPU 拷貝Zero-copy

2020-02-28 19:10:40

Linux零拷貝原理

2020-10-12 06:33:18

Zero-Copy零拷貝CPU

2023-07-29 13:45:30

了不起 Java極

2022-09-23 08:47:01

DMA網卡CPU

2024-09-26 08:53:43

2019-08-01 11:04:10

Linux磁盤I

2021-06-08 07:45:44

Go語言優化

2024-02-22 12:20:23

Linux零拷貝技術

2024-01-29 10:08:11

零拷貝Zero-copyCPU 拷貝
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 91在线观看免费视频 | 天天摸天天看 | 一区二区免费在线观看 | 在线免费亚洲视频 | 一区二区日韩 | 亚洲精品粉嫩美女一区 | 免费一区二区三区在线视频 | 亚洲一区二区在线播放 | 成人欧美一区二区三区黑人孕妇 | 中文字幕一二三区 | 999国产精品视频免费 | 性欧美精品一区二区三区在线播放 | 国产精品一区久久久久 | 精品中文字幕视频 | 日日操视频 | 波多野结衣一区二区三区在线观看 | 亚洲激情专区 | 伊人色综合久久天天五月婷 | 久久99久久| 国产一区二区精品自拍 | 欧美日韩免费一区二区三区 | 一级高清免费毛片 | 午夜精品久久久久久久久久久久久 | www.日本三级| 日本久久福利 | 丁香六月伊人 | 亚洲伊人久久综合 | 日韩av一区二区在线观看 | 国产91黄色 | 91久久精品一区二区二区 | 在线观看黄色 | 自拍视频国产 | 国产午夜精品久久久久免费视高清 | 国产目拍亚洲精品99久久精品 | 亚洲狠狠爱 | 日韩欧美国产一区二区 | 高清一区二区三区 | 成人在线免费观看av | 嫩草懂你的影院入口 | 亚洲专区在线 | 中文字幕免费视频 |