成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

微信開源PhxSQL:高可用、強一致的MySQL集群

數(shù)據(jù)庫
PhxSQL是一個兼容MySQL、服務(wù)高可用、數(shù)據(jù)強一致的關(guān)系型數(shù)據(jù)庫集群。PhxSQL以單Master多Slave方式部署,在集群內(nèi)超過一半機器存活的情況下,可自身實現(xiàn)自動Master切換,且保證數(shù)據(jù)一致性。

PhxSQL是一個兼容MySQL、服務(wù)高可用、數(shù)據(jù)強一致的關(guān)系型數(shù)據(jù)庫集群。PhxSQL以單Master多Slave方式部署,在集群內(nèi)超過一半機器存活的情況下,可自身實現(xiàn)自動Master切換,且保證數(shù)據(jù)一致性。

PhxSQL基于Percona 5.6開發(fā)。Percona是MySQL的一個分支,功能和實現(xiàn)與MySQL基本一致。因此本文后續(xù)直接把MySQL作為討論對象。

MySQL半同步復(fù)制存在缺陷,在Master進行切換的場景下,數(shù)據(jù)難以保證一致。

  • 當舊Master復(fù)制失敗時,舊Master和Updated Slave(已收到Binlog的Slave)需要回滾數(shù)據(jù)。
  • 當Master進行切換時,舊Master仍有部分Client進行讀寫。

關(guān)于MySQL半同步復(fù)制的數(shù)據(jù)一致性問題可查看微信后臺團隊公眾號文章MySQL半同步復(fù)制的數(shù)據(jù)一致性探討。

PhxSQL的設(shè)計是為了解決MySQL半同步復(fù)制的不足,使MySQL集群在Master切換過程中保證數(shù)據(jù)的一致。

PhxSQL架構(gòu)   

PhxSQL 三層架構(gòu) 

圖1 PhxSQL 三層架構(gòu)

為了解決MySQL的兩個問題(Binlog復(fù)制和Master切換),PhxSQL設(shè)計了兩個模塊(Phxbinlogsvr、Phxsqlproxy)和一個MySQL插件(Phxsync)。Phxbinlogsvr負責處理MySQL的Binlog復(fù)制和Master管理;Phxsqlproxy負責透傳Client請求到Master;Phxsync插件負責MySQL和Phxbinlogsvr的交互。 一臺部署了Phxsqlproxy,MySQL和Phxbinlogsvr的機器稱為PhxSQL Node。如圖1。

PhxSQL復(fù)制流程   

MySQL復(fù)制流程 

圖2.1 MySQL復(fù)制流程   

PhxSQL復(fù)制流程 

圖2.2 PhxSQL復(fù)制流程

圖2 MySQL和PhxSQL的數(shù)據(jù)復(fù)制流程

在PhxSQL中,Phxbinlogsvr負責管理MySQL的角色和存儲MySQL的Binlog,Phxbinlogsvr和其管理的MySQL部署在同一臺物理機上。

MySQL Master在Send Event階段不再把Binlog復(fù)制給Slave,而是通過Phxsync插件,把數(shù)據(jù)復(fù)制到Phxbinlogsvr集群。

MySQL Slave也不再從Master獲取Binlog,而是從本機的Phxbinlogsvr獲取。

Phxbinlogsvr集群使用Paxos協(xié)議進行數(shù)據(jù)復(fù)制。

PhxSQL使用PhxPaxos庫,詳情請查看微信后臺團隊公眾號文章微信自研生產(chǎn)級paxos類庫PhxPaxos實現(xiàn)原理介紹。   

Phxbinlogsvr形成一個可靠日志存儲 

圖3 Phxbinlogsvr形成一個可靠日志存儲    

重啟向Phxbinlogsvr詢問PendingBinlog狀態(tài) 

圖4 重啟向Phxbinlogsvr詢問PendingBinlog狀態(tài)

從邏輯上來看,利用Paxos協(xié)議進行復(fù)制,使Phxbinlogsvr形成一個可靠的日志存儲。PhxSQL可以看成是為MySQL增加了一個用Paxos實現(xiàn)的可靠Binlog存儲,只要集群中多數(shù)派機器存活,就可以解決半同步復(fù)制的回滾問題。如圖3。

分別從Master和Slave的角度來解釋:

Master重啟時,通過詢問Phxbinlogsvr(多數(shù)派)Pending Binlog是否存在來決定是否需要回滾。如圖4。

Slave從本機Phxbinlogsvr能拉取到的Binlog都已經(jīng)經(jīng)過Paxos協(xié)議成功復(fù)制到多數(shù)派機器,因此對于Slave來說不存在回滾的問題。

Phxbinlogsvr通過Paxos協(xié)議復(fù)制數(shù)據(jù),很好的解決了MySQL中需要手動回滾Binlog和在大集群時同時需要回滾Updated Slave上的Binlog的問題。

PhxSQL的Master管理 

多個Master同時寫入數(shù)據(jù),導(dǎo)致數(shù)據(jù)不一致 

圖5 多個Master同時寫入數(shù)據(jù),導(dǎo)致數(shù)據(jù)不一致

MySQL多Master同時寫入會導(dǎo)致數(shù)據(jù)的不一致。如圖5,機器A是舊Master,在收到機器B成為了新Master的消息之前提交了Transaction 3;而同時機器B已成為新Master,Transaction 3則會留在機器A而未復(fù)制到機器B,最終兩機的數(shù)據(jù)不一致。

MySQL多Master問題的產(chǎn)生,源于機器間無法得知當前Master的狀態(tài),***導(dǎo)致兩臺機器的數(shù)據(jù)不一致。

即使使用外部服務(wù)(例如zookeeper)也無法解根本問題。

  1. 對Master查詢和查詢之后的操作不是原子操作,無法保證操作時的準確狀態(tài)(例如機器A向外部服務(wù)查詢得知自己是Master,然后執(zhí)行復(fù)制Binlog操作。但期間出現(xiàn)故障導(dǎo)致兩個操作之間停頓了很長時間(譬如1天)。在該期間內(nèi)Master被切換,使得機器A在執(zhí)行復(fù)制Binlog時,已不再是Master,導(dǎo)致了多Master的情況發(fā)生。)
  2. Master管理依賴外部服務(wù)的穩(wěn)定性。

多Master問題由于細節(jié)太多,暫不在此討論。

PhxSQL自身進行了Master管理,具有以下特點:

  1. Master通過Paxos協(xié)議投票選出。
  2. Master帶有租約,并定時續(xù)租。租約過期后,需重新選舉新的Master。
  3. 全局只有1個Master,或者沒有Master存在。
  4. 有效拒絕過期Master的非法寫入。

PhxSQL的Master自動切換

PhxSQL實現(xiàn)了舊Master的自動數(shù)據(jù)回滾和Master管理,使得PhxSQL可以安全地實現(xiàn)Master的自動切換,提供高可用服務(wù)。和常見的MySQL切換Master方案不同,PhxSQL在切換Master之后仍然保證集群內(nèi)各機數(shù)據(jù)一致。 

 

 

 

圖6

PhxSQL自動Master流程如下:

  1. Slave機器上的Phxbinlogsvr定期檢查Master是否過期。如果過期轉(zhuǎn)第2步,否則繼續(xù)第1步;
  2. Phxbinlogsvr檢查本機MySQL是否已執(zhí)行完所有Binlog。如果已完成轉(zhuǎn)第3步,否則繼續(xù)第1步;
  3. Phxbinlogsvr發(fā)起投票選舉新的Master。如果投票成功,提升本機MySQL為Master,關(guān)閉readonly開關(guān);否則繼續(xù)第1步;
  4. 舊Master恢復(fù),本機的Phxbinlogsvr查詢發(fā)現(xiàn)已不是Master,切換MySQL角色為Slave,設(shè)置從本機Phxbinlogsvr拉取Binlog,并開啟readonly開關(guān)。

Phxsqlproxy請求透傳

Phxbinlogsvr解決了多Master同時寫入的問題,使得MySQLClient向舊Master寫入數(shù)據(jù)會產(chǎn)生失敗。雖然保證了數(shù)據(jù)的一致性,但仍存在下面2個問題:

  1. MySQLClient持續(xù)向舊Master寫入數(shù)據(jù),從而持續(xù)的失敗。(服務(wù)不可用)
  2. 部分MySQLClient向新Master寫入數(shù)據(jù),但其他MySQLClient仍然向舊Master讀取數(shù)據(jù),導(dǎo)致讀不到***的數(shù)據(jù)。 

 

 

 

圖7

上述兩個問題都是由于MySQLClient的Master信息更新不及時;部分Client沒有及時更新,使得有可能產(chǎn)生PhantomRead(兩次讀的結(jié)果不一致)。 

 

 

Phxsqlproxy的請求透傳 

圖8 Phxsqlproxy的請求透傳

若Slave機器被訪問,Phxsqlproxy則會把請求透傳到Master機器的Phxsqlproxy。由于PhxSQL Master的全局唯一性,保證了只存在一臺MySQL被訪問。從而解決了多臺機器同時被讀寫的問題。

PhxSQL性能

使用sysbench工具對PhxSQL和MySQL的半同步復(fù)制進行了性能對比。PhxSQL因為增加了Phxsqlproxy,導(dǎo)致讀性能比原生MySQL略低;但由于PhxPaxos的實現(xiàn)比MySQL的半同步更加高效,讓PhxSQL的寫性能比半同步復(fù)制更好。

PhxSQL比MySQL讀性能比原生MySQL略低,但寫性能比MySQL半同步復(fù)制更好。

  讀性能 寫性能
Client線程數(shù) QPS 耗時 QPS 耗時
200 約降低3% 耗時約增加2% 約增高25% 約降低20%
500 約降低13% 約增加10% 約增高16% 約降低10%

測試環(huán)境和結(jié)果如下:

機型信息

CPU : Intel(R) Xeon(R) CPU E5-2420 0 @ 1.90GHz * 24

內(nèi)存 : 32G

磁盤 : SSD Raid10

網(wǎng)絡(luò)互Ping耗時

Master -> Slave : 3 ~ 4ms

Client -> Master : 4ms

壓測工具和參數(shù)

sysbench --oltp-tables-count=10 --oltp-table-size=1000000 --num-threads=500 --max-requests=100000 --report-interval=1 --max-time=200

壓測內(nèi)容

PhxSQL和半同步復(fù)制在Client線程200和500的環(huán)境下進行下面方式的壓測:

  • insert.lua (100%寫)
  • select.lua (0%寫)
  • OLTP.lua (20%寫)

壓測結(jié)果

Client線程數(shù):200

  insert.lua (100%寫)
  QPS 耗時

PhxSQL

5076 39.34/56.93

MySQL

半同步

4055 49.27/66.64
  select.lua (0%寫)
  QPS 耗時

PhxSQL

46334 4.21/5.12

MySQL

半同步

47528 4.10/5.00
  OLTP.lua (20%寫)
  QPS 耗時

PhxSQL

25657 140.16/186.39

MySQL

半同步

20391 176.39/226.76

Client線程數(shù):500 

 

  insert.lua (100%寫)
  QPS 耗時

PhxSQL

8260 60.41/83.14

MySQL

半同步

7072 70.60/91.72
  select.lua (0%寫)
  QPS 耗時

PhxSQL

105928 4.58/5.81

MySQL

半同步

121535 4.17/5.08
  OLTP.lua (20%寫)
  QPS 耗時

PhxSQL

46543 192.93/242.85

MySQL

半同步

33229 270.38/345.84

注:耗時分別為測試結(jié)果的平均耗時/95%分位數(shù)耗時,單位ms

總結(jié)

PhxSQL解決了MySQL半同步復(fù)制中數(shù)據(jù)回滾和多Master的問題,使其能實現(xiàn)自動Master切換且保證數(shù)據(jù)一致。PhxSQL因為增加了Phxsqlproxy,導(dǎo)致讀性能比原生MySQL略低;但由于PhxPaxos的實現(xiàn)比MySQL的半同步更加高效,讓PhxSQL的寫性能比半同步復(fù)制更好。

責任編輯:龐桂玉 來源: 王道在線
相關(guān)推薦

2016-09-09 12:51:23

PhxSQL原則局限性

2017-04-17 09:54:34

分布式數(shù)據(jù)庫PhxSQL

2017-08-07 18:09:04

強一致高可用自動容災(zāi)

2024-10-18 10:04:01

2018-01-12 14:20:37

數(shù)據(jù)庫MySQL高可用架構(gòu)

2019-08-27 15:56:44

MySQL 互聯(lián)網(wǎng)數(shù)據(jù)庫

2014-07-11 09:43:34

MySQL集群

2022-06-07 12:59:40

大數(shù)據(jù)系統(tǒng)分布式

2018-04-26 15:52:59

數(shù)據(jù)庫MySQL高可用組件

2021-10-20 09:58:46

開發(fā)視圖系統(tǒng)

2025-06-09 00:00:55

2012-02-15 22:40:23

heartbeat高可用

2013-10-15 14:32:32

統(tǒng)一通信用戶體驗漸進式溝通

2013-05-15 10:42:24

華為eSpace UC2.統(tǒng)一通信

2017-06-20 08:19:56

MySQL集群架構(gòu)

2023-11-07 07:30:18

Hadoop高可用

2015-08-24 09:28:09

微軟

2024-02-27 09:48:25

Redis集群數(shù)據(jù)庫

2024-01-10 08:01:55

高并發(fā)場景悲觀鎖

2025-04-03 09:51:37

點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 亚洲一区二区久久 | 久久精品国产免费 | 国产美女福利在线观看 | 黄色一级大片在线免费看产 | 日韩一区二区成人 | 国产亚洲精品久久情网 | 久久综合久色欧美综合狠狠 | 香蕉久久久久久 | 国产精品日日做人人爱 | 黄色精品 | 亚洲一区国产精品 | 欧美天堂在线观看 | 亚洲精品在线播放 | 91欧美| 亚洲成人www | 在线视频成人 | 国产资源在线观看 | 国产a视频 | 久久久九九| 一级毛片,一级毛片 | 国产亚洲成av人片在线观看桃 | 99久久国产 | 欧美一区二区在线视频 | 欧美三区 | 成人精品在线观看 | 欧美做暖暖视频 | 欧美片网站免费 | 色妹子综合网 | 69性欧美高清影院 | 国产精品毛片 | 一级一级一级毛片 | 全免费a级毛片免费看视频免 | av综合站| 久久中文字幕视频 | 欧美一级黄色片免费观看 | 一级毛片视频在线观看 | 伊人伊人 | 三级av在线 | 在线不卡av | 精品一区二区三区四区视频 | 干一干操一操 |