成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

聊聊分布式數(shù)據(jù)庫(kù)對(duì)2PC的優(yōu)化

運(yùn)維 數(shù)據(jù)庫(kù)運(yùn)維 分布式
在單體數(shù)據(jù)庫(kù)時(shí)代,數(shù)據(jù)庫(kù)本身就支持ACID事務(wù),開發(fā)人員甚至只要在方法上加一個(gè)@Transactional注解就可以搞定事務(wù)了,非常簡(jiǎn)單。

[[375525]]

本文轉(zhuǎn)載自微信公眾號(hào)「jinjunzhu」,作者jinjunzhu。轉(zhuǎn)載本文請(qǐng)聯(lián)系jinjunzhu公眾號(hào)。

在單體數(shù)據(jù)庫(kù)時(shí)代,數(shù)據(jù)庫(kù)本身就支持ACID事務(wù),開發(fā)人員甚至只要在方法上加一個(gè)@Transactional注解就可以搞定事務(wù)了,非常簡(jiǎn)單。但是到了分庫(kù)分表和分布式數(shù)據(jù)庫(kù)時(shí)代,傳統(tǒng)數(shù)據(jù)庫(kù)的ACID屬性只能在單節(jié)點(diǎn)上起作用,全局事務(wù)需要一個(gè)全局的事務(wù)管理器來維護(hù),復(fù)雜性很高。

而在分布式事務(wù)領(lǐng)域,全局事務(wù)使用的最多的指導(dǎo)方案就是2PC,也叫兩階段提交,但是2PC也有一些缺陷,今天我們就來看看分布式數(shù)據(jù)庫(kù)是怎么對(duì)這些缺陷做優(yōu)化的。

兩階段提交(2PC)

兩階段提交協(xié)議主要有2種,一種是應(yīng)用層的TCC,比如阿里巴巴的seata就實(shí)現(xiàn)了TCC模式,這種模式的特點(diǎn)是每個(gè)服務(wù)都需要提供try/confirm/cancel這3個(gè)實(shí)現(xiàn),這3個(gè)實(shí)現(xiàn)需要在業(yè)務(wù)代碼中實(shí)現(xiàn),對(duì)業(yè)務(wù)侵入高。

今天我分享的是面向資源的2PC協(xié)議,最早由Jim Gray提出,整個(gè)事務(wù)分為2個(gè)階段,prepare階段和commit階段,這2個(gè)階段由協(xié)調(diào)節(jié)點(diǎn)和DB資源管理器協(xié)作完成。

這里我們還是以經(jīng)典的電商系統(tǒng)為例,整個(gè)系統(tǒng)分為訂單、賬戶和庫(kù)存3個(gè)服務(wù),我們收到客戶的購(gòu)買請(qǐng)求后,協(xié)調(diào)節(jié)點(diǎn)需要協(xié)調(diào)訂單服務(wù)生成訂單,賬戶服務(wù)扣減商品款,庫(kù)存服務(wù)扣減商品庫(kù)存,假如這3個(gè)服務(wù)的數(shù)據(jù)庫(kù)在不同切片上,這個(gè)協(xié)調(diào)過程具體如下:

1.prepare階段

協(xié)調(diào)節(jié)點(diǎn)向所有服務(wù)發(fā)送prepare請(qǐng)求,每個(gè)服務(wù)收到prepare請(qǐng)求后會(huì)嘗試執(zhí)行本地事務(wù),但不會(huì)真正提交本地事務(wù)。這個(gè)嘗試執(zhí)行的過程會(huì)檢查到是否具備執(zhí)行事務(wù)的條件,比如資源是否被鎖定等,當(dāng)所有服務(wù)都嘗試執(zhí)行成功后會(huì)給協(xié)調(diào)節(jié)點(diǎn)返回一個(gè)yes,如下圖:

2.commit/rollback階段

如果prepare階段所有服務(wù)有返回了yes,那么協(xié)調(diào)節(jié)點(diǎn)就會(huì)通知各個(gè)服務(wù)執(zhí)行commit操作,這時(shí)各個(gè)服務(wù)就會(huì)真正的提交本地事務(wù)。如下圖:

如果prepare階段有服務(wù)返回了no,協(xié)調(diào)節(jié)點(diǎn)就需要通知所有服務(wù)進(jìn)行本地事務(wù)回滾。

2PC存在問題

上面我們簡(jiǎn)單地分析了2PC協(xié)議的執(zhí)行過程,那么2PC有什么問題呢?

1.性能問題

本地事務(wù)在prepare階段鎖定資源,比如賬戶服務(wù)要扣減xiaoming這個(gè)賬戶的金額100元,那必須把xiaoming這個(gè)賬戶先鎖定。這樣如果有其他事務(wù)也要修改xiaoming這個(gè)賬戶,就必須等待前面的事務(wù)完成。這樣就造成了延遲和性能下降。

2.協(xié)調(diào)節(jié)點(diǎn)單點(diǎn)故障

協(xié)調(diào)節(jié)點(diǎn)是單節(jié)點(diǎn)的,如果發(fā)生故障,整個(gè)事務(wù)會(huì)一直阻塞。比如第一個(gè)階段prepare成功了,但是第二個(gè)階段協(xié)調(diào)節(jié)點(diǎn)發(fā)出commit指令之前宕機(jī)了,所有服務(wù)的數(shù)據(jù)資源處于鎖定狀態(tài),后面的事務(wù)只能等待。

3.數(shù)據(jù)不一致

如果第一階段prepare成功了,但是第二階段commit的時(shí)候,如果協(xié)調(diào)節(jié)點(diǎn)通知庫(kù)存服務(wù)失敗了,這樣就相當(dāng)于生成了訂單,扣減了賬戶,但是沒有扣減庫(kù)存。這導(dǎo)致了數(shù)據(jù)的不一致。

Percolator模型

主流的NewSQL數(shù)據(jù)庫(kù),比如TiDB,是用Percolator模型來解決的。如下官網(wǎng)鏈接:

  1. https://pingcap.com/blog-cn/percolator-and-txn/ 

Percolator模型來自于Google論文:

  1. 《Large-scale Incremental Processing Using Distributed Transactions and Notifications》 

原文可以看下面連接,網(wǎng)上也有好多翻譯版的:

  1. https://www.cs.princeton.edu/courses/archive/fall10/cos597B/papers/percolator-osdi10.pdf 

Percolator的前提是本地事務(wù)的數(shù)據(jù)庫(kù)支持多版本并發(fā)控制協(xié)議,也就是mvcc。現(xiàn)在主流數(shù)據(jù)庫(kù)比如mysql、oracle都是支持的。

a)初始階段

還是看上面我們提到的經(jīng)典電商案例,初始階段,我們假設(shè)訂單數(shù)量是0,賬戶服務(wù)是1000,庫(kù)存服務(wù)是100,客戶下了1個(gè)訂單后,訂單服務(wù)增加1個(gè)訂單,賬戶服務(wù)扣除金額100,庫(kù)存服務(wù)扣除商品數(shù)量1。各個(gè)切片的初始數(shù)據(jù)如下表:

":"前面的是時(shí)間戳或者數(shù)據(jù)版本,后面是數(shù)據(jù)值。這3張表中,第一條記錄不保存真正的數(shù)據(jù),而是保存了指向真正數(shù)據(jù)的指針,比如訂單表中,6這個(gè)版本的數(shù)據(jù)指向了5個(gè)版本的數(shù)據(jù),訂單數(shù)量是0。

b)prepare階段

在prepare階段,協(xié)調(diào)節(jié)點(diǎn)向每個(gè)服務(wù)發(fā)送了prepare命令,這3張表分別進(jìn)入了prepare階段。在prepare階段,Percolator定義了主鎖的概念,每個(gè)分布式事務(wù)只能有一個(gè)服務(wù)獲得主鎖,比如本案例的訂單服務(wù),其他服務(wù)的鎖指向這個(gè)主鎖的指針,如下表:

prepare階段,每個(gè)服務(wù)會(huì)寫日志,并且根據(jù)時(shí)間戳記錄事務(wù)的私有版本,這樣其他事務(wù)就不能操作這三條數(shù)據(jù)了。

c)commit階段

在commit階段,協(xié)調(diào)節(jié)點(diǎn)只需要跟訂單服務(wù)通信,因?yàn)橛唵畏?wù)擁有primary lock,也就是說協(xié)調(diào)節(jié)點(diǎn)只跟擁有primary lock的切片通信。這時(shí)數(shù)據(jù)如下表:

這時(shí)我們注意到除了order服務(wù)的鎖沒有了,而且增加了版本8指向版本7,說明訂單服務(wù)已經(jīng)沒有私有版本了,但是賬戶服務(wù)和庫(kù)存服務(wù)的私有版本還在。Percolator的獨(dú)特之處就是在這里,它會(huì)啟動(dòng)異步線程來更新賬戶服務(wù)和庫(kù)存服務(wù)。最終數(shù)據(jù)如下表:

因?yàn)閰f(xié)調(diào)節(jié)點(diǎn)只需要跟獲取primary lock的切片進(jìn)行通信,要么成功要么失敗這樣就避免了commit時(shí)節(jié)點(diǎn)不能全部成功導(dǎo)致的數(shù)據(jù)不一致問題。

而prepare階段記錄了日志,如果某個(gè)切片commit失敗,可以根據(jù)日志進(jìn)行再次commit,這樣就保證了數(shù)據(jù)最終一致。

如果協(xié)調(diào)節(jié)點(diǎn)宕機(jī)了,異步線程可以做資源的釋放工作,避免了因單點(diǎn)故障通信失敗造成的資源不能釋放。

這里我們要注意2點(diǎn):

  • primary lock的選擇是隨機(jī)的,比如本例中并不一定會(huì)選擇訂單服務(wù)
  • 協(xié)調(diào)節(jié)點(diǎn)發(fā)送commit后訂單服務(wù)先提交成功,這時(shí)如果其他事務(wù)要讀取賬戶服務(wù)和庫(kù)存服務(wù)的2條數(shù)據(jù),雖然2條數(shù)據(jù)上面還有l(wèi)ock,但是查找primary@order.bal發(fā)現(xiàn)已提交,所以是可以讀取的。

總結(jié)

2PC協(xié)議有3個(gè)問題,性能問題、單點(diǎn)故障和數(shù)據(jù)不一致。

Percolator模型簡(jiǎn)化了協(xié)調(diào)節(jié)點(diǎn)和切片的通信流程,讓協(xié)調(diào)節(jié)點(diǎn)只跟其中一個(gè)primary切片通信,一方面,減少了通信開銷,另一方面,避免了因?yàn)閱吸c(diǎn)故障,commit階段部分節(jié)點(diǎn)通信失敗導(dǎo)致的數(shù)據(jù)不一致問題。

Percolator在prepare階段記錄了日志,這樣即使協(xié)調(diào)節(jié)點(diǎn)故障了,恢復(fù)后也可以根據(jù)日志來做事務(wù)恢復(fù)。

Percolator使用異步線程來做資源的釋放工作,這樣即使協(xié)調(diào)節(jié)點(diǎn)故障了,也不用擔(dān)心資源得不到釋放。

知名的NewSQL數(shù)據(jù)庫(kù)TiDB就是參照Percolator模型來對(duì)2PC協(xié)議進(jìn)行優(yōu)化的。

但是我們要知道,2PC的性能問題還是存在的,好在主流的分布式數(shù)據(jù)庫(kù)都做了優(yōu)化,性能損耗只會(huì)越來越小。

 

責(zé)任編輯:武曉燕 來源: jinjunzhu
相關(guān)推薦

2024-09-09 09:19:57

2023-12-11 09:11:14

TDSQL技術(shù)架構(gòu)

2022-03-10 06:36:59

分布式數(shù)據(jù)庫(kù)排序

2022-03-02 09:13:00

分布式數(shù)據(jù)庫(kù)Sharding

2022-12-14 08:00:00

數(shù)據(jù)庫(kù)分布式數(shù)據(jù)庫(kù)隔離

2023-05-26 07:55:06

分布式數(shù)據(jù)庫(kù)SQL

2022-12-01 07:36:40

2021-03-06 23:28:28

2PC3PC模型

2021-12-20 15:44:28

ShardingSph分布式數(shù)據(jù)庫(kù)開源

2023-12-05 07:30:40

KlustronBa數(shù)據(jù)庫(kù)

2023-07-28 07:56:45

分布式數(shù)據(jù)庫(kù)SQL

2023-07-31 08:27:55

分布式數(shù)據(jù)庫(kù)架構(gòu)

2023-11-14 08:24:59

性能Scylla系統(tǒng)架構(gòu)

2022-06-09 10:19:10

分布式數(shù)據(jù)庫(kù)

2011-05-19 09:18:48

分布式數(shù)據(jù)庫(kù)

2020-06-23 09:35:13

分布式數(shù)據(jù)庫(kù)網(wǎng)絡(luò)

2022-08-01 18:33:45

關(guān)系型數(shù)據(jù)庫(kù)大數(shù)據(jù)

2023-03-07 09:49:04

分布式數(shù)據(jù)庫(kù)

2024-03-11 08:57:02

國(guó)產(chǎn)數(shù)據(jù)庫(kù)證券

2024-03-15 07:33:02

分布式數(shù)據(jù)庫(kù)索引數(shù)據(jù)結(jié)構(gòu)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 国产精品日韩在线 | 俺去俺来也www色官网cms | 日韩视频精品在线 | 久久久久久国产精品 | 337p日本欧洲亚洲大胆鲁鲁 | 91久久| 成人免费毛片在线观看 | 91av视频 | 亚洲欧美在线免费观看 | 亚洲一卡二卡 | 国产有码 | 91观看| 女人毛片a毛片久久人人 | 天堂久| 久久久久久久久久久久久91 | 91av在线看 | 欧美精品一区三区 | 99久久精品免费看国产四区 | 日韩中文一区二区三区 | 精品国产欧美 | 欧美精品一二三区 | 开操网 | 国产精品污www一区二区三区 | 99re视频精品 | 久久久久久久久久久久91 | 国产精品视频一区二区三 | 色男人的天堂 | 91久久精品国产 | 欧美精品在线看 | 九九激情视频 | 国产成人a亚洲精品 | aaa在线| 999国产精品视频免费 | 国产.com| 国产视频一区在线 | 日韩高清成人 | 久久久av| 成人精品毛片国产亚洲av十九禁 | 久久久久久高潮国产精品视 | 亚洲欧美一区二区三区国产精品 | 亚洲va国产日韩欧美精品色婷婷 |