一款優秀數據庫中間件的不完全解析
本文內容概述
數據庫中間件有啥用
架構剖析之高屋建瓴
2.1. 整體概述
2.2. 組件圖看架構
細節剖析之一葉知秋
3.1. 配置加載和bean初始化
3.2. 細說讀寫分離
總結
Part1數據庫中間件有啥用
有一天,你去三亞玩耍,就想玩個沖浪,即時你不差錢,難道還要自己采買快艇、滑板等等裝備來滿足這為數不多的心血來潮么。租一個就行了嘛。這其實就是連接池的作用。
數據庫中間件可以理解為是一種具有連接池功能,但比連接池更高級的、帶很多附加功能的輔助組件,不僅可以租沖浪板,還可以提供地點推薦、上保險等等各類服務。
從網上的資料看,zdal應該算是半開源的,好像是之前開源過,但后續沒有準備維護,然后就刪除了,不過github被fork下來好多,隨便一搜就是一片,當前,只是老的版本。目前螞蟻內部的zdal好像已經更新到zdal5了吧,那咱可就看不到了。
越復雜的系統,數據庫中間件的作用越大。就拿zdal來說,它提供分庫分表,結果集合并,sql解析,數據庫failover動態切換等數據訪問層統一解決方案。下面就一起來看下,其內部實現是怎么樣的。
Part2架構剖析之高屋建瓴
2.1整體概述
如上圖所示,zdal有四個重要的組成部分:
價值體現--客戶端Client包。對外暴露基本操作接口,用于業務層簡單黑盒的操作數據源;業務只和client交互,動態切換/路由等邏輯只需要進行規則配置,相關邏輯由zdal實現。
核心功能--連接管理datasource包。最核心的能力,提供多種類型數據庫的連接管理;不管功能多花哨,最終目的還是為了解決數據庫連接的問題。
關鍵能力--SQL解析parser包。基礎SQL解析能力;解析sql類型、字段名稱、數據庫等等,配合規則進行路由
擴展能力--庫表路由rule包。根據parser解析出的字段確定邏輯庫表和物理庫表。
2.2組件圖看架構
組件圖對整體架構和各組件及相互聯系的理解可以起到很好的幫助。一個簡版的組件圖畫了好久,還有不少錯,不過大概是這么個意思,哎,基本功要丟~
對照上圖可以比較清晰的看到:
Client包對應用層暴露的數據源、負責監聽配置動態變更的監聽組件、負責加載組織各部分的配置組件、負責加載spring bean 和庫表規則的配置組件;
Client中加載了規則組件,實現邏輯表和數據庫的路由規則。
Client中的庫表配置調用datasource中的數據源管理服務并構建連接池的連接池;
Client中的SqlDispatcher服務調用SQL解析組件實現SQL解析。
Part3細節剖析之一葉知秋
3.1配置加載和bean初始化
大部分情況下,我們使用如mybatis這樣的ORM框架來進行數據庫操作,其實不管是ORM還是其他方式,應用層都需要對數據源進行配置。
所以,client對外暴露了一個符合JDBC標準的datasource數據源,用來滿足應用層ORM等框架配置數據源的要求--ZdalDataSource
如圖片被壓縮看不清,后臺回復<zdal類圖>獲取
- //只提供了一個init方法,這也是spring啟動時時,必須要調用的初始化方法,所有功能,都從這里開始
- public class ZdalDataSource extends AbstractZdalDataSource implements DataSource{
- public void init() {
- try {
- super.initZdalDataSource();
- } catch (Exception e) {
- CONFIG_LOGGER.error("...");
- throw new ZdalClientException(e);
- }
- }
ZdalDataSource#init() 方法即為配置加載的核心入口,init中負責加載spring配置,根據配置初始化數據源,并創建連接池,同時,將邏輯表和物理庫的對應關系都維護起來供后續路由調用。
- /*父類的init方法*/
- protected void initZdalDataSource() {
- /*用FileSystemXmlApplicationContext方式加載配置文件中的數據源和規則,轉化成zdalConfig對象*/
- this.zdalConfig = ZdalConfigurationLoader.getInstance().getZdalConfiguration(appName,dbmode, appDsName, configPath);
- this.dbConfigType = zdalConfig.getDataSourceConfigType();
- this.dbType = zdalConfig.getDbType();
- //初始化數據源
- this.initDataSources(zdalConfig);
- this.inited.set(true);
- }
- }
從上面的類圖和這里的兩個入口方法大概了解到zdal配置加載的啟動流程。下面我們就來詳細看一下,讀寫分離和分庫分表的規則是怎么被加載,怎么起作用的。
3.2細說讀寫分離
讀寫分離配置的加載
首先,我們需要有數據源的相關配置,如下圖:
圖片此XML配置會在init方法被調用時,被初始化,解析成ZdalConfig類的屬性,ZdalConfig類的主要成員見下面代碼:
- public class ZdalConfig {
- /** key=dsName;value=DataSourceParameter 所有物理數據源的配置項,比如用戶名,密碼,庫名等 */
- private Map<String, DataSourceParameter> dataSourceParameters = new ConcurrentHashMap<String, DataSourceParameter>();
- /** 邏輯數據源和物理數據源的對應關系:key=logicDsName,value=physicDsName */
- private Map<String, String> logicPhysicsDsNames = new ConcurrentHashMap<String, String>();
- /** 數據源的讀寫規則,比如只讀,或讀寫等配置*/
- private Map<String, String> groupRules = new ConcurrentHashMap<String, String>();
- /** 異常轉移的數據源規則*/
- private Map<String, String> failoverRules = new ConcurrentHashMap<String, String>();
- //一份完整的讀寫分離和分庫分表規則配置
- private AppRule appRootRule;
可以看到,xml中的規則,被解析到xxxRules里。這里以groupRules為例,failover同理。
下一步則是通過解析得到的zdalConfig 來初始化數據源:
- protected final void initDataSources(ZdalConfig zdalConfig) {
- //DataSourceParameter中存的是數據源參數,如用戶名密碼,最大最小連接數等
- for (Entry<String, DataSourceParameter> entry : zdalConfig.getDataSourceParameters().entrySet()) {
- try {
- //初始化連接池
- ZDataSource zDataSource = new ZDataSource(/*設置最大最小連接數*/createDataSourceDO(entry.getValue(),zdalConfig.getDbType(), appDsName + "." + entry.getKey()));
- this.dataSourcesMap.put(entry.getKey(), zDataSource);
- } catch (Exception e) {
- //...
- }
- }
- //其他分支略,只看最簡單的分組模式
- if (dbConfigType.isGroup()) {
- //讀寫配置賦值
- this.rwDataSourcePoolConfig = zdalConfig.getGroupRules();
- //初始化多份讀庫下的負載均衡
- this.initForLoadBalance(zdalConfig.getDbType());
- }
- //注冊監聽:為了滿足動態切換
- this.initConfigListener();
- }
initForLoadBalance的方法如下:
- private void initForLoadBalance(DBType dbType) {
- Map<String, DBSelector> dsSelectors = this.buildRwDbSelectors(this.rwDataSourcePoolConfig);
- this.runtimeConfigHolder.set(new ZdalRuntime(dsSelectors));
- this.setDbTypeForDBSelector(dbType);
- }
可以看到,首先構建出了DB選擇器,然后賦值給了runtimeConfigHolder供運行時獲取。而構建DB選擇器的時候,其實是按讀寫兩個維度,把所有數據源都構建了一遍,即group_r和group_w下都包含5個數據源,只不過各自的權重不一樣:
- //比如按上面的配置寫庫只有一個,但是也會包含全數據源
- group_0_w_0 :< bean:read0DataSource , writeWeight:0>
- group_0_w_1 :< bean:writeDataSource , writeWeight:10>
- group_0_w_2 :< bean:read1DataSource , writeWeight:0>
- group_0_w_3 :< bean:read2DataSource , writeWeight:0>
- group_0_w_4 :< bean:read3DataSource , writeWeight:0>
- //上述就是寫相關的DBSelecter的內容。
讀寫分離怎么起作用
以delete為例,更新刪除是要操作寫庫的
- public void delete(ZdalDataSource dataSource) {
- String deleteSql = "delete from test";
- Connection conn = null;
- PreparedStatement pst = null;
- try {
- conn = dataSource.getConnection();
- pst = conn.prepareStatement(deleteSql);
- pst.execute();
- } catch (Exception e) {
- //...
- } finally {
- //資源關閉
- }
- }
getConnection會從上文中提到的runtimeConfigHolder中獲取DBSelecter,然后執行execute方法
- public boolean execute() throws SQLException {
- SqlType sqlType = getSqlType(sql);
- // SELECT相關的就選擇group_r對應的DBSelecter
- if (sqlType == SqlType.SELECT || sqlType == SqlType.SELECT_FOR_UPDATE|| sqlType == SqlType.SELECT_FROM_DUAL) {
- //略
- return true;
- //update/delete相關的就選擇group_w對應的DBSelecter
- } else if (sqlType == SqlType.INSERT || sqlType == SqlType.UPDATE|| sqlType == SqlType.DELETE) {
- if (super.dbConfigType == DataSourceConfigType.GROUP) {
- executeUpdate0();
- } else {
- executeUpdate();
- }
- return false;
- }
如果是讀取相關的,那就選_r的DBSelecter,如果是寫相關的,那就選_W的DBSelecter。那么executeUpdate0中是怎么執行區分讀寫數據源的呢,其實就是把這一組的數據源根據權重篩選一遍。
- // WeightRandom#select(int[], java.lang.String[])
- private String select(int[] areaEnds, String[] keys) {
- //這里的areaEnds數組,是一個累加范圍值數據
- //比如三個庫權重 10 9 8
- //那么areaEnds就是 10 19 27 是對每個權重的累加,最后一個值是總和
- int sum = areaEnds[areaEnds.length - 1];
- //這樣隨機出來的數,是符合權重分布的
- int rand = random.nextInt(sum);
- for (int i = 0; i < areaEnds.length; i++) {
- if (rand < areaEnds[i]) {
- return keys[i];
- }
- return null;
- }
Part4總結
本篇文章,把阿里數據庫中間件相關的組件和加載流程進行了總結,就一個最基本的分組讀寫分離的流程,對內部實現進行了闡述。說是解析,其實是提供給大家一種閱讀的思路,畢竟篇幅有限,如果對中間件感興趣的同學,可以fork下代碼,按上述邏輯自己閱讀下。
看源碼時,比如dubbo這些中間件其實是比較容易入手的,因為他們都依托于Spring進行JavaBean的裝載,所有,對Spring容器暴露的那些init、load方法,就是很好的切入點。個人思路,希望對大家有所幫助。