成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

一個數據開發人員使用的輔助工具

運維 數據庫運維
這是為數據開發人員使用的輔助工具,用于數據庫之間的表同步,說同步并不嚴謹,因為不是實時更新的,更確切的說法是復制,可以方便的從一個數據庫復制表到另一個數據庫,以下遇到同步的詞請理解為復制。

 [[389867]]

介紹

需求背景:

有很多業務系統,他們的數據庫是相互獨立的,俗稱數據孤島,為了做數據統計分析,就需要把這些數據歸集在一個數據庫中,比如數據倉庫,然后多表關聯查詢,方便開發數據應用。希望能有這樣的工具,指定兩個數據庫和表名,就可以將表從源數據庫拷貝到目標數據庫中。具體需求如下:

  • 能自動同步表結構,如:源表加字段,目標表自動加字段。
  • 支持增量或全量復制數據,比如按日期進行復制數據。
  • 支持指定字段同步,只同步關心的那些字段。
  • 支持主流的關系型數據庫: mysql、db2、postgresql、oracle、sqlserver
  • 源表和目標表表名可以不同,字段名也可以不同(已存在目標表的情況下)

因為自己要用,我就自己寫了一個,順便熟悉下 java 開發(之前一直用 Python,不得不說,Java 真浪費時間),本程序的最大用處就是構建集市或數倉所需要的基礎層數據源,歡迎感興趣的朋友一起加入。

程序的使用方法

Docker 方式:

這里用到三個容器:

  • app 也就是主程序本身,app 容器使用的程序文件就是 release 目錄下的文件,已經做了綁定。
  • mysql 測試用的,作為源數據庫,已提前放好了有 7000 條測試數據的表 somenzz_users。
  • postgres 測試用的,作為目標數據庫,沒有數據。

先部署,執行 docker-compose up -d 就會自動完成應用和數據庫的部署:

 

  1. $ git clone https://github.com/somenzz/database-sync.git 
  2. $ cd database-sync 
  3. $ docker-compose up -d 
  4. Creating database-sync_postgres_1 ... done 
  5. Creating database-sync_app_1      ... done 
  6. Creating database-sync_mysql_1    ... done 

這樣三個容器就啟動了,使用 docker ps -a |grep database-sync 可以查看到三個正在運行的容器:

 

 

 

 

現在直接使用 docker exec -i database-sync_app_1 java -jar database-sync-1.3.jar 來執行程序:

 

 

 

 

mysql 容器已有測試數據,release/config/config.json 已經配置好了數據庫的連接,因此可以直接試用,以下演示的是從 mysql 復制表和數據到 postgres:

1. 全量復制,自動建表:

 

  1. docker exec -i database-sync_app_1 java -jar database-sync-1.3.jar mysql_test testdb somenzz_users postgres_test public users --sync-ddl 

 

 

 

如果你不想每次都敲 docker exec -i database-sync_app_1 ,可以進入容器內部執行:

 

  1. (py38env) ➜  database-sync git:(master) ✗ docker exec -it database-sync_app_1 /bin/bash 
  2. root@063b1dc76fe1:/app# ls 
  3. config database-sync-1.3.jar  lib  logs 
  4. root@063b1dc76fe1:/app# java -jar database-sync-1.3.jar mysql_test testdb somenzz_users postgres_test public users -sd 

2. 增量復制:

 

  1. root@063b1dc76fe1:/app# java -jar database-sync-1.3.jar mysql_test testdb somenzz_users postgres_test public zz_users "create_at >= '2018-01-09'" 

 

 

 

3. 指定字段:

 

  1. root@063b1dc76fe1:/app# java -jar database-sync-1.3.jar mysql_test testdb somenzz_users postgres_test public zz_users -ff="user_id,name,age" -tf="user_id,name,age" "create_at >= '2018-01-09'" 

 

 

 

普通方式

程序運行前確保已安裝 java 1.8 或后續版本,已經安裝 maven,然后 clone 源碼,打包:

 

  1. git clone https://gitee.com/somenzz/database-sync.git 
  2. cd database-sync 
  3. mvn package 

此時你會看到 target 目錄,將 target 下的 lib 目錄 和 database-sync-1.3.jar 復制出來,放在同一目錄下,然后再創建一個 config 目錄,在 config 下新建一個 config.json 文件寫入配置信息,然后將這個目錄壓縮,就可以傳到服務器運行了,請注意先充分測試,jdk 要求 1.8+

 

  1. [aaron@hdp002 /home/aaron/App/Java/database-sync]$ ls -ltr 
  2. total 48 
  3. drwxr-xr-x 2 aaron aaron  4096 Apr 23  2020 lib 
  4. -rwxrw-r-- 1 aaron aaron   157 Jun 23  2020 run.sh 
  5. drwxrwxr-x 2 aaron aaron  4096 Jul  3  2020 logs 
  6. -rw-rw-r-- 1 aaron aaron 24773 Mar 16  2021 database-sync-1.3.jar 
  7. drwxr-xr-x 7 aaron aaron  4096 Aug  3  2020 jdk1.8.0_231 
  8. drwxrwxr-x 2 aaron aaron  4096 Feb 19 17:07 config 

你也可以直接下載我打包好的使用。

程序名稱叫 database-sync,運行方式是這樣的:

 

  1. (py38env) ➜  target git:(master) ✗ java -jar database-sync-1.3.jar -h       
  2. Usage:  
  3. java -jar database-sync-1.0.jar [options] {fromDB} {fromSchema} {fromTable} {toDB} {toSchema} {toTable} [whereClause] 
  4. options: 
  5.         -v or --version                            :print version then exit 
  6.         -h or --help                               :print help info then exit 
  7.         -sd or --sync-ddl                          :auto synchronize table structure 
  8.         -ff=col1,col2 or --from-fields=col1,col2   :specify from fields 
  9.         -tf=col3,col4 or --to-fields=col3,col4     :specify to fields 
  10.         --no-feature or -nf                        :will not use database's feature 

幫助說明:

[] 中括號里的內容表示選填,例如 [options] 表示 options 下的參數不是必須的。

1、其中 options 參數解釋如下:

  • --sync-ddl 或者 -sd : 加入該參數會自動同步表結構。
  • --from_fields=col1,col2 或者 -ff=col1,col2 : 指定原表的字段序列,注意 = 前后不能有空格。
  • --to_fields=col3,col4 或者 -tf=col3,col4 : 指定目標表的字段序列,注意 = 前后不能有空格。

2、whereClause 表示 where 條件,用于增量更新,程序再插入數據前先按照 where 條件進行清理數據,然后按照 where 條件從原表進行讀取數據。whereClause 最好使用雙引號包起來,表示一個完整的參數。如:"jyrq='2020-12-31'"

{} 大括號里的內容表示必填。

fromDb 是指配置在 config.json 的數據庫信息的鍵,假如有以下配置文件:

 

  1.       "postgres":{ 
  2.         "type":"postgres"
  3.         "driver":"org.postgresql.Driver"
  4.         "url":"jdbc:postgresql://localhost:5432/apidb"
  5.         "user""postgres"
  6.         "password":"aaron"
  7.         "encoding""utf-8" 
  8.     }, 
  9.  
  10.  
  11.     "aarondb":{ 
  12.         "type":"mysql"
  13.         "driver":"com.mysql.cj.jdbc.Driver"
  14.         "url":"jdbc:mysql://localhost:3306/aarondb?useSSL=false&characterEncoding=utf8&serverTimezone=UTC"
  15.         "user""aaron"
  16.         "password":"aaron" 
  17.     } 

fromDb、toDb 可以是 aarondb 或者 postgres。

  • fromSchema 讀取數據的表的模式名,可以填寫 "".
  • fromTable 讀取數據的表明,必須提供。
  • toSchema 寫入數據表的模式名,可以填寫 "",可以和 fromSchema 不同.
  • toTable 寫入數據表的表名,必須提供,當寫入表不存在時,自動按讀取表的表結構創建,可以和 fromTable 不同。

全量、增量、指定字段的使用樣例請參考 Docker 方式。

配置文件說明

配置文件位于 config/config.json,如下所示:

 

  1.     "sjwb":{ 
  2.         "type":"db2"
  3.         "driver":"com.ibm.db2.jcc.DB2Driver"
  4.         "url":"jdbc:db2://192.168.1.*:50000/wbsj"
  5.         "user""****"
  6.         "password":"****"
  7.         "tbspace_ddl""/*這里可以放置指定表空間的語句*/"
  8.         "encoding":"utf-8" 
  9.     }, 
  10.  
  11.     "dw_test":{ 
  12.         "type":"db2"
  13.         "driver":"com.ibm.db2.jcc.DB2Driver"
  14.         "url":"jdbc:db2://192.168.169.*:60990/dwdb"
  15.         "user""****"
  16.         "password":"****"
  17.         "encoding":"gbk" 
  18.     }, 
  19.  
  20.     "postgres":{ 
  21.         "type":"postgres"
  22.         "driver":"org.postgresql.Driver"
  23.         "url":"jdbc:postgresql://10.99.**.**:5432/apidb"
  24.         "user""****"
  25.         "password":"****"
  26.         "tbspace_ddl""WITH (compression=no, orientation=orc, version=0.12)\ntablespace hdfs\n"
  27.         "encoding":"utf-8" 
  28.     }, 
  29.  
  30.  
  31.     "aarondb":{ 
  32.         "type":"mysql"
  33.         "driver":"com.mysql.cj.jdbc.Driver"
  34.         "url":"jdbc:mysql://localhost:3306/aarondb?useSSL=false&characterEncoding=utf8&serverTimezone=UTC"
  35.         "user""****"
  36.         "password":"****"
  37.         "encoding":"utf-8" 
  38.     }, 
  39.  
  40.     "buffer-rows": 100000 

配置文件說明:

type 表示數據庫類型,均為小寫:

  • mysql
  • postgres
  • db2
  • oracle
  • sqlserver

tbspace_ddl 表示自動建表時指定的表空間,該選項不是必需的,可以刪除。

buffer-rows 表示讀取多少行時一塊寫入目標數據庫,根據服務器內存大小自己做調整,100000 行提交一次滿足大多數情況了。

encoding 用于表結構同步時確定字段長度,比如說源庫的字段是 gbk varchar(10),目標庫是 utf-8,那么就應該為 varchar(15),這樣字段有中文就不會出現截斷或插入失敗問題,程序這里 2 倍,也就是 varchar(20) ,這樣字段長度不會出現小數位。

最后的話

提高數據庫間表的復制效率,如果不需要對源表字段進行轉換,就丟掉低效的 datastage 和 kettle 吧。

 

責任編輯:華軒 來源: Python七號
相關推薦

2012-05-25 13:19:48

Web

2019-06-03 14:20:30

Java數據庫大數據工具

2012-11-30 09:42:48

iOS開發輔助工具資源

2013-11-21 10:56:33

iOS工具資源

2020-06-09 07:57:47

前端開發代碼

2019-08-14 15:56:23

2024-07-31 08:50:20

2018-04-08 10:08:43

開發人員工具

2012-05-14 18:35:20

Windows Pho

2021-04-12 22:24:01

Java開發程序員

2021-11-12 06:03:10

開發人員開發安全意識

2019-10-25 10:21:10

React 工具JavaScript

2015-02-10 09:24:04

Web開發JavaScript工具

2023-08-30 08:01:37

前端CSS

2012-03-20 13:58:50

JavaScript

2013-06-13 10:15:20

WebWeb工具Web開發人員

2021-01-13 22:50:21

開發Web工具

2010-11-02 15:26:32

MVC開發工具

2014-02-26 11:18:02

Android開發偷懶高效

2012-07-20 10:46:44

Web
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产成人黄色 | 成人午夜激情 | 免费一区 | 全免费a级毛片免费看视频免 | 久国产精品 | 伊人看片| 亚洲精品第一页 | 毛片入口| 综合二区 | 久久久久国产一级毛片 | 一区二区三区四区不卡视频 | 91精品国产综合久久香蕉麻豆 | 久久久成人网 | 国产片侵犯亲女视频播放 | 北条麻妃av一区二区三区 | 91国自视频 | 亚洲网站在线播放 | 亚洲视频一区 | 亚洲1区 | 精品视频一区在线 | 成人黄色在线观看 | 国产精品久久久久久久免费大片 | 免费观看黄色一级片 | 日本精品一区二区 | 成人亚洲视频 | 欧美一区二区三区免费在线观看 | av天天看 | 久久久久久免费精品一区二区三区 | 午夜资源 | 亚洲国产欧美一区 | 日韩电影一区二区三区 | 成人在线视频一区 | 精品国产99 | 欧美国产精品一区二区三区 | 国产成人精品a视频一区www | 精品99久久久久久 | 国产精品久久毛片av大全日韩 | 国产最新精品视频 | 国产在线中文字幕 | 国产日韩一区二区三区 | 欧美精品a∨在线观看不卡 国产精品久久国产精品 |