當前哪個分布式數據庫產品更好?選型最需要關注哪些要素?
分布式數據庫應用場景及產品對比分析探討?
請教:不同廠商產品之間的對比分析、優劣勢?主要使用的應用場景及分析,有哪些是不適宜使用的?目前產品本身,技術上還存在哪些不足,使用上需要規避哪些?
問題來自@lding1985 銀行軟件開發工程師,下文來自twt社區眾多同行實踐經驗分享,歡迎大家參與交流,各抒己見。
@孔再華 中國民生銀行 數據庫運維工程師:
不同商品的優劣勢在這里回答估計會有很多人不同意。總的來說分布數據庫還在成長階段。我把分布式分為讀寫分離,基于中間件的分布式和集群式的分布式產品。總的來說基于業務實際性能需求挑選就好。使用分布式產品,一方面要關注性能和穩定性,另一方面也需要關注管理性和生態。因為大家都是剛起步,也沒個沉淀了十年的成熟產品。所以誰能走到最后真看不好。個人會偏向開發能力和支持能力更強的大廠。
分布式的主要場景就是渠道類的有著高并發需求的系統,例如手機銀行,支付等。其他復雜查詢多、數據不適合統一分片的,就很不適合。
目前產品都不太成熟,連ACID和隔離性都需要好好測測。分布式的事務以及全局一致性都需要特別關注一下。整體性能瓶頸也是有上限的,不是說真的可以橫向無限擴展。因此在真的挑選一個分布式數據庫產品的時候,這些核心的問題都保證,然后再考慮維護性。
@Amygo 分布式事務數據庫 數據庫管理員:
橫向無限擴展:這個是無法做到的;真正核心:實時一致分布式事務、全局序列、全局唯一索引、悲觀鎖等是至關重要的。
@wanglaye 某大型金融機構 項目經理:
在進行分布式數據庫選型前,以下幾個關鍵要素,作為選型的參考:可擴展性、高并發性、高可用性、支持分布式事務、易于維護、兼容性。
在設計分布式數據庫架構時,要考慮高可用、負載均衡、網絡、存儲、監控與告警、備份與恢復、災備、日常運維、應用適配和優化等多方面的方案規劃。尤其需要特別注意網絡延時、多應用數據隔離、分布式事務處理、數據歸檔等難點問題。
有的企業比較看重自主可控。
此外,還需考慮遷移改造成本。在選型時一定要考慮原數據庫遷移至分布式數據庫的改造成本,包括 sql 語句、數據遷移等方面的改造難度和改造工作量,也包括與分布式數據庫匹配的硬件投入(某些分布式數據庫對于硬件的要求比較高,硬件會影響數據庫性能。)
具體哪個產品好沒有絕對的結果,看你們銀行的側重點。
@catalinaspring 金融行業 項目經理:
實際工作中,采用Shared Nothing 架構的分布式并行數據庫集群,要求具備高性能、高可用、高擴展特性,可以為超大規模數據(級)管理提供高性價比的通用計算平臺,并能夠廣泛地用于支撐各類數據倉庫系統、BI系統和決策支持系統。同時,能夠支持用戶的高并發訪問及提交多樣、靈活的SQL語句,后臺做好不同級別用戶的權限管控和動態資源分配。
@eianbo PBCCRC IT顧問:
使用MySQL的較多吧,免費。
@潘延晟 系統工程師:
之前給朋友幫忙的一個例子,讓我有些感想。
朋友用的MySQL數據庫,不過由于程序開發時部分語句不夠優化,從系統層能看到數據庫的資源占用很高,后來朋友找了個專門的DBA做了優化后就降下來了。
我覺得目前市場上主流的產品可能在技術 、性能上的差異會有,但并不一定能夠很好的分析出來,畢竟沒有統一的一個測試平臺來測試它們。不同的程序、運行環境,都會讓數據庫的效果產生不同的結果。
現在IT系統的整合度越來越高,再不像以前,網絡推系統,系統推數據庫,數據庫推應用,現在是任何環節都要統一。
@Amygo 分布式事務數據庫 數據庫管理員:
以下分布式事務數據庫產品信息,依據國產數據庫廠商公開資料整理,僅供參考。