成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Oceanbase一個千億級海量數據庫

數據庫 其他數據庫
淘寶Oceanbase設計之初對淘寶的在線存儲需求進行分析發現:淘寶的數據總量比較大,未來一段時間,比如五年之內的數據規模為百TB級別,千億條記錄,另外,數據膨脹很快,傳統的分庫分表對業務造成很大的壓力,必須設計自動化的分布式系統;然而,在線存儲每天的修改量很小,大多數情況下單機的內存就能存放下。因此,我們采用將動態數據和靜態數據分離的辦法。

 

有一些同學問我,Oceanbase的創新點在哪里? 從大學的數據結構課程可以知道,數據量比較大時,有兩種數據結構很常用:哈希表和B+樹,分布式系統也是類似的。如下圖:

 

Amazon的系統實現了一個分布式哈希表,而Google Bigtable, Yahoo PNUTS,Microsoft SQL Azure實現了一顆分布式B+樹。分布式哈希表實現相對簡單,但只支持隨機讀取;而分布式B+樹支持范圍查詢,但實現比較復雜,主要有兩個難點:

1, 狀態數據的持久化和遷移。更新操作改變系統的狀態,數據庫系統中更新操作首先以事務提交日志(MySQL稱為binlog, NOSQL稱為commit log)寫入到磁盤,為了保證可靠性,commit log需要復制多份并保證它們之間的一致性。另外,機器宕機時需要通過commit log記錄的狀態修改信息將服務遷移到集群中的其它節點。

2, 子表的分裂和合并。B+樹實現的難點在于樹節點的分裂與合并,在分布式系統中,數據被順序劃分為大小在幾十到幾百MB大小的數據范圍,一般稱為子表,相當于B+樹結構中的葉子節點。由于每個子表在系統中存儲多份,需要保證多個副本之間的分裂點是一致的。由于子表在分裂的同時也有更新操作,保證多個副本之間一致是比較困難的。

對于這兩個問題,不同的系統有不同的解決方法:

1, 狀態維持。Google Bigtable將狀態數據寫入到GFS中,由GFS提供可靠性保證,但GFS本身是一個巨大的工程;Yahoo PNUTS將狀態數據寫入到分布式消息中間件,Yahoo內部稱為Yahoo Message Broker;Microsoft SQL Azure直接通過網絡將數據復制到多機,由于一臺機器服務多個子表,這些子表的副本可能分布在整個集群中,因此,任何兩臺機器都可能建立數據復制的網絡通道,需要處理與這些通道有關的異常情況。

2, 子表分裂。由于底層有GFS保證可靠性,Google Bigtable設計時保證每一個子表同時只被一臺機器(Tablet Server)服務;Yahoo PNUTS通過引入復雜的兩節點提交(Two-phase commit)協議協調多個副本之間的一致性,使得他們的分裂點相同;Microsoft SQL Azure干脆不支持子表分裂,犧牲一部分擴展性從而簡化系統設計。

淘寶Oceanbase設計之初對淘寶的在線存儲需求進行分析發現:淘寶的數據總量比較大,未來一段時間,比如五年之內的數據規模為百TB級別,千億條記錄,另外,數據膨脹很快,傳統的分庫分表對業務造成很大的壓力,必須設計自動化的分布式系統;然而,在線存儲每天的修改量很小,大多數情況下單機的內存就能存放下。因此,我們采用將動態數據和靜態數據分離的辦法。動態數據的數據量小,采用集中式的方法解決,這樣,狀態數據維持從一個分布式的問題轉化為單機的問題;靜態數據的數據量大,采用分布式的方法解決,因為靜態數據基本不變,實現時不需要復雜的線程同步機制,另外,保證靜態數據的多個副本之間一致性是比較容易的,簡化了子表的分裂和合并操作。通過這樣的權衡,淘寶Oceanbase以一種很簡單的方式滿足了未來一段時間的在線存儲需求,并且還獲得了一些其它特性,如高效支持跨行跨表事務,這對于淘寶的業務是非常重要的。另外,我們之所以敢于做這樣的權衡,還有一個重要的原因:我們內部已經思考了很多關于動態數據由集中式變為分布式的方案,即使我們對需求估計有些偏差,也可以很快修改原有系統進一步提高可擴展性。

【編輯推薦】

 

  1. 淘寶海量數據庫之克服隨機IO難題
  2. 數據庫如何抵抗隨機IO的問題、方法與現實
  3. 一步一步設計你的數據庫之不可輕視的需求分析
  4. 養成一個SQL好習慣帶來一筆大財富
  5. MySQL中創建及優化索引組織結構的思路
責任編輯:艾婧 來源: sunvince的專欄
相關推薦

2011-09-01 10:54:28

OceanBase數據庫海量

2011-09-01 10:10:56

OceanBase海量淘寶

2015-04-02 11:02:39

阿里巴巴OceanBase

2019-07-29 09:37:44

海量數據企業級私有云

2023-11-29 12:12:24

Oceanbase數據庫

2011-03-28 08:47:46

海量數據庫管理中韓數據庫專家

2015-04-20 17:29:44

2017-05-18 12:16:03

LinuxPythonNoSql

2021-05-14 10:45:21

PythonNoSQL數據庫

2011-07-20 13:40:00

SQLite數據庫查詢數據

2011-05-12 09:19:36

海量數據庫管理

2018-02-25 17:30:18

2011-06-03 09:22:04

OracleOracle應用服務器

2011-08-18 18:18:05

MySQL數據庫優化

2012-05-11 10:24:05

SQL數據庫SQLitl

2021-08-04 05:49:40

數據庫數時序數據庫技術

2023-03-30 22:32:21

2013-04-26 16:18:29

大數據全球技術峰會

2011-03-28 17:07:14

海量數據庫

2011-03-25 09:09:29

算法數據庫
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产日韩精品视频 | 欧美视频免费 | 看av片网站 | 午夜影视大全 | 欧美激情国产日韩精品一区18 | 欧美日韩一区二区三区不卡视频 | 国产一区免费 | 99热国产免费| 国产a级黄色录像 | 日日骚av | 伊人网伊人网 | 97精品国产97久久久久久免费 | 欧美成人一级 | 91福利在线观看 | 欧美xxxx做受欧美 | 日韩欧美国产精品 | 亚洲精品乱码久久久久久蜜桃 | 国产一区二区麻豆 | 久久69精品久久久久久久电影好 | 一区二区免费 | 成年免费在线观看 | 亚洲国产二区 | 免费播放一级片 | 亚洲男人天堂 | 国产精品久久久久久久久免费软件 | 国产免费拔擦拔擦8x高清 | 亚洲国产成人精品久久 | 成人性视频免费网站 | 国产精品欧美日韩 | 国产精品毛片av | 成人免费视频在线观看 | 二区在线视频 | 亚洲一区欧美 | 亚洲91精品 | 亚洲一区精品在线 | 亚洲精久 | 国产精品91网站 | 99久久国产免费 | 久久久.com | 欧美 日本 国产 | 免费在线h视频 |