成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Cassandra集群數據初始化的實現步驟

數據庫 其他數據庫
本文將討論的是Cassandra集群數據初始化的相關問題,包括每一步的注意問題,二次排序的問題。

一個Cassandra集群需要投入時候,絕大多數時候都是會有初始化數據的,比如博客網站中所有的博客數據,數據分析網站中所有的網頁信息,電子商務網站中所有的商品信息等等。這些初始化數據往往量的都非常大,不適用直接使用Thrift API的方式(談談Cassandra的客戶端)直接導入。Facebook曾經使用了叫做BinaryMemTable的方式導入(使用Binary Memtable將大量數據導入Cassandra)。

我們在集群中安裝Hadoop和Cassandra,假設我們需要初始化的數據可以導入成一個平面文件(txt文件),然后上傳到HDFS中。其中每一臺機器既是Cassandra的節點也是Hadoop的Slave機器,并且每一臺Slave機器的Reduce的個數為1。

為了將大量的數據導入到集群中,我個人認為有如下2中方案。

使用BinaryMemTable

1.運行MapReduceJob

在Mapper中按照Key對導入的數據進行分區。

在Reducer中,configure階段進行以下操作:

1. 初始化Cassandra的消息服務和Gossip服務。

2. 創建Cassandra的文件目錄。

3. 關閉Cassandra的壓縮功能。

4. 等待一個Range的delay時間。

在Reducer中,reduce階段進行以下操作:

1. 根據每一個key創建其對應的ColumnFamily

2. 創建RowMutation的消息

3. 將消息發送到集群中所有應該獲得該數據的節點中。

在Reducer中,close階段進行以下操作:

1. 等待消息服務中所有的消息發送完畢。

2. 完畢Cassandra的消息服務和Gossip服務。

2.啟動Cassandra集群

在Cassandra啟動后,手動執行壓縮操作,合并之前產生的大量的SSTable文件。

自己生成SSTable文件

1.啟動Cassandra集群

啟動后,確保整個集群的ring已經建立起來。

2.運行MapReduceJob

在Mapper中,configure階段進行以下操作:

1. 隨機連接一臺Cassandra機器

2. 獲取Cassandra集群的token map

在Mapper中,map階段進行以下操作:

1. 根據數據的key對應的節點地址劃分數據

二次排序

1. 將節點地址和key相應的數據作為一個Group

2. Group中的數據按照key的升序排序

在Reducer中,configure階段進行以下操作:

1. 為每一個ColumnFamily創建一個SStableWriter實例。

在Reducer中,reduce階段進行以下操作:

1. 根據每一個key創建其對應的ColumnFamily

2. 調用相應的SStableWriter.append()方法,將數據寫入到指定的SStable文件中。

在Reducer中,close階段進行以下操作:

1. 調用每一個ColumnFamily的SStableWriter.closeAndOpenReader()方法。

2. 將生成的SSTable文件SCP到應該屬于的Cassandra的data目錄中。

3.重新啟動Cassandra集群

原文標題:Cassandra集群數據初始化方案的構想

鏈接:http://www.cnblogs.com/gpcuster/archive/2010/07/03/1770452.html

【編輯推薦】

  1. MongoDB CEO談NoSQL的大數據量處理能力
  2. 拋棄關系數據庫 PHP程序員應了解MongoDB的五件事
  3. MongoDB,無模式文檔型數據庫簡介
  4. 關系數據庫的末日是否已經來臨
  5. 扔掉沉沒成本 嘗試關系數據庫替代品OODBMS

 

責任編輯:彭凡 來源: 博客園
相關推薦

2011-03-16 10:52:20

2023-11-12 23:08:17

C++初始化

2009-08-31 10:38:34

C#變量初始化

2010-02-01 14:21:24

C++初始化列表

2010-01-05 15:35:21

.NET Framew

2009-05-20 10:58:15

數據庫查詢初始化

2012-03-13 13:38:42

Java

2009-06-10 16:17:00

Netbeans JT初始化

2021-07-07 05:00:17

初始化源碼

2011-06-17 15:29:44

C#對象初始化器集合初始化器

2010-07-28 10:22:33

FlexApplica

2021-03-12 10:30:11

SpringMVC流程初始化

2022-07-06 10:37:45

SpringServlet初始化

2020-12-03 09:50:52

容器IoC流程

2010-01-13 18:01:43

VB.NET數組初始化

2010-06-21 10:25:09

Linux APM

2019-11-04 13:50:36

Java數組編程語言

2009-09-08 09:48:34

LINQ初始化數組

2009-11-11 15:29:15

ADO初始化

2010-01-22 15:47:37

VB.NET初始化網格
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品www | 久久av一区二区三区 | 国产探花在线观看视频 | 看一级毛片 | 成人免费视频 | 久久国产区| 自拍偷拍欧美 | 中文字幕成人av | 亚洲国产视频一区二区 | 在线一区二区三区 | 国产在线精品一区二区三区 | 污污免费网站 | 毛片一级黄色 | 91精品国产91久久久久久最新 | 国产精品一区二区三区在线播放 | 久久大| 国产精品美女久久久久久久网站 | 免费在线成人 | 亚洲444kkkk在线观看最新 | 久久国产秒 | 欧美成人精品一区二区三区 | 欧美日韩在线一区二区 | 欧美精品一区三区 | 国产成人久久精品一区二区三区 | 日本特黄a级高清免费大片 国产精品久久性 | 国产精品免费在线 | 久久夜视频 | 浴室洗澡偷拍一区二区 | 国产精品久久久久久久久久久免费看 | 午夜电影福利 | 性做久久久久久免费观看欧美 | 午夜专区 | 久久久久久高潮国产精品视 | 欧美日韩精品久久久免费观看 | 成年男女免费视频网站 | 国内自拍偷拍一区 | 日韩一区二区福利视频 | av网站免费看 | 香蕉超碰| 国产日韩欧美 | 成人自拍视频网站 |