成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Kafka在行動:7步實現從RDBMS到Hadoop的實時流傳輸

大數據 Kafka Hadoop
本文目標讀者是技術人員。 繼續讀,我會圖解Kafka如何從關系數據庫管理系統(RDBMS)里流輸數據到Hive, 這可以提供一個實時分析使用案例。 為了參考方便,本文使用的組件版本是Hive 1.2.1,Flume 1.6和Kafka 0.9。

對于尋找方法快速吸收數據到Hadoop數據池的企業, Kafka是一個偉大的選擇。Kafka是什么? 它是一個分布式,可擴展的可靠消息系統,把采取發布-訂閱模型的應用程序/數據流融為一體。 這是Hadoop的技術堆棧中的關鍵部分,支持實時數據分析或物聯網數據貨幣化。

本文目標讀者是技術人員。 繼續讀,我會圖解Kafka如何從關系數據庫管理系統(RDBMS)里流輸數據到Hive, 這可以提供一個實時分析使用案例。 為了參考方便,本文使用的組件版本是Hive 1.2.1,Flume 1.6和Kafka 0.9。

如果你想看一下Kafka是什么和其用途的概述, 看看我 在Datafloq 上發布的一篇早期博客。

Kafka用武之地:整體解決方案架構

下圖顯示了在整體解決方案架構中,RDBMS的業務數據傳遞到目標 Hive 表格結合了 Kafka , Flume和Hive交易功能。

Kafka在行動:7步實現從RDBMS到Hadoop的實時流傳輸

7步實時流傳輸到Hadoop

現在深入到解決方案的詳細信息,我會告訴你如何簡單幾步實時流輸數據到Hadoop。

1. 從關系數據庫管理系統(RDBMS)提取數據

所有關系數據庫都有一個記錄最近交易的日志文件。 我們的傳輸流解決方案的***步是,在能夠傳到Hadoop的信息格式中獲得這些交易。 講完提取機制得單獨占用一篇博文–所以 如果你想了解更多此過程的信息, 請聯系我們。

2. 建立Kafka Producer

發布消息到Kafka主題的過程被稱為“生產者”。“主題”是Kafka保存的分類消息。 RDBMS的交易將被轉換為Kafka話題。 對于該例,讓我們想一想銷售團隊的數據庫,其中的交易是作為Kafka主題發表的。 建立Kafka生產者需要以下步驟:

Kafka在行動:7步實現從RDBMS到Hadoop的實時流傳輸

3. 設置 Hive

接下來,我們將在Hive中創建一張表,準備接收銷售團隊的數據庫事務。 在這個例子中,我們將創建一個客戶表:

Kafka在行動:7步實現從RDBMS到Hadoop的實時流傳輸

為了讓Hive能夠處理交易, 配置中需要以下設置:

hive.txn.manager = org.apache.hadoop.hive.ql.lockmgr.dbtxnmanager

4.設置Flume Agent,從Kafka到Hive流傳輸

現在讓我們來看看如何創建Flume代理,實現從Kafka主題中獲取數據,發送到Hive表。

遵循步驟來設置環境,然后建立Flume代理:

Kafka在行動:7步實現從RDBMS到Hadoop的實時流傳輸

接著,如下創建一個log4j屬性文件:

Kafka在行動:7步實現從RDBMS到Hadoop的實時流傳輸

然后為Flume代理使用下面的配置文件:

Kafka在行動:7步實現從RDBMS到Hadoop的實時流傳輸

5.開啟Flume代理

使用如下命令開啟Flume代理:

$ /usr/hdp/apache-flume-1.6.0/bin/flume-ng agent -n flumeagent1 -f ~/streamingdemo/flume/conf/flumetohive.conf

Kafka在行動:7步實現從RDBMS到Hadoop的實時流傳輸

6.開啟Kafka Stream

如下示例,是一個模擬交易消息, 在實際系統中需要由源數據庫生成。 例如,以下可能來自重復SQL交易的Oracle數據流,這些交易已提交到數據庫, 也可能來自GoledenGate。

Kafka在行動:7步實現從RDBMS到Hadoop的實時流傳輸

Kafka在行動:7步實現從RDBMS到Hadoop的實時流傳輸

7.接收Hive數據

以上所有完成, 現在從Kafka發送數據, 你會看到,幾秒之內,數據流就發送到Hive表了。

責任編輯:未麗燕 來源: 36大數據
相關推薦

2020-12-27 17:06:22

DevOps金融銀行

2013-08-21 13:34:52

MJPEG流傳輸C#開源C#

2020-02-10 15:27:59

融云

2019-05-09 09:42:12

蜜罐網絡攻擊漏洞

2020-02-05 09:55:43

山石網科新型冠狀病毒疫情

2013-05-21 09:26:48

移動物聯網行動

2014-06-10 15:52:23

云網絡以太網NetEvents

2020-02-10 15:13:59

百度

2017-11-06 06:31:15

個人信息信息安全快遞

2019-06-08 12:07:04

網絡 GozNym起訴書欺詐

2011-09-06 17:05:16

移動廣告

2023-07-25 16:18:15

2015-06-02 09:38:08

網絡安全宣傳周趨勢科技

2022-03-21 18:24:42

聯想

2012-03-08 10:28:34

Platform

2020-02-05 11:49:58

啟明星辰新型冠狀病毒肺炎疫情

2021-12-17 20:15:00

人工智能AI

2018-06-12 19:37:09

華為
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日日夜夜天天干 | 97久久精品午夜一区二区 | 亚洲人一区 | 99热99| 欧美日韩一区精品 | 成人欧美一区二区三区在线播放 | 亚洲一区在线日韩在线深爱 | 在线黄色影院 | 久久久久久久一区 | 一区二区久久精品 | 精品视频在线播放 | 亚洲欧美一区二区三区1000 | 久久精品一级 | 成人影音| 日韩电影免费观看中文字幕 | 一区二区高清不卡 | 国产一区二区毛片 | 91精品久久久久 | 国产视频一区在线 | av喷水| 日韩在线欧美 | 成人水多啪啪片 | 日日夜夜草 | 亚洲精品久久久蜜桃 | 天天操天天射综合网 | 人人天天操 | 狼色网| 精品欧美一区二区在线观看视频 | av第一页 | 国产激情91久久精品导航 | 91免费在线看 | 成年人国产在线观看 | 午夜视频一区 | 欧美精品久久久久 | 日韩一区二区三区视频 | 精品视频免费 | 日韩av在线免费 | 夜夜精品浪潮av一区二区三区 | 久国久产久精永久网页 | 激情婷婷成人 | av日韩一区 |