成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Kafka為什么會這么快

大數(shù)據(jù) Kafka
在系統(tǒng)設計中,會用到消息中間件來做服務異步化,系統(tǒng)解耦,或者是做流量削峰,常用的消息中間件有rabbitMq,activeMq以及阿里的RocketMq等等,都各自有各自的優(yōu)勢,但是就吞吐量來說,kafka是其中的佼佼者。

在系統(tǒng)設計中,會用到消息中間件來做服務異步化,系統(tǒng)解耦,或者是做流量削峰,常用的消息中間件有rabbitMq,activeMq以及阿里的RocketMq等等,都各自有各自的優(yōu)勢,但是就吞吐量來說,kafka是其中的佼佼者。在單機情況下,網(wǎng)友做的對比如下:

 

Kafka為什么會這么快
性能對比

為什么kafka會這么快呢?

發(fā)布訂閱模式

一個普通的發(fā)布訂閱模型如下圖所示:

 

Kafka為什么會這么快
發(fā)布訂閱模式

以kafka為例,生產(chǎn)者產(chǎn)生消息,并將消息Push到kafka集群,消費者主動去kafka集群Pull數(shù)據(jù)。這種模型有個好處,消費的速率完全由消費者控制,kafka集群類似于一個蓄水池,避免因生產(chǎn)者產(chǎn)生消息過快消費者來不及消費而導致消費者被壓垮的現(xiàn)象。

kafka為什么快要從兩方面分析,生產(chǎn)者產(chǎn)生的消息寫入集群時快和消費者消費消息時從集群讀取快。

寫入快

寫入快主要是兩方面原因:順序寫入和MMFile。

順序寫入

kafka將消息存儲在硬盤,通常認為硬盤的讀寫是比較慢,但是為什么kafka快呢?平時所說的磁盤讀寫慢是指隨機讀寫比較慢,因為磁盤每次隨機讀寫都要物理尋址,這是非常耗時的操作,順序讀寫的速度還是比較快的。如下圖所示:

 

Kafka為什么會這么快
順序寫入

kafka每次收到新的消息之后都會將消息存儲在尾部,按照順序存儲消息。但是消息一旦存儲無法刪除。

當消費者消費時也是順序消費,每個消費者會有一個偏移量,記錄當前消費的消息的位置。如下圖所示:

 

Kafka為什么會這么快
順序消費

MMFile

MMFile是指Memory Mapped Files,即內(nèi)存映射技術。操作系統(tǒng)為了解決內(nèi)存和硬盤讀寫速度之間的差異,采用了內(nèi)存映射技術,內(nèi)存被劃分為若干頁,每一頁被映射到一塊磁盤空間,因為內(nèi)存是遠遠小于磁盤空間的,所以分頁經(jīng)常會按照一定的算法加載到內(nèi)存,例如先進先出(FIFO),最近最少使用(LRU)等。內(nèi)存中分頁和磁盤空間對應,操作系統(tǒng)會在合適的時候將內(nèi)存分頁中的數(shù)據(jù)定時刷磁盤中去。這種方式為什么可以提高寫入效率呢?通常CPU執(zhí)行過程中為了安全分為內(nèi)核態(tài)和用戶態(tài)。只有內(nèi)核態(tài)才能操作iO設備,內(nèi)存空間分為內(nèi)核空間和用戶空間。通常內(nèi)存中的數(shù)據(jù)寫入到磁盤要以下幾步:

 

Kafka為什么會這么快
write操作

數(shù)據(jù)會先從用戶空間拷貝到內(nèi)核空間,然后再由內(nèi)核空間寫入IO設備。而MMFile則省去了一次用數(shù)據(jù)從戶空間到內(nèi)核空間復制的開銷。

讀取快

讀取快主要是因為零拷貝(Zero Copy)技術。上面介紹到數(shù)據(jù)從內(nèi)存空間寫入磁盤的步驟,那么從磁盤讀取數(shù)據(jù)剛好相反,具體過程如下:

 

Kafka為什么會這么快
read操作

數(shù)據(jù)先從磁盤讀取到內(nèi)核空間,然后再從內(nèi)核空間復制到用戶空間,然后再到Socket,最后傳輸?shù)较M者。

Linux提供了一種sendFile系統(tǒng)調(diào)用,可以將數(shù)據(jù)直接由磁盤拷貝到內(nèi)核空間。省去了一次數(shù)據(jù)從用戶空間到內(nèi)核空間的復制。這就是所謂的零拷貝技術。

上面從讀寫兩個角度分析了為什么kafka吞吐量高,其實還有一個重要的原因。

批量數(shù)據(jù)壓縮

kafka不會對每個消息都做壓縮,而是對一批消息壓縮,然后將數(shù)據(jù)統(tǒng)一發(fā)送。將所有的消息變?yōu)橐粋€批量文件,然后直接丟給消費者。

綜上所述,kafka通過MMFile技術快速將數(shù)據(jù)順序寫入磁盤,在讀取時通過零拷貝技術快速讀取,然后通過批量數(shù)據(jù)壓縮將數(shù)據(jù)傳輸?shù)较M者。這就是kafka快的秘訣。然而魚與熊掌不可兼得,速度和可靠性不可能同時滿足,需要根據(jù)實際業(yè)務情況在二者之間作出取舍。例如當用kafka做日志聚合和網(wǎng)站用戶行為分析時速度要比可靠性重要,而在某些消息不允許丟失的場景,可靠性可能是首選。

責任編輯:未麗燕 來源: 今日頭條
相關推薦

2024-02-26 21:15:20

Kafka緩存參數(shù)

2024-11-26 08:52:34

SQL優(yōu)化Kafka

2020-02-27 15:44:41

Nginx服務器反向代理

2020-02-27 21:03:30

調(diào)度器架構效率

2013-06-14 10:12:22

共享并行

2013-06-19 10:55:40

Disruptor并發(fā)框架

2013-06-17 14:41:10

Disruptor并發(fā)編程

2023-08-29 07:46:08

Redis數(shù)據(jù)ReHash

2020-10-15 09:19:36

Elasticsear查詢速度

2021-05-27 20:56:51

esbuild 工具JavaScript

2012-08-17 10:01:07

云計算

2024-09-14 09:41:17

2024-07-30 09:01:12

2020-10-13 17:54:18

開發(fā)Kafka數(shù)據(jù)

2013-06-18 10:30:45

Disruptor框架

2021-03-22 08:30:33

Kafka源碼架構開發(fā)技術

2021-05-31 07:44:08

Kafka分布式系統(tǒng)

2020-08-13 09:19:10

Kafka存儲MQ

2023-03-21 08:02:36

Redis6.0IO多線程

2017-06-06 16:30:55

戴爾交付保障
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲成人精品在线 | 91天堂网| 91精品入口蜜桃 | 国产精品一区视频 | 精品久久久久香蕉网 | 欧美在线资源 | 亚洲精品视频在线观看免费 | 伊人久久精品一区二区三区 | a在线视频 | 精品久久一区二区 | 国产精品美女在线观看 | 三级黄色片在线观看 | 成人羞羞国产免费视频 | 国产亚洲精品久久久久动 | 国产福利在线播放 | 亚洲精品国产第一综合99久久 | 老外几下就让我高潮了 | 婷婷久久一区 | 亚洲精品高清视频在线观看 | 欧美v在线观看 | 最新国产视频 | 农村真人裸体丰满少妇毛片 | 亚洲视频不卡 | 免费在线观看一区二区 | 羞视频在线观看 | 国产精品久久久久aaaa樱花 | 拍真实国产伦偷精品 | 做a的各种视频 | 亚洲国产精品99久久久久久久久 | 国产精品久久国产精品久久 | 97精品超碰一区二区三区 | 国产精品成人一区二区三区 | 三级成人在线 | 日韩在线成人 | 国产色片在线 | 国产精品久久9 | 看羞羞视频免费 | 成人欧美一区二区三区黑人孕妇 | 日韩精品一区二区三区在线观看 | 成人黄色电影在线观看 | 亚洲国产精品久久久久秋霞不卡 |