成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Hadoop 3的主要優缺點

大數據 Hadoop
本文的目的是討論Hadoop 3.0的優缺點。隨著Hadoop 3.0中引入了許多更改,它已成為更好的產品。

本文的目的是討論Hadoop 3.0的優缺點。隨著Hadoop 3.0中引入了許多更改,它已成為更好的產品。

 

[[312348]]

Hadoop 3的主要優缺點

Hadoop旨在存儲和管理大量數據。Hadoop有許多優點,例如,它是免費和開源的,易于使用的,其性能等。但是,另一方面,它也有一些缺點。因此,讓我們開始探索Hadoop的主要優點和缺點。

Hadoop的優勢

Hadoop易于使用,可擴展且具有成本效益。在這里,我們將討論Hadoop的12大優勢

 

Hadoop 3的主要優缺點

Hadoop的優勢

1.各種數據源

Hadoop存儲各種數據。數據可以來自各種來源,并且可以是結構化或非結構化的形式。Hadoop可以從各種數據中獲取價值。Hadoop可以接受文本文件,XML文件,圖像,CSV文件等中的數據。

2.高性價比

Hadoop是一種經濟的解決方案,因為它使用集群來存儲數據。而硬件是便宜的機器,因此將節點添加到框架的成本不是很高。在Hadoop 3.0中,只有50%的存儲開銷,而在Hadoop2.x中只有200%。由于冗余數據顯著減少,因此需要較少的機器來存儲數據。

3.表現

Hadoop及其分布式處理和分布式存儲體系結構可高速處理大量數據。Hadoop甚至在2008年擊敗超級計算機成為最快的計算機。它將輸入數據文件劃分為多個塊,并將數據存儲在多個節點上的block塊中。它還將用戶提交的任務分為多個子任務,這些子任務分配給包含所需數據的這些工作節點,并且這些子任務并行運行,從而提高了性能。

4.容錯

在Hadoop 3.0中,擦除編碼提供了容錯能力。例如,6個數據塊通過使用擦除編碼技術產生3個奇偶校驗塊,因此HDFS總共存儲了這9個塊。如果任何節點發生故障,可以使用這些奇偶校驗塊和其余數據塊來恢復受影響的數據塊。

5.高度可用

在Hadoop 2.x中,HDFS架構具有一個活動的NameNode和一個Standby NameNode,因此,如果NameNode發生故障,則我們可以依靠備用NameNode。但是Hadoop 3.0支持多個備用NameNode,從而使系統具有更高的可用性,因此如果兩個或多個NameNode崩潰,它可以繼續運行。

6.低網絡流量

在Hadoop中,用戶提交的每個作業都被分為多個獨立的子任務,并且這些子任務被分配給數據節點,從而將少量代碼移動到數據中,而不是將大量數據移動到代碼中,從而導致低網絡流量。

7.高通量

吞吐量是指單位時間內完成的工作。Hadoop以分布式方式存儲數據,從而可以輕松地使用分布式處理。給定的作業分為多個小作業,這些作業并行處理數據塊,從而提供高吞吐量。

8.開源

Hadoop是一種開源技術,即其源代碼可免費獲得。我們可以修改源代碼以適合特定要求。

9.可擴展

Hadoop按照水平可伸縮性原理工作,即我們需要將整個計算機添加到節點群集中,而不要像添加RAM,磁盤等那樣更改計算機的配置,這被稱為垂直可伸縮性??梢詫⒐濣c動態添加到Hadoop集群,使其成為可擴展的框架。

10.易于使用

Hadoop框架提供分布式編程模型,MapReduce的程序員只需按固定的模板編寫分布式計算程序,而不需要關心他們如何實現分布式處理,它是在后臺自動完成。

11.相容性

大數據的大多數新興技術都與Hadoop兼容,例如Spark,Flink等。它們具有在Hadoop上作為后端工作的處理引擎,即我們將Hadoop用作它們的數據存儲平臺。

12.支持多種語言

開發人員可以在Hadoop上使用多種語言(例如C,C ++,Perl,Python,Ruby和Groovy)進行編碼。

Hadoop的缺點

 

Hadoop 3的主要優缺點

Hadoop的缺點

1.小文件問題

Hadoop適用于處理相對較大的文件,但是涉及到處理大量小文件的時(小文件比Hadoop的塊大小小得多的文件,默認情況下,該塊大小可以為128MB或256MB),Hadoop效率不高。這些大量的小文件使Namenode過載,因為Namenode存儲了系統的名稱空間,并使Hadoop難以運行。

2.天生脆弱

Hadoop用Java編寫,Java是一種廣泛使用的編程語言,因此它容易被網絡犯罪分子利用,這使得Hadoop容易受到安全漏洞的攻擊。

3.處理費用

在Hadoop中,數據是從磁盤讀取并寫入磁盤的,這在我們處理兆兆字節和PB級數據時使讀/寫操作非常昂貴。Hadoop無法執行內存中計算,因此會增加處理開銷。

4.僅支持批處理

Hadoop核心是一個批處理引擎,該引擎在流處理方面效率不高。它不能以低延遲實時生成輸出。它僅適用于我們在處理之前預先收集并存儲在文件中的數據。

5.迭代處理

Hadoop本身無法進行迭代處理。機器學習 或迭代處理具有周期性的數據流,而Hadoop的數據是在多個階段鏈中流動的,其中一個階段的輸出成為另一階段的輸入。

6.安全性

為了安全起見,Hadoop使用難以管理的Kerberos身份驗證。它缺少存儲和網絡級別的加密,這是一個主要問題。

總結– Hadoop的優缺點

業界使用的每種軟件都有其自身的缺點和好處。如果該軟件對業務至關重要,則可以利用其優勢并采取措施以最大程度地減少故障。我們可以看到Hadoop的優點大于缺點,這使其成為滿足大數據需求的強大解決方案。

責任編輯:未麗燕 來源: 今日頭條
相關推薦

2021-10-09 09:52:17

云存儲公共云遷移

2018-05-17 11:05:56

2009-06-19 18:36:15

JPAHibernate

2010-06-21 14:14:33

OSPF協議

2022-07-18 13:36:13

零信任網絡安全

2021-04-12 14:40:50

人臉識別面部識別人工智能

2020-02-18 10:16:42

React數據代碼

2010-11-11 17:15:13

SQL Server視

2023-05-17 11:07:08

2016-09-08 14:50:59

AndroidiPhoneiOS

2023-03-27 15:37:43

自動化測試開發

2010-11-23 13:57:50

MySQL獨立表空間

2020-09-21 11:10:06

Docker運維面試

2019-01-07 09:00:53

Kubernetes容器公共云

2013-09-23 09:10:14

2013-11-13 14:11:43

2021-09-13 10:27:34

云備份云恢復云計算

2021-03-11 10:24:58

Kubernetes混合云云平臺

2020-02-18 13:25:38

React前端數據

2009-12-31 14:45:05

Silverlight
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久久久久久久久久久久久av | 黄色成人在线观看 | 日韩午夜电影 | 欧美视频免费在线 | 黄色网址大全在线观看 | 狠狠操av| 久久久无码精品亚洲日韩按摩 | 亚洲欧美中文字幕在线观看 | 亚洲欧美激情精品一区二区 | 国产在线精品一区二区 | 97国产精品| 国产精品久久久久久久久久 | 亚洲高清视频一区二区 | 亚洲欧美日韩精品久久亚洲区 | 久产久精国产品 | 日本特黄特色aaa大片免费 | 日韩免费 | 免费h在线 | 夜夜夜夜夜夜曰天天天 | 日韩亚洲欧美综合 | 男人天堂视频在线观看 | 国产精品毛片无码 | 狠狠插狠狠操 | 国产做a爱片久久毛片 | 成人精品视频在线 | 亚洲天堂av在线 | 国产探花在线精品一区二区 | 亚洲综合色自拍一区 | 欧美中文 | 久久av一区二区三区 | 天天天天天天操 | 精品久久久久香蕉网 | 亚洲首页| 91精品久久久久久久久中文字幕 | 99久久精品国产一区二区三区 | 激情久久av一区av二区av三区 | 日韩视频在线观看中文字幕 | 日韩在线小视频 | 久久久久久免费精品一区二区三区 | 四虎影视一区二区 | 一级毛片在线播放 |