成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

關于Hadoop你需要知道的一些事項

數據庫 大數據 Hadoop
全名Apache Hadoop,是一個在通用低成本的硬件上處理存儲和大規模并行計算的一個開源框架。從2011年他的面世,他已經成為大數據領域最出名的平臺。

[[204026]]

除非你過去幾年一直隱居,遠離這個計算機的世界,否則你不可能沒有聽過Hadoop。

全名Apache Hadoop,是一個在通用低成本的硬件上處理存儲和大規模并行計算的一個開源框架。從2011年他的面世,他已經成為大數據領域最出名的平臺。

如何工作的?

Hadoop是從Google文件系統發源而來,并且他是一個用Java開發的跨平臺的應用.核心組件有: Hadoop Common,擁有其他模塊所依賴的庫和基礎工具,Hadoop分布式文件系統 (HDFS), 負責存儲, Hadoop YARN, 管理計算資源, 和Hadoop MapReduce, 負責處理的過程。

Hadoop把文件拆成小塊并且把他們分發給集群中的節點.然后,它使用打包的代碼分發到節點上并行處理數據. 這意味著可以處理數據的速度會比使用傳統的體系結構的更快.

一個典型的Hadoop集群都會有主節點和從節點或者叫工作節點. 主節點有一個任務跟蹤器,任務調度,名字節點和數據節點組成.從節點通常作為一個數據節點和任務調度器,不過特殊的場景下程序可能只有數據節點然后在其他的從節點進行處理計算。

在大的Hadoop集群中,通常會使用一個專用的名字節點來管理HDFS節點的文件系統索引信息。這防止了文件系統的數據丟失和損壞。

Hadoop文件系統

Hadoop分布式文件系統是Hadoop擴展的核心. HDFS當處理大數據的優點是,它可以跨多臺機器存儲gb或tb大小的文件. 因為數據的副本存在了多個機器上,而不是使用附加RAID來在單臺機器上保證. 不過RAID還是會被用來提升性能. 提供進一步的保護,允許主NameNode服務器自動切換到備份失敗的事件。

HDFS被設計成可以直接掛載在Linux系統的用戶空間(FUSE)或者虛擬文件系統. 通過一個Java API來處理文件的訪問權限.HDFS被設計為跨硬件平臺和操作系統的可移植性。

Hadoop也能配合其他的文件系統工作 ,包括FTP, Amazon S3 和Microsoft Azure, 然而,它需要一個特定的文件系統的橋梁,以確保沒有性能損失。

Hadoop 和他的云

相對傳統數據中心, Hadoop也經常被部署在云上. 這樣做的好處是,公司可以很容易地部署Hadoop更迅速和較低的安裝費用. 大多數云供應商都提供某種形式的Hadoop部署方案。

Microsoft 提供Azure HDInsight, 允許用戶使用他們所需要的節點的數量,并收取他們使用的計算能力和存儲的費用. HDInsight是基于 Hortonworks 并且可以很容易地在內部系統和云備份,或開發和測試之間移動數據.

Amazon Elastic Compute Cloud (EC2) 和Amazon Simple Storage Service (S3) 也支持 Hadoop, 加上Amazon 提供了 Elastic MapReduce 產品,所以能自動化Hadoop集群的配置,作業的運行和終止以及處理EC2和S3存儲之間的數據傳輸。

Google提供一個管理Spark和Hadoop 服務叫做Cloud Dataproc,用一系列的Shell腳本來創建和管理 Spark和Hadoop 集群.他支持第三方的Hadoop 發行版像Cloudera, Hortonworks和MapR.Google Cloud Storage 也可以和 Hadoop 配合使用.

Hadoop 近況

Hadoop已經有些初步的進展. 2015年的 Gartner study只有18%的人表示會在接下來的兩年使用.不愿意采用這種技術的原因包括成本太高,相對于預期的利益, 和缺乏必要的技能。

仍然有一些高調的用戶。 雅虎的搜索引擎由Hadoop驅動,公司已經通過開源社區向公眾提供了其使用的版本的源代碼。 Facebook也使用Hadoop,并且在2012年該公司宣布其集群具有100PB的數據,并且每天增長約為一個PB。

盡管初始占有慢,Hadoop也在增長。 Allied Market Research在2016年初的一項調查估計,到2021年Hadoop市場的收入將超過840億美元。

由于Hadoop工作的方式,看到了一些回歸到舊時代批處理信息的東西。 雖然從大量歷史數據中提取洞察力很有用,但對于實時應用程序或連續傳入的數據流有效性較低。

特性

Hadoop一直與大數據密切相關。隨著物聯網設備的擴展以及收集的數據量增加,因而Hadoop的處理能力需求也將增加。其快速處理大數據的能力意味著Hadoop系統對于做日常業務決定起著越來越重要的作用。

各種規模的組織都熱衷于使用大數據。Hadoop開源的特性以及其在商業硬件上運行的能力意味著其處理能力不僅在大型公司可用,也可以幫助大眾使用大數據。

對于所有這些運作成功的公司需要能夠利用Hadoop可以提供的優勢。 這意味著需要解決技能差距,并且可能仍然需要那些掌握Java,Linux,文件系統和數據庫背景的員工,這些員工能夠快速獲得Hadoop技能。 這也意味著越來越多地使用云以一種不太復雜的方式提供Hadoop的優勢。 

責任編輯:龐桂玉 來源: 36大數據
相關推薦

2017-02-09 14:46:25

Git事情

2023-01-30 11:43:04

開源代碼

2017-05-25 10:44:38

云存儲對象存儲存儲

2017-03-28 15:47:17

數據治理數據庫

2013-06-21 16:35:50

iOS 7設計蘋果開發iOS 7新特性

2013-12-02 14:07:02

Hadoop大數據集群

2023-02-10 08:44:05

KafkaLinkedIn模式

2014-07-31 17:13:50

編碼程序員

2022-04-24 09:00:00

滲透測試安全數字時代

2022-12-30 11:24:21

2022-07-15 14:58:26

數據分析人工智能IT

2018-06-15 23:00:56

2022-09-01 15:26:45

物聯網人工智能傳感器

2022-08-27 12:15:51

Linux Mint操作系統

2018-05-30 12:04:36

LinuxUbuntu 18.0

2022-11-28 00:07:47

2020-12-22 11:04:05

人工智能AI機器學習

2017-04-29 09:00:14

Linux程序進程

2019-05-22 15:10:43

2015-06-30 10:59:22

MobileWeb適配
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日本在线一区二区三区 | 亚洲区在线| 国产精品久久欧美久久一区 | 高清国产午夜精品久久久久久 | 国产一二三区电影 | 久久国产精品免费一区二区三区 | 羞羞羞视频 | 亚洲日本国产 | 欧美日韩精品一区二区 | 日韩欧美亚洲 | 久草电影网 | 中文字幕1区2区3区 日韩在线视频免费观看 | 成人在线观看黄 | 欧美黄色网 | 国产精品亚洲综合 | 国产欧美精品一区 | 成年人的视频免费观看 | 久久久久久久久久久久久久国产 | 一区二区三区中文字幕 | 亚洲高清视频在线观看 | 久久九九色 | 国产香蕉视频在线播放 | 免费黄色的网站 | 久久com | 久久久精品一区 | 中国三级黄色录像 | 亚洲a毛片| 天天干,夜夜操 | 中文字幕国产一区 | 国产成人精品一区二区在线 | 伊人电影院av | 懂色一区二区三区免费观看 | 国产资源在线视频 | 久久国产精品99久久久久久丝袜 | 欧洲毛片| 久久国产日本 | 亚洲成网站 | 久久久久久影院 | 欧美三级在线 | 高清黄色 | 国产精品视频999 |