成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Spark入門:Spark Streaming 概覽

大數(shù)據(jù) Spark
Spark Streaming是Spark API的一個可橫向擴(kuò)容,高吞吐量,容錯的實時數(shù)據(jù)流處理引擎,Spark能夠從Kafka、Flume、Kinesis或者TCP等等輸入獲取數(shù)據(jù),然后能夠使用復(fù)雜的計算表達(dá)式如map,reduce,join和window對數(shù)據(jù)進(jìn)行計算。

[[199875]]

概覽

Spark Streaming是Spark API的一個可橫向擴(kuò)容,高吞吐量,容錯的實時數(shù)據(jù)流處理引擎,Spark能夠從Kafka、Flume、Kinesis或者TCP等等輸入獲取數(shù)據(jù),然后能夠使用復(fù)雜的計算表達(dá)式如map,reduce,join和window對數(shù)據(jù)進(jìn)行計算。計算完后的數(shù)據(jù)能夠被推送到文件系統(tǒng),數(shù)據(jù)庫,和實時的儀表盤。另外,你也可以使用Spark ML和圖計算處理實時數(shù)據(jù)流。

Spark Streaming接受到了實時數(shù)據(jù)后,把它們分批進(jìn)行切割,然后再交給Spark進(jìn)行數(shù)據(jù)的批量處理。

Spark Streaming對離散化的數(shù)據(jù)流提供了高級別的抽象DStream,所有進(jìn)入的數(shù)據(jù)流都會被處理為DStreams,在內(nèi)部,DStream是一個順序排列的RDD。

快速起步

***個實例是如何從TCP輸入中計算單詞出現(xiàn)的次數(shù)

首先,我們創(chuàng)建一個JavaStreamingContext對象,它是所有Streaming函數(shù)的主入口,再創(chuàng)建一個帶有2個線程的StreamingContext對象,每1秒進(jìn)行一次批處理。

  1. import org.apache.spark.*; 
  2. import org.apache.spark.api.java.function.*; 
  3. import org.apache.spark.streaming.*; 
  4. import org.apache.spark.streaming.api.java.*; 
  5. import scala.Tuple2; 
  6.  
  7. SparkConf conf = new SparkConf().setMaster("local[2]").setAppName("NetworkWordCount"); 
  8. JavaStreamingContext jssc = new JavaStreamingContext(conf, Durations.seconds(1)); 

創(chuàng)建一個偵聽本地9999的TCP數(shù)據(jù)源

  1. JavaReceiverInputDStream<String> lines = jssc.socketTextStream("localhost", 9999); 

我們把接受到的數(shù)據(jù)按照空格進(jìn)行切割

  1. JavaDStream<String> words = lines.flatMap(x -> Arrays.asList(x.split(" ")).iterator()); 

對單詞進(jìn)行統(tǒng)計

  1. JavaPairDStream<String, Integer> pairs = words.mapToPair(s -> new Tuple2<>(s, 1)); 
  2. JavaPairDStream<String, Integer> wordCounts = pairs.reduceByKey((i1, i2) -> i1 + i2);  
  3. wordCounts.print(); 

把字符串拍扁->映射->進(jìn)行去重統(tǒng)計,***調(diào)用print函數(shù)把數(shù)據(jù)打印到控制臺中

  1. jssc.start();              // Start the computation 
  2. jssc.awaitTermination();   // Wait for the computation to terminate 

***,啟動整個計算過程

為了完成這次實驗,還需要使用nc作為Server進(jìn)行配合

  1. nc -lk 9999 

Spark提供了示例,可以使用 ./bin/run-example streaming.JavaNetworkWordCount localhost 9999 來體驗WordCount

責(zé)任編輯:武曉燕 來源: oschina博客
相關(guān)推薦

2017-06-06 08:31:10

Spark Strea計算模型監(jiān)控

2017-10-13 10:36:33

SparkSpark-Strea關(guān)系

2016-12-19 14:35:32

Spark Strea原理剖析數(shù)據(jù)

2018-04-09 12:25:11

2016-05-11 10:29:54

Spark Strea數(shù)據(jù)清理Spark

2016-01-28 10:11:30

Spark StreaSpark大數(shù)據(jù)平臺

2019-10-17 09:25:56

Spark StreaPVUV

2017-09-26 09:35:22

2019-12-13 08:25:26

FlinkSpark Strea流數(shù)據(jù)

2021-08-20 16:37:42

SparkSpark Strea

2023-10-24 20:32:40

大數(shù)據(jù)

2017-06-27 15:08:05

大數(shù)據(jù)Apache SparKafka Strea

2017-10-11 11:10:02

Spark Strea大數(shù)據(jù)流式處理

2021-07-09 10:27:12

SparkStreaming系統(tǒng)

2016-03-02 11:23:34

Spark 1.6.0開源大數(shù)據(jù)技術(shù)

2021-03-15 14:02:21

大數(shù)據(jù)數(shù)據(jù)開發(fā)Spark

2016-03-03 15:11:42

Spark Strea工作流調(diào)度器

2018-04-18 08:54:28

RDD內(nèi)存Spark

2016-08-19 08:50:12

SparkWordCountreduceByKey

2018-10-24 09:00:26

KafkaSpark數(shù)據(jù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 国产高清视频在线播放 | 黄a网 | 国产亚洲一区二区三区在线观看 | 国产露脸国语对白在线 | 成人一级视频在线观看 | 久久福利电影 | 色资源在线 | 日本精品一区二区三区视频 | 91网站在线观看视频 | 国产一二区视频 | 97人人澡人人爽91综合色 | 久久香蕉网 | 久久最新 | 日本三级电影在线观看视频 | 久久久久久国产精品久久 | 日日噜噜噜夜夜爽爽狠狠视频97 | 视频三区| 久久久成 | 日韩av三区 | 日韩免费看视频 | 国产东北一级毛片 | 91人人澡人人爽 | www国产亚洲精品久久网站 | 欧美一区永久视频免费观看 | 国产一区二区精品在线观看 | 一区二区三区福利视频 | 久久久久久久久久久久久91 | av喷水 | 亚洲欧美久久 | 中文字幕日韩三级 | 亚洲免费网 | 亚洲人久久 | 精品国产91 | 国产黄色一级电影 | 天天艹天天干天天 | 久久国产精品无码网站 | 国产黄色大片在线观看 | 精品九九 | 永久免费在线观看 | 色综合久久天天综合网 | 在线观看视频你懂得 |