当前位置: 首页 > news >正文

Spark-Streaming

Spark-Streaming概述

DStream实操

案例一:WordCount案例

需求:使用 netcat 工具向 9999 端口不断的发送数据,通过 SparkStreaming 读取端口数据并统计不同单词出现的次数

实验步骤:

  1. 添加依赖

<dependency>
    <groupId>org.apache.spark</groupId>
    <artifactId>spark-streaming_2.12</artifactId>
    <version>3.0.0</version>
</dependency>

  1. 编写代码

val sparkConf = new SparkConf().setMaster("local[*]").setAppName("streaming")
val ssc = new StreamingContext(sparkConf,Seconds(3))

val lineStreams = ssc.socketTextStream("node01",9999)
val wordStreams = lineStreams.flatMap(_.split(" "))
val wordAndOneStreams = wordStreams.map((_,1))
val wordAndCountStreams = wordAndOneStreams.reduceByKey(_+_)
wordAndCountStreams.print()

ssc.start()
ssc.awaitTermination()

  1. 启动netcat发送数据

nc -lk 9999

结果:

相关文章:

  • 【深度学习新浪潮】新视角生成的研究进展调研报告(2025年4月)
  • 软件测试之接口测试常见面试
  • 第48讲:空间大数据与智慧农业——时空大数据分析与农业物联网的融合实践
  • ecovadis评级范围,如何拿到ecovadis评级高分
  • 局域网内,将linux(Ubuntu)的硬盘映射成Windows上,像本地磁盘一样使用
  • 健康生活新指南
  • ESM 内功心法:化解 require 中的夺命一击!
  • Spring 中 @Component, @Repository, @Service 的区别及示例代码
  • 学习Docker遇到的问题
  • 广州市白云区粤荣职业培训学校副校长余智强获聘广州培训质量督导员
  • 高性能数据库集群:分库分表
  • LeetCode 热题 100_分割等和子集(89_416_中等_C++)(动态规划)
  • 如何通过证书认证安全登录堡垒机、防火墙和VPN?安当KSP密钥管理系统助力企业实现零信任身份验证
  • C++ linux打包运行方案(cmake)
  • postman工具
  • 全能 Sui 技术栈,构建 Web3 的未来
  • 掌握 Altium Designer:轻松定制“交换器件”工具栏
  • Python 设计模式:享元模式
  • XPath 语法入门
  • Vue 实例 VM 访问属性
  • 刘国梁总结发言数度哽咽:乒乓球是事业,更是融入血脉的信仰
  • 民生访谈|让餐饮店选址合规性可查、社区妙趣横生,上海有实招
  • 载人登月总体进展顺利
  • 特朗普称无意解雇鲍威尔,美国股债汇反弹、黄金高位下跌
  • 最高法报告点名“夜郎古酒”商标侵权案:促成当事人握手言和
  • 什么样的赛事能推进建设全球著名体育城市,上海半马就是答案