当前位置: 首页 > news >正文

一种Spark程序运行指标的采集与任务诊断实现方式

一种Spark程序运行指标的采集与任务诊断实现方式

编写时间:2023年8月2日

第一次校准时间:2023年8月2日

文章目录

  • 一种Spark程序运行指标的采集与任务诊断实现方式
    • 数据链路
    • 采集器的类图
    • CustomSparkListener采集的指标
      • task相关
      • stage相关
      • Job相关
      • Executors相关
    • 诊断
      • 诊断分类
        • 调度阶段诊断
        • 周期性诊断
        • 应用结束诊断
      • 诊断报告
    • 附录 Spark程序的运行监听器
        • **SparkListener**
        • **StreamingListener**接口

数据链路

  1. spark-metrics-collector.jar 作为Spark运行扩展包部署在Spark上,在Spark程序运行时,在SparkContext中将CustomSparkListener监听器注册到listenerBus中。进行任务的跟踪、指标采集与诊断。同理在StreamingContext中将CustomStreamingListener监听器注册到StreamingListenerBus中,对流式任务的跟踪、指标采集与诊断。
  2. 通过监听器将程序运行是的相关指标进行采集、诊断后发送到指标的统一接收端(DMA),做数据删选后,写入对应的Kafka的Topic中。
  3. 通过消费对应的Topic,将相关数据存入分析系统中。

采集器的类图

离线任务采集

相关文章:

  • win11什么都不动之后一段时间黑屏桌面无法显示,但鼠标仍可移动,得要熄屏之后才能进入的四种解决方法
  • MCP‌和LangGraph‌结合
  • Python 函数与模块
  • 开关量扫描处理(消抖)
  • Linux平台实现低延迟的RTSP、RTMP播放
  • Java技术体系的主要产品线详解
  • 专家系统的基本概念解析——基于《人工智能原理与方法》的深度拓展
  • 车载客流记录仪简介
  • 2025 年免费 Word 转 PDF 转换器有哪些?
  • 数据结构——二叉树,堆
  • 【硬核干货】SonarQube安全功能
  • 【动手学深度学习】ResNet残差网络
  • ragflow部署以及api调用整理
  • 创新项目实训开发日志4
  • 第十七届山东省职业院校技能大赛 中职组网络建设与运维赛项
  • 一天学完Servlet!!!(万字总结)
  • 第五章:Framework/Tooling Abstraction
  • CS144 Lab5 实战记录:网络接口实现 ARP
  • Spring Boot Controller 单元测试撰写
  • Git删除指定历史版本
  • 第78届戛纳电影节开幕,罗伯特·德尼罗领取终身成就奖
  • 国台办:民进党当局刻意刁难大陆配偶,这是不折不扣的政治迫害
  • 中国一直忽视欧盟经贸问题关切?外交部:事实证明中欧相互成就,共同发展
  • 巴基斯坦全国航班仍持续延误或取消
  • 中美经贸高层会谈在日内瓦结束,中国代表团将举行发布会
  • 演员发文抵制代拍获粉丝支持,媒体:追星“正确姿势”不妨多来点