当前位置: 首页 > news >正文

关于hadoop和yarn的问题

1.hadoop的三大结构及各自的作用?
HDFS(Hadoop Distributed File System):分布式文件系统,负责海量数据的存储,具有高容错性和高吞吐量。

MapReduce:分布式计算框架,用于并行处理大规模数据集,分为 Map(映射)和 Reduce(归约)两个阶段。

YARN(Yet Another Resource Negotiator):资源管理和作业调度框架,负责集群资源的统一分配和任务调度,提升集群利用率。

2.yarn的定义?
YARN(Yet Another Resource Negotiator)是 Hadoop 2.0 引入的资源管理平台,其核心功能是将资源管理与作业调度/监控分离,支持多计算框架(如 MapReduce、Spark 等)运行在同一个集群中,提高资源利用率和系统扩展性。

3.yarn的三大组件及各自的作用?
ResourceManager(RM):集群资源的总管理者,负责全局资源分配与调度。

NodeManager(NM):运行在集群每个节点上的代理,负责单节点资源管理(如 CPU、内存)和任务执行监控。

ApplicationMaster(AM):由应用程序(如 MapReduce 作业)启动,负责向 RM 申请资源、协调任务执行,并监控任务状态。

4.yarn的三个资源调度策略?
FIFO Scheduler:先进先出策略,按作业提交顺序分配资源,简单但可能导致大作业独占资源。

Capacity Scheduler:容量调度器,将集群划分为多个队列,每个队列分配固定资源,支持多租户资源共享。

Fair Scheduler:公平调度器,动态平衡资源分配,确保所有作业公平共享资源,适合多用户环境。

相关文章:

  • Hadoop的三大结构及各自的作用?
  • 刀片服务器的散热构造方式
  • 游戏APP如何抵御DDoS攻击与黑客勒索?实战防护全攻略
  • 物联网分层架构全解析:从感知到应用的智能生态构建
  • day45——非递减数列(LeetCode-665)
  • Spring Boot启动流程深度解析:从main()到应用就绪的完整旅程
  • 设计模式之工厂方法模式
  • 获取印度股票市场列表、查询IPO信息以及通过WebSocket实时接收数据
  • 青少年编程与数学 02-016 Python数据结构与算法 28课题、图像处理算法
  • 人像面部关键点检测
  • 【路由交换方向IE认证】BGP选路原则之AS-Path属性
  • 基于autoware1.14的实车部署激光雷达循迹,从建图、定位、录制轨迹巡航点、到实车运行。
  • MySQL+Redis实战教程:从Docker安装部署到自动化备份与数据恢复20250418
  • MCP协议量子加密实践:基于QKD的下一代安全通信(2025深度解析版)
  • 服务器架构:SMP、NUMA、MPP及Docker优化指南
  • Oracle 19c新特性:OCP认证考试与职业跃迁的关键?
  • 日本公司如何实现B2B商城订货系统的自动化和个性化?
  • 珈和科技:无人机技术赋能智慧农业,精准施肥与病虫害监控全面升级
  • STM32F103_HAL库+寄存器学习笔记18 - CAN接收溢出中断
  • win10 应用市场 开发
  • 苗旋已任民航局空管局局长、党委副书记
  • 中国体育报:中国乒协新周期新起点再出发
  • 融入长三角一体化发展,苏南名城镇江的优势和机遇何在
  • 魔都眼·上海车展②|小鹏汽车:何小鹏携手机器人车模首秀
  • 中华人民共和国和阿塞拜疆共和国关于建立全面战略伙伴关系的联合声明
  • 工程院院士应汉杰不再担任苏州大学校长