当前位置: 首页 > news >正文

Hadoop的三大结构及各自的作用?

1.HDFS 作用:

  • 存储海量数据,支持高容错(数据自动备份)和高吞吐量(适合大文件读写)。

  • 采用主从架构

    • NameNode:管理文件系统的元数据(如文件目录结构)。

    • DataNode:存储实际数据块(默认128MB/块,3副本)。

适用场景

  • 存储日志、视频、大型数据集等非结构化或半结构化数据

2.YARN 作用:

  • 资源管理:统一分配集群的CPU、内存等资源。

  • 任务调度:支持多种计算框架(如MapReduce、Spark、Flink)在同一个集群上运行。

  • 核心组件

    • ResourceManager(RM):全局资源调度。

    • NodeManager(NM):单节点资源管理。

    • ApplicationMaster(AM):单个作业的任务协调。

优势

  • 提高集群资源利用率,避免传统MapReduce的单一任务调度瓶颈。

3.MapReduce 作用:

  • 分布式批处理计算框架,通过MapReduce两个阶段处理数据。

    • Map阶段:并行处理输入数据,生成键值对(<key, value>)。

    • Reduce阶段:汇总Map的结果,输出最终数据。

特点

  • 高容错:自动处理节点故障。

  • 离线计算:适合大规模静态数据集(如日志分析、ETL)。

示例

  • 词频统计(WordCount)、数据清洗、聚合分析等。

相关文章:

  • 刀片服务器的散热构造方式
  • 游戏APP如何抵御DDoS攻击与黑客勒索?实战防护全攻略
  • 物联网分层架构全解析:从感知到应用的智能生态构建
  • day45——非递减数列(LeetCode-665)
  • Spring Boot启动流程深度解析:从main()到应用就绪的完整旅程
  • 设计模式之工厂方法模式
  • 获取印度股票市场列表、查询IPO信息以及通过WebSocket实时接收数据
  • 青少年编程与数学 02-016 Python数据结构与算法 28课题、图像处理算法
  • 人像面部关键点检测
  • 【路由交换方向IE认证】BGP选路原则之AS-Path属性
  • 基于autoware1.14的实车部署激光雷达循迹,从建图、定位、录制轨迹巡航点、到实车运行。
  • MySQL+Redis实战教程:从Docker安装部署到自动化备份与数据恢复20250418
  • MCP协议量子加密实践:基于QKD的下一代安全通信(2025深度解析版)
  • 服务器架构:SMP、NUMA、MPP及Docker优化指南
  • Oracle 19c新特性:OCP认证考试与职业跃迁的关键?
  • 日本公司如何实现B2B商城订货系统的自动化和个性化?
  • 珈和科技:无人机技术赋能智慧农业,精准施肥与病虫害监控全面升级
  • STM32F103_HAL库+寄存器学习笔记18 - CAN接收溢出中断
  • win10 应用市场 开发
  • 【java 13天进阶Day04】常用API、正则表达式,泛型、Collection集合API
  • 最高法典型案例:学生在校受伤,学校并非必然担责
  • 人民日报首推“大地书单”,10本好书上榜!
  • 上金所:调整黄金、白银延期部分合约保证金水平和涨跌停板
  • 富力地产:广州富力空港假日酒店第一次拍卖流拍,起拍价约2.77亿元
  • 神舟二十号航天员乘组计划于10月下旬返回
  • “小时光:地铁里的阅读”摄影展开幕,嘉宾共话日常生活与阅读