当前位置：首页 > news >正文

Hadoop的三大结构及各自的作用？

news 来源：原创 2025/4/24 9:52:27

1.HDFS 作用：

存储海量数据，支持高容错（数据自动备份）和高吞吐量（适合大文件读写）。
采用主从架构：
- NameNode：管理文件系统的元数据（如文件目录结构）。
- DataNode：存储实际数据块（默认128MB/块，3副本）。

适用场景：

存储日志、视频、大型数据集等非结构化或半结构化数据。

2.YARN 作用：

资源管理：统一分配集群的CPU、内存等资源。
任务调度：支持多种计算框架（如MapReduce、Spark、Flink）在同一个集群上运行。
核心组件：
- ResourceManager（RM）：全局资源调度。
- NodeManager（NM）：单节点资源管理。
- ApplicationMaster（AM）：单个作业的任务协调。

优势：

提高集群资源利用率，避免传统MapReduce的单一任务调度瓶颈。

3.MapReduce 作用：

分布式批处理计算框架，通过Map和Reduce两个阶段处理数据。
- Map阶段：并行处理输入数据，生成键值对（<key, value>）。
- Reduce阶段：汇总Map的结果，输出最终数据。

特点：

高容错：自动处理节点故障。
离线计算：适合大规模静态数据集（如日志分析、ETL）。

示例：

词频统计（WordCount）、数据清洗、聚合分析等。

相关文章：

刀片服务器的散热构造方式

游戏APP如何抵御DDoS攻击与黑客勒索？实战防护全攻略

物联网分层架构全解析：从感知到应用的智能生态构建

day45——非递减数列（LeetCode-665）

Spring Boot启动流程深度解析：从main()到应用就绪的完整旅程

设计模式之工厂方法模式

获取印度股票市场列表、查询IPO信息以及通过WebSocket实时接收数据

青少年编程与数学 02-016 Python数据结构与算法 28课题、图像处理算法

人像面部关键点检测

【路由交换方向IE认证】BGP选路原则之AS-Path属性

基于autoware1.14的实车部署激光雷达循迹，从建图、定位、录制轨迹巡航点、到实车运行。

MySQL+Redis实战教程：从Docker安装部署到自动化备份与数据恢复20250418

MCP协议量子加密实践：基于QKD的下一代安全通信（2025深度解析版）

服务器架构：SMP、NUMA、MPP及Docker优化指南

Oracle 19c新特性：OCP认证考试与职业跃迁的关键？

日本公司如何实现B2B商城订货系统的自动化和个性化?

珈和科技：无人机技术赋能智慧农业，精准施肥与病虫害监控全面升级

STM32F103_HAL库+寄存器学习笔记18 - CAN接收溢出中断

win10 应用市场开发

【java 13天进阶Day04】常用API、正则表达式，泛型、Collection集合API

最高法典型案例：学生在校受伤，学校并非必然担责

人民日报首推“大地书单”，10本好书上榜！

上金所：调整黄金、白银延期部分合约保证金水平和涨跌停板

富力地产：广州富力空港假日酒店第一次拍卖流拍，起拍价约2.77亿元

神舟二十号航天员乘组计划于10月下旬返回

“小时光：地铁里的阅读”摄影展开幕，嘉宾共话日常生活与阅读