当前位置：首页 > news >正文

Hadoop 集群扩容新增节点操作文档

news 来源：原创 2025/4/24 9:06:26

Hadoop 集群扩容新增节点操作文档

一、前期准备

1. 环境检查（所有新节点）

确保 JDK 安装：

java -version

确保 Hadoop 安装：

hadoop version

添加主机名映射（所有节点）：

cat >> /etc/hosts <<EOF
192.168.1.10 master
192.168.1.11 node01
192.168.1.12 node02
192.168.1.13 node03  # 新增节点
EOF

测试 SSH 免密（主节点执行）：

ssh node03 hostname

2. Hadoop 安装与配置同步

将 Hadoop 安装包拷贝至新节点：

scp -r /opt/hadoop user@node03:/opt/

同步 Hadoop 配置文件：

scp -r $HADOOP_HOME/etc/hadoop user@node03:$HADOOP_HOME/etc/

二、修改主节点配置

1. 添加到 workers 文件（或 slaves）

说明：workers 文件是作为批量远程启动服务的清单使用，一般适用于远程批量启动多个节点服务。

echo "node03" >> $HADOOP_HOME/etc/hadoop/workers

2. 若启用了白名单，修改 dfs.hosts

echo "node03" >> $HADOOP_HOME/etc/hadoop/dfs.hosts

三、启动新节点服务

1. 新节点执行以下命令：

启动 DataNode：

$HADOOP_HOME/sbin/hadoop-daemon.sh start datanode

启动 NodeManager：

$HADOOP_HOME/sbin/yarn-daemon.sh start nodemanager

2. 可选：主节点上运行 balancer（平衡数据）

hdfs balancer -threshold 10

四、验证与测试

1. 查看 HDFS 节点状态：

hdfs dfsadmin -report

或访问：

http://<namenode_host>:9870/dfshealth.html

2. 查看 YARN 节点状态：

访问：

http://<resourcemanager_host>:8088/cluster/nodes

3. 测试任务提交：

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar pi 5 100

五、扩容自动化脚本（示例）

auto_add_node.sh

#!/bin/bash
# 用于新节点自动加入 Hadoop 集群HADOOP_HOME=/opt/hadoop
NEW_NODE=$1echo "[INFO] 添加新节点 $NEW_NODE"# 同步配置文件
scp -r $HADOOP_HOME/etc/hadoop $NEW_NODE:$HADOOP_HOME/etc/# 在主节点添加到 workers 列表
echo "$NEW_NODE" >> $HADOOP_HOME/etc/hadoop/workers# 远程启动服务
ssh $NEW_NODE "$HADOOP_HOME/sbin/hadoop-daemon.sh start datanode"
ssh $NEW_NODE "$HADOOP_HOME/sbin/yarn-daemon.sh start nodemanager"echo "[INFO] 启动完成，验证状态请访问 ResourceManager 和 NameNode Web 页面"

执行方式：

chmod +x auto_add_node.sh
./auto_add_node.sh node03

Java 实现SpringContextUtils工具类，手动获取Bean

鸿蒙NEXT开发网络相关工具类（ArkTs）

node.js 实战——（概念以及Buffer 知识点学习）

数据结构线性表的顺序存储结构

openEuler安装nvidia驱动【详细版】

外贸获客新革命：基于AI的搜索引擎排名攻防战——48小时抢占谷歌TOP3的技术逻辑与实战路径

基于VUE+Node.JS实现（Web）学生组队网站

LInux平均负载

maven中pom.xml setting.xml关系

二叉树OJ题目

大模型框架技术全景与下一代架构演进

如何批量为多张图片（JPG、PNG、BMP、WEBP 等格式）添加自定义水印保护

C++ 容器查找效率

20250423修改和查看荣品的PRO-RK3566开发板的buildroot linux系统的cpu频率

Linux命令-sar

Python内置函数---bytearray（）

【Java设计模式及实践学习-第4章节-结构型模式】

一对多的数据结构（树）的基本概念

spring-session-data-redis使用

困局与破局：当传统校园能源管理遭遇“散沙式“能耗困局

人民日报开新栏，冼星海之女追忆父亲创作《黄河大合唱》

最高法：家长以监督为名虚构事实诋毁学校的，应承担侵权责任

福建一改造项目1人高处坠亡且事故迟报41天，住建厅约谈相关责任单位

青岛：今年计划新增城镇住房约5.77万套，推动房地产市场回稳

几百元的工资优势已不能吸引人才流动，江苏多地探讨“抢人”高招

山西公布商标侵权典型案例：一工厂生产价值三百多万假“维达”纸被查

Hadoop 集群扩容新增节点操作文档

一、前期准备

1. 环境检查（所有新节点）

2. Hadoop 安装与配置同步

二、修改主节点配置

1. 添加到 workers 文件（或 slaves）

2. 若启用了白名单，修改 dfs.hosts

三、启动新节点服务

1. 新节点执行以下命令：

2. 可选：主节点上运行 balancer（平衡数据）

四、验证与测试

1. 查看 HDFS 节点状态：

2. 查看 YARN 节点状态：

3. 测试任务提交：

五、扩容自动化脚本（示例）

相关文章：