当前位置: 首页 > news >正文

Hadoop 集群扩容新增节点操作文档

Hadoop 集群扩容新增节点操作文档


一、前期准备

1. 环境检查(所有新节点)

确保 JDK 安装:

java -version

确保 Hadoop 安装:

hadoop version

添加主机名映射(所有节点):

cat >> /etc/hosts <<EOF
192.168.1.10 master
192.168.1.11 node01
192.168.1.12 node02
192.168.1.13 node03  # 新增节点
EOF

测试 SSH 免密(主节点执行):

ssh node03 hostname

2. Hadoop 安装与配置同步

将 Hadoop 安装包拷贝至新节点:

scp -r /opt/hadoop user@node03:/opt/

同步 Hadoop 配置文件:

scp -r $HADOOP_HOME/etc/hadoop user@node03:$HADOOP_HOME/etc/

二、修改主节点配置

1. 添加到 workers 文件(或 slaves)

说明:workers 文件是作为批量远程启动服务的清单使用,一般适用于远程批量启动多个节点服务。

echo "node03" >> $HADOOP_HOME/etc/hadoop/workers

2. 若启用了白名单,修改 dfs.hosts

echo "node03" >> $HADOOP_HOME/etc/hadoop/dfs.hosts

三、启动新节点服务

1. 新节点执行以下命令:

启动 DataNode:

$HADOOP_HOME/sbin/hadoop-daemon.sh start datanode

启动 NodeManager:

$HADOOP_HOME/sbin/yarn-daemon.sh start nodemanager

2. 可选:主节点上运行 balancer(平衡数据)

hdfs balancer -threshold 10

四、验证与测试

1. 查看 HDFS 节点状态:

hdfs dfsadmin -report

或访问:

http://<namenode_host>:9870/dfshealth.html

2. 查看 YARN 节点状态:

访问:

http://<resourcemanager_host>:8088/cluster/nodes

3. 测试任务提交:

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar pi 5 100

五、扩容自动化脚本(示例)

auto_add_node.sh

#!/bin/bash
# 用于新节点自动加入 Hadoop 集群HADOOP_HOME=/opt/hadoop
NEW_NODE=$1echo "[INFO] 添加新节点 $NEW_NODE"# 同步配置文件
scp -r $HADOOP_HOME/etc/hadoop $NEW_NODE:$HADOOP_HOME/etc/# 在主节点添加到 workers 列表
echo "$NEW_NODE" >> $HADOOP_HOME/etc/hadoop/workers# 远程启动服务
ssh $NEW_NODE "$HADOOP_HOME/sbin/hadoop-daemon.sh start datanode"
ssh $NEW_NODE "$HADOOP_HOME/sbin/yarn-daemon.sh start nodemanager"echo "[INFO] 启动完成,验证状态请访问 ResourceManager 和 NameNode Web 页面"

执行方式:

chmod +x auto_add_node.sh
./auto_add_node.sh node03

相关文章:

  • Java 实现SpringContextUtils工具类,手动获取Bean
  • 鸿蒙NEXT开发网络相关工具类(ArkTs)
  • node.js 实战——(概念以及Buffer 知识点学习)
  • 数据结构线性表的顺序存储结构
  • openEuler安装nvidia驱动【详细版】
  • 外贸获客新革命:基于AI的搜索引擎排名攻防战——48小时抢占谷歌TOP3的技术逻辑与实战路径
  • 基于VUE+Node.JS实现(Web)学生组队网站
  • LInux平均负载
  • maven中pom.xml setting.xml关系
  • 二叉树OJ题目
  • 大模型框架技术全景与下一代架构演进
  • 如何批量为多张图片(JPG、PNG、BMP、WEBP 等格式)添加自定义水印保护
  • C++ 容器查找效率
  • 20250423修改和查看荣品的PRO-RK3566开发板的buildroot linux系统的cpu频率
  • Linux命令-sar
  • Python内置函数---bytearray()
  • 【Java设计模式及实践学习-第4章节-结构型模式】
  • 一对多的数据结构(树)的基本概念
  • spring-session-data-redis使用
  • 困局与破局:当传统校园能源管理遭遇“散沙式“能耗困局
  • 人民日报开新栏,冼星海之女追忆父亲创作《黄河大合唱》
  • 最高法:家长以监督为名虚构事实诋毁学校的,应承担侵权责任
  • 福建一改造项目1人高处坠亡且事故迟报41天,住建厅约谈相关责任单位
  • 青岛:今年计划新增城镇住房约5.77万套,推动房地产市场回稳
  • 几百元的工资优势已不能吸引人才流动,江苏多地探讨“抢人”高招
  • 山西公布商标侵权典型案例:一工厂生产价值三百多万假“维达”纸被查