当前位置: 首页 > news >正文

Hadoop----高可用搭建

目录标题

    • **什么是高可用?**
    • **⭐搭建的步骤**
    • 一.`jdk`**安装配置**
      • - **要点**:
    • 二.`zookeeper`**集群配置**
      • - **要点**
    • 三.`Hadoop`高可用的搭建
      • - **要点**
        • ①环境变量的配置
        • ②配置文件的修改
      • ③内容分发
      • ④集群任务的初次启动

什么是高可用?

通过冗余设计 + 自动恢复机制,显著降低因单点故障导致的服务中断概率(如NameNode停机从小时级恢复缩短至分钟级),使系统具备“高持续服务能力”

⭐搭建的步骤

①安装好jdk并配置好环境变量

②安装好zookeeper并完成zookeeper的集群设置,且成功启动
(成功启动的意思为,可以显示出哪台机子为leader,哪台机子为follower

③安装好Hadoop,配置好环境变量,完成Hadoop的高可用配置

一.jdk安装配置

- 要点:

解压命令
tar -rf … …
配置环境变量并启用

配置内容为
在这里插入图片描述
启用为
source /etc/profile

二.zookeeper集群配置

且看前文《zookeeper----初步了解与安装》

- 要点

①关闭集群虚拟机的防火墙
myid的配置与zoo.cfg内的编号要完全对应
zoo.cfg内的编号配置的符号
防火墙的关闭

三.Hadoop高可用的搭建

- 要点

①环境变量的配置

在这里插入图片描述
(配置好后,记得source

②配置文件的修改
  • 文件的位置
    Hadoop中的 etc/hadoop/

⭐四个文件+workers+hadoop-env.sh

在这里插入图片描述
⭐workers为虚拟机名字根据自身名字加入
在这里插入图片描述
文件一

  • core-site.xml
    在这里插入图片描述

文件二

  • hdfs-site.xml
    在这里插入图片描述

文件三

  • mapred-site.xml
    在这里插入图片描述

文件四

  • yarn-site.xml
    在这里插入图片描述

③内容分发

在这里插入图片描述
将一台机子配置好的hadoop分发给集群其他虚拟机
scp -r 文件 虚拟机名:位置

以及环境变量分发

(先确保集群内每台机子的jdk都拥有,且设置好了环境变量)

④集群任务的初次启动

在这里插入图片描述
⭐注:除了zookeeper打开关闭命令,在zookeeper中执行,其他都在hadoop内执行

  1. 启动初期,先将虚拟机的zookeeper集群打开
    bin/zkServer.sh start

  2. 将集群每一台的journalnode初始化开启
    bin/hdfs --daemon start journalnode

  3. 只在任意一台机子进行namenode初始化且开启(查看是否初始化正确)

初始化命令
bin/hdfs namenode - format

开启命令
bin/hdfs --daemon start namenode

  1. namenode信息同步给另外两台机
    命令如上图(两种方式)

  2. 将所有启动的进程关闭以及zookeeper集群

  3. 重启zookeeper集群

  4. 在任意一台虚拟机初始化zkfc
    bin/hdfs zkfc -formatZK

  5. 启动hdfs以及yarn进程
    (最好在初始化namenode的虚拟机上执行)
    命令如上图

⭐注意
要想关闭某个进程或zookeeper集群

start换成stop即可

相关文章:

  • 【Redis】缓存三剑客问题实践(上)
  • Android JNI开发中头文件引入的常见问题与解决方案​,提示:file not found
  • 使用 LlamaIndex Workflows 与 Elasticsearch
  • Android 中实现图片翻转动画(卡片翻转效果)
  • Selenium 在爬取过程中,网络响应被退出的解决方案
  • C++算法(13):如何高效读取并存储未知数量的空格分隔数字
  • C语言高频面试题——sizeof和strlen的区别
  • 进程的同步和互斥
  • Seata 分布式事务 快速开始
  • Crawl4AI:打破数据孤岛,开启大语言模型的实时智能新时代
  • 597页PPT丨流程合集:流程梳理方法、流程现状分析,流程管理规范及应用,流程绩效的管理,流程实施与优化,流程责任人的角色认知等
  • Docker Compose常用命令
  • 公路路面病害检测
  • 数据结构:顺序表的实现
  • 使用 Spring Boot Admin 通过图形界面查看应用配置信息的完整配置详解,包含代码示例和注释,最后以表格总结关键配置
  • 使用 rebase 轻松管理主干分支
  • 描述城市出行需求模式的复杂网络视角:大规模起点-目的地需求网络的图论分析
  • 数据仓库ODS、DWD、DWS、ADS各层介绍
  • 关于创建UNIX/Linux daemon进程的笔记
  • 【漫话机器学习系列】217.监督式深度学习的核心法则(Supervised Deep Learning Rule Of Thumb)
  • 人民日报:广东全力推动外贸稳量提质
  • 讲座预告|大国博弈与创新破局:如何激励中国企业创新
  • 《2025职场人阅读报告》:超半数会因AI改变阅读方向
  • 美联储官员:若特朗普高额关税致失业率飙升,将支持降息
  • 《哪吒之魔童降世》电影版权方诉《仙侠神域》游戏运营方侵权案开庭
  • 中华人民共和国和肯尼亚共和国关于打造新时代全天候中非命运共同体典范的联合声明