当前位置: 首页 > news >正文

四 YARN配置和HBase配置

文章目录

    • 零 前置条件
  • 一 YARN应用
    • 操作一 配置yarn-site.xml和mapred-site.xml文件
    • 操作二 将配置文件同步到其它节点,集群启动YARN;启动备用节点RM
    • 操作三 Web查看YARN和测试YARN
    • 注意:
  • 二 HBase应用
    • 操作一 官网下载 HBase压缩包
    • 操作二 修改4个配置文件;拷贝HDFS的2个配置文件;创建HBase日志目录
    • 操作三 hbase-1.2.0-cdh5.10.0 同步到其他节点,并创建软链接;集群启动hbase
    • 操作四 web查看hbase
    • 注意

零 前置条件

  1. zookeeper已成功配置;hdfs已成功配置;FinalShell连接3个虚拟节点

  2. 先开启zookeeper,后开启hdfs,jps查看当前集群的进程,如图所示
    在这里插入图片描述

一 YARN应用

操作一 配置yarn-site.xml和mapred-site.xml文件

# yarn-site.xml
<configuration><property><name>yarn.resourcemanager.connect.retry-interval.ms</name><value>2000</value></property><property><name>yarn.resourcemanager.ha.enabled</name><value>true</value></property><property><name>yarn.resourcemanager.ha.automatic-failover.enabled</name><value>true</value></property><property><name>yarn.resourcemanager.ha.automatic-failover.embedded</name><value>true</value></property><property><name>yarn.resourcemanager.cluster-id</name><value>yarn-rm-cluster</value></property><property><name>yarn.resourcemanager.ha.rm-ids</name><value>rm1,rm2</value></property><property><name>yarn.resourcemanager.hostname.rm1</name><value>hadoop01</value></property><property><name>yarn.resourcemanager.hostname.rm2</name><value>hadoop02</value></property><property><name>yarn.resourcemanager.recovery.enabled</name><value>true</value></property><property><name>yarn.resourcemanager.zk.state-store.address</name><value>hadoop01:2181,hadoop02:2181,hadoop03:2181</value></property><property><name>yarn.resourcemanager.zk-address</name><value>hadoop01:2181,hadoop02:2181,hadoop03:2181</value></property><property><name>yarn.resourcemanager.address.rm1</name><value>hadoop01:8032</value></property><property><name>yarn.resourcemanager.scheduler.address.rm1</name><value>hadoop01:8034</value></property><property><name>yarn.resourcemanager.webapp.address.rm1</name><value>hadoop01:8088</value></property><property><name>yarn.resourcemanager.address.rm2</name><value>hadoop02:8032</value></property><property><name>yarn.resourcemanager.scheduler.address.rm2</name><value>hadoop02:8034</value></property><property><name>yarn.resourcemanager.webapp.address.rm2</name><value>hadoop02:8088</value></property><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><property><name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name><value>org.apache.hadoop.mapred.ShuffleHandler</value></property>
</configuration># mapred-site.xml
<configuration><property><name>mapreduce.framework.name</name><value>yarn</value></property>
</configuration>

操作二 将配置文件同步到其它节点,集群启动YARN;启动备用节点RM

  1. 集群同步节点到其余节点,在目录[/home/hadoop/etc/hadoop]下执行
deploy.sh yarn-site.xml ~/app/hadoop/etc/hadoop slave 
deploy.sh mapred-site.xml ~/app/hadoop/etc/hadoop slave
  1. 启动YARN和备用节点,在[/home/hadoop/app/hadoop]目录下执行
# hadoop01
sbin/start-yarn.sh # 如果HDFS未启动,可sbin/start-all.sh (包括HDFS和YARN)# 关闭yarn
sbin/stop-yarn.sh

在这里插入图片描述

# hadoop02启动备用节点RM,在目录[/home/hadoop/app/hadoop]下执行
sbin/yarn-daemon.sh start resourcemanager# 关闭备用RM
sbin/yarn-daemon.sh stop resourcemanager

在这里插入图片描述

  1. 查看RM状态
bin/yarn rmadmin -getServiceState rm1
bin/yarn rmadmin -getServiceState rm2

操作三 Web查看YARN和测试YARN

1.windows系统下输入网址192.168.226.101:8088,成功开启YARN之后界面如下
在这里插入图片描述

  1. yarn自带wordcount程序,测试yarn的功能
  • 当前hdfs文件系统中/test目录下有文件1.txt,统计其中的字词数量
    在这里插入图片描述
    在这里插入图片描述

  • [home/hadoop/app/hadoop]目录下 , 执行如下命令

# 执行成功,如下图所示
bin/hadoop jar share/hadoop/mapreduce2/hadoop-mapreduce-examples-2.6.0-cdh5.10.0.jar wordcount /test/1.txt /test/output# 查看执行结果
bin/hdfs dfs -cat /test/output/*

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

注意:

  1. wordcount程序统计词频之后会产生output文件,如果当前存在output文件,再次创建output会报错;可以删除之后,再次执行wordcount程序

  2. yarn的配置文件存放在hadoop中的etc/hadoop文件下

二 HBase应用

操作一 官网下载 HBase压缩包

Apache 版本: http://archive.apache.org/dist/hbase/
CDH 版本: http://archive-primary.cloudera.com/cdh5/cdh/5/
这里选择下载 hbase-1.2.0-cdh5.10.0.tar.gz 版本的安装包,上传至主节点 app 目录。

操作二 修改4个配置文件;拷贝HDFS的2个配置文件;创建HBase日志目录

  1. 解压安装包并创建软链接
tar -zvxf  hbase-1.2.0-cdh5.10.0.tar.gz
ln -s hbase-1.2.0-cdh5.10.0.tar.gz hbase
  1. 修改hbase-site.xml、hbase-en.sh、regionservers、backup-masters配置文件
# hbase-site.xml
<configuration><property><name>hbase.zookeeper.quorum</name><value>hadoop01,hadoop02,hadoop03</value><!--指定Zookeeper集群节点--></property><property><name>hbase.zookeeper.property.dataDir</name><value>/home/hadoop/data/zookeeper/zkdata</value><!--指定Zookeeper数据存储目录--></property><property><name>hbase.zookeeper.property.clientPort</name><value>2181</value><!--指定Zookeeper端口号--></property><property><name>hbase.rootdir</name><value>hdfs://cluster1/hbase</value><!--指定HBase在HDFS上的根目录--></property><property><name>hbase.cluster.distributed</name><value>true</value><!--指定true为分布式集群部署--></property>
</configuration># hbase-en.sh # 含有如下环境变量
export JAVA_HOME=/home/hadoop/app/jdk
export HBASE_LOG_DIR=/home/hadoop/data/hbase/logs
export HBASE_PID_DIR=/home/hadoop/data/hbase/pids
export HBASE_MANAGES_ZK=false# regionservers
hadoop01
hadoop02
hadoop03# backup-masters # 配置备用节点
hadoop02
  1. 拷贝HDFS文件系统中的hdfs-site.xml 和core-site.xml文件,[/home/hadoop/app/hadoop/etc/hadoop]下执行
cp hdfs-site.xml ~/app/hbase/conf
cp core-site.xml ~/app/hbase/conf
  1. 创建HBase日志目录
runRemoteCmd.sh 'mkdir -p ~/data/hbase/logs' all

注意:hdfs-site.xml和core-site.xml文件中的这部分保持一致
在这里插入图片描述
在这里插入图片描述

操作三 hbase-1.2.0-cdh5.10.0 同步到其他节点,并创建软链接;集群启动hbase

  1. hbase同步到其他节点
deploy.sh  hbase-1.2.0-cdh5.10.0 ~/app slave
ln -s  hbase-1.2.0-cdh5.10.0 hbase
  1. 启动hbase,在[/home/hadoop/app/hbase]目录下执行。注意,HDFS已启动
# 在哪个节点启动HBase,哪个节点就是HBase Master
bin/start-hbase.sh #关闭HBase
bin/stop-hbase.sh

这里在hadoop01节点启动的HBase
在这里插入图片描述

操作四 web查看hbase

Windows系统下访问地址http://master:60010

在这里插入图片描述
在这里插入图片描述

注意

  1. 开机先开zk,再开dfs,再开hbase; 关机先关hbase,再关dfs,再关zk

  2. 在Hadoop集群中,在哪个节点上启动HBase,那个节点就会成为HBase Master,成为Master候选,而在多Master配置下,最终活跃Master由ZooKeeper选举决定;单Master配置下则没有选举过程

相关文章:

  • 爱普生SG-3031CM晶体振荡器成为高效节能的时钟理想之选
  • FAQ运用
  • MySQL 锁等待超时问题解析:Lock wait timeout exceeded;try restarting transaction
  • 文字光影扫过动效
  • GAEA情感坐标的技术架构与系统集成
  • KAG:通过知识增强生成提升专业领域的大型语言模型(二)
  • LIMS试验检测管理系统概要设计说明书,LIMS实验室系统建设方案
  • Go语言入门:目录与链接
  • make学习三:书写规则
  • 【质量管理】TRIZ(萃智)的工程系统进化法则
  • 交叉编译tcpdump静态编译单个文件
  • DHCP 服务器运行流程图
  • NHANES指标推荐:BUCR
  • uniapp-商城-40-shop 购物车 选好了 进行订单确认4 配送方式3 地址编辑
  • Spring_MVC 中的 JSON 数据处理与 REST 风格开发
  • 图论---最大流(Dinic)
  • Lua 第11部分 小插曲:出现频率最高的单词
  • 《MySQL 技术内幕-innoDB 存储引擎》笔记
  • 顶会招牌idea:机器学习+组合优化 优秀论文合集
  • 博物馆除湿控湿保卫战:M-5J1R 电解除湿科技如何重塑文物守护的未来
  • 周口一乡镇公务员“被老赖”,两年4场官司均败诉,市监局将线索移送公安厅
  • 我国首个核电工业操作系统发布,将在华龙一号新机组全面应用
  • 国家数据发展研究院在京正式揭牌
  • 拉卡拉一季度净利约1亿降超五成,去年净利3.5亿降逾23%
  • 瑞士外长答澎湃:瑞中都愿升级自贸协定,关税战没有任何好处
  • 美检察官向法庭提交通知,要求判处枪杀联合健康高管嫌疑人死刑