当前位置: 首页 > news >正文

大数据应用开发——大数据平台集群部署(四)

前言

大数据应用开发——大数据平台集群部署 

        安装虚拟机 

        集群基础设置

        在集群上安装jdk和hadoop

        安装mysql和hive

        安装spark和zookeeper、hbase

大数据应用开发——实时数据采集

大数据应用开发——实时数据处理

        Flink完成Kafka中的数据消费,将数据分发至Kafka的dwd层中

        并在HBase中进行备份

大数据应用开发——数据可视化

目录

        安装wget

        下载mysql5.7

        安装hive


在集群上安装mysqlhive

安装wget

查看系统版本及操作位数
[root@master ~]# cat /etc/centos-release
[root@master ~]# uname -m
下载安装包

阿里云镜像库 https://mirrors.aliyun.com/centos/7.9.2009/os/x86_64/Packages

wget-1.14-18.el7_6.1.x86_64.rpm

拷贝安装包进行安装
# 将下载好的wget安装包拷贝到对应的目录,然后cd到对应目录执行以下命令 
[root@master ~]# cd /home
[root@master home]# rpm -ivh wget-1.14-18.el7_6.1.x86_64.rpm
yum源处理

删除yum源

[root@master ~]# rm -rf /etc/yum.repos.d/*
下载阿里云yum源 http://mirrors.aliyun.com/repo/Centos-7.repo
拷贝yum源
# 把下载好的Centos-7.repo拷贝到/etc/yum.repos.d/下,没有该文件夹就手动新建一个
[root@master home]# cp Centos-7.repo /etc/yum.repos.d/
清除和生成yum缓存
# 清除缓存
[root@master home]# yum clean all
# 生成缓存
[root@master home]# yum makecache

下载mysql5.7

[root@master ~]# wget -i -c http://dev.mysql.com/get/mysql57-community-release-el7-10.noarch.rpm
[root@master ~]# yum -y install mysql57-community-release-el7-10.noarch.rpm
[root@master ~]# rpm --import https://repo.mysql.com/RPM-GPG-KEY-mysql-2022
[root@master ~]# yum -y install mysql-community-server
[root@master ~]# 
启动mysql
# 启动mysql
[root@master ~]# systemctl start mysqld       
# 设置开机启动mysql 
[root@master ~]# systemctl enable  mysqld     
# 查看mysql状态
[root@master ~]# systemctl status mysqld      
查看mysql密码
[root@master ~]# grep "password" /var/log/mysqld.log
mysql更改密码策略并重新设置密码开启root用户远程访问
# 数据库初始化 Password123$ 修改密码 YYYNYY 修改过程
[root@master ~]# mysql_secure_installation
[root@master ~]# mysql -uroot -pPassword123$
mysql> SHOW VARIABLES LIKE 'validate_password%';
mysql> set global validate_password_policy=LOW;
mysql> set global validate_password_length=6;
mysql> ALTER USER 'root'@'localhost' IDENTIFIED BY '123456';
mysql> use mysql;
mysql> SELECT User,Host FROM user;
mysql> GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY '123456' WITH GRANT OPTION;
mysql> FLUSH PRIVILEGES;

安装hive

解压apache-hive-3.1.2-bin.tar.gz并且改名为hive
[root@master software]# tar -zxf /opt/software/apache-hive-3.1.2-bin.tar.gz -C /opt/module/
[root@master software]# mv /opt/module/apache-hive-3.1.2-bin/ /opt/module/hive
添加hive的环境变量
[root@master software]# vi /etc/profile.d/my-env.sh
#HIVE_HOME
export HIVE_HOME=/opt/module/hive
export PATH=$PATH:$HIVE_HOME/bin
source /etc/profile 使配置生效
[root@master software]# source /etc/profile
解决日志jar包冲突进⼊/opt/module/hive/lib目
[root@master lib # mv log4j-slf4j-impl-2.10.0.jar log4j-slf4j-impl-2.10.0.jar.bak
hive元数据配置到mysql

拷贝MySQLJDBC驱动到hivelib目录

[root@master lib]# cp /opt/softwares/mysql-connector-java-5.1.37.jar /opt/module/hive/lib/

配置hive-env.sh 

[root@master lib]# cd .
[root@master hive]# cd conf/
[root@master conf]# cp hive-env.sh.template hive-env.sh
[root@master conf]# vi hive-env.sh
export JAVA_HOME=/opt/module/jdk1.8.0_212
export HADOOP_HOME=/opt/module/hadoop-3.1.3
export HIVE_HOME=/opt/module/hive
export HIVE_CONF_DIR=$HIVE_HOME/conf

配置MetaStoreMySQL

[root@master conf]# cp hive-default.xml.template hive-site.xml
[root@master conf]# vi hive-site.xml
5678dd删除所有
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration><property><name>javax.jdo.option.ConnectionURL</name><value>jdbc:mysql://master:3306/hivedb?createDatabaseIfNotExist=true&amp;useSSL=false</value></property><property><name>javax.jdo.option.ConnectionDriverName</name><value>com.mysql.jdbc.Driver</value></property><property><name>javax.jdo.option.ConnectionUserName</name><value>root</value></property><property><name>javax.jdo.option.ConnectionPassword</name><value>123456</value></property><property><name>hive.cli.print.current.db</name><value>true</value></property><property><name>hive.cli.print.header</name><value>true</value></property><property><name>hive.metastore.schema.verification</name><value>false</value></property><property><name>hive.exec.mode.local.auto</name><value>true</value></property>
</configuration>

在mysql创建元数据库metastore

mysql> create database metastore;
Query OK, 1 row affected (0.00 sec)
mysql> exit

解决guava.jar冲突问题

[root@master lib]# rm -rf guava-19.0.jar
[root@master lib]# cp /opt/module/hadoop-3.1.3/share/hadoop/common/lib/guava-27.0-jre.jar /opt/module/hive/lib/
初始化元数据库
[root@master lib]# schematool -initSchema -dbType mysql -verbose

修改元数据库字符集,解决乱码问题

[root@master lib]# mysql -uroot -p123456
mysql> use hivedb;
Reading table information for completion of table and column names
You can turn off this feature to get a quicker startup with -A
Database changed
mysql> alter table COLUMNS_V2 modify column COMMENT varchar(256)
character set utf8;
Query OK, 0 rows affected (0.01 sec)
Records: 0 Duplicates: 0 Warnings: 0
mysql>alter table TABLE_PARAMS modify column PARAM_VALUE mediumtext
character set utf8;
启动hive客户端
[root@master ~]# hive

相关文章:

  • 【KWDB 创作者计划】_上位机知识篇---Arduino
  • 什么是 C++中的const?
  • SpringBoot Actuator指标收集:Micrometer与Prometheus集成
  • Matlab 基于模型参考自适应法和SVPWM的异步电机控制
  • `ImadcnIdentifierGenerator` 深度解析
  • Java学习笔记(数组,方法)
  • JavaWeb 课堂笔记 —— 16 MyBatis 动态SQL
  • Img2img-turbo 在2080Ti上的测试笔记
  • 双目视觉中的动态畸变矫正与跨视角信息融合
  • 4月19日记(补)算了和周日一块写了 4月20日日记
  • 前端工程化之自动化部署
  • 探秘STM32如何成为现代科技的隐形引擎
  • C++栈操作集合
  • SpringBoot编写单元测试
  • acwing--动态规划【线性dp】4/20、4/21
  • Lora 微调自定义device_map
  • 第一章:MySQL视图基础
  • 苍穹外卖阶段性总结 (超详细版)
  • 阿里HumanAIGC 团队开源实时数字人项目ChatAnyone
  • 俄罗斯方块-简单开发版
  • 马上评|与其争论董宇辉该不该获奖,不如多关心文学
  • 深一度|上海半马,展示“体育+”无限可能的路跑狂欢
  • 2025中国互联网企业家座谈会在京召开
  • “云南舞蹈大家跳”暨牟定“三月会”下周举行,城际公交免票
  • 新消费观察 | 重点深耕,外资科技企业继续看好中国发展
  • 天文学家、民盟江苏省委会原常务副主委任江平逝世