瑞星 发表于 昨天 15:48

中小型企业大数据平台全栈搭建:Hive+HDFS+YARN+Hue+ZooKeeper+MySQL+Sqoop+Azkaban 保姆级配置指南

配景‌

对于中小企业,构建一套完备的当地化大数据平台需兼顾成本(5w内)、易用性和扩展性。基于Hadoop生态的组件(HDFS、YARN、Hive)联合数据工具(Sqoop、Azkaban)、可视化工具(Hue)和协调服务(ZooKeeper),能够实现从数据存储、盘算、调理到可视化的全链路管理。
本文基于生产情况实践,具体讲解以下组件的安装、配置与联动:


[*]存储与盘算‌:HDFS、YARN、Hive
[*]数据迁移‌:Sqoop(Hive与MySQL数据互通)
[*]调理系统‌:Azkaban
[*]可视化与协调‌:Hue、ZooKeeper
[*]元数据管理‌:MySQL
(一、情况规划与依靠准备‌中)提供全组件官方下载地址‌ 和 ‌配置模板‌,助您快速搭建企业级数据平台!
一、情况规划与依靠准备‌

1. 服务器规划(3节点集群)

      节点脚色   IP地址   部署服务       Master‌   192.168.1.101   NameNode、ResourceManager、Hive、Hue、ZooKeeper、Azkaban Web Server、MySQL   Worker1‌   ‌192.168.1.102   DataNode、NodeManager、ZooKeeper、Azkaban Executor   Worker2‌   ‌192.168.1.103   DataNode、NodeManager、ZooKeeper 2. 系统与依靠‌



[*]操作系统‌:CentOS 7.9(全部节点)
[*]JDK‌:JDK 8u381(下载地址)
[*]‌MySQL‌:5.7.44(存储Hive元数据)
[*]Python‌:3.6+(Hue依靠)
3. Hadoop生态组件版本与下载路径

      组件   稳固版本   官方下载路径       ‌HDFS‌   3.3.6   Apache Hadoop Releases   ‌YARN‌   3.3.6   同上   ‌Hive‌   3.1.3   Apache Hive Downloads   ‌Hue‌   4.11.0   Gethue Releases   ‌ZooKeeper‌   3.7.1   Apache ZooKeeper   ‌MySQL‌   5.7.44   MySQL Community Server   ‌Sqoop‌   1.4.7   Apache Sqoop   ‌Azkaban‌   4.0.0   Azkaban GitHub Releases   ‌Python 3.6+‌   EPEL 仓库安装   1. sudo yum install -y epel-release
2. sudo yum install -y python36 python36-devel 4. 架构图

https://i-blog.csdnimg.cn/direct/473131aa0e904a8dac8eaf3fdb9b1101.png
二、Hadoop(HDFS+YARN)安装与配置‌

1. 下载与解压(全部节点)

wget https://dlcdn.apache.org/hadoop/common/hadoop-3.3.6/hadoop-3.3.6.tar.gz
tar -zxvf hadoop-3.3.6.tar.gz -C /opt
mv /opt/hadoop-3.3.6 /opt/hadoop
2. HDFS高可用配置

1)core-site.xml‌
<configuration>
    <property>
      <name>fs.defaultFS</name>
      <value>hdfs://mycluster</value>
    </property>
    <property>
      <name>hadoop.tmp.dir
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: 中小型企业大数据平台全栈搭建:Hive+HDFS+YARN+Hue+ZooKeeper+MySQL+Sqoop+Azkaban 保姆级配置指南