物联网架构之Hadoop - ToB企服应用市场:ToB评测及商务社交产业平台

关闭防火墙

setenforce 0
sed -i '/^SELINUX=/s/enforcing/disabled/' /etc/selinux/config
systemctl stop firewalld
systemctl disable firewalld

复制代码

为各个节点设置主机名

hostnamectl set-hostname node1
bash
hostnamectl set-hostname node2
bash
hostnamectl set-hostname node3
bash

复制代码

修改每台主机的hosts文件

vim /etc/hosts
192.168.10.101 node1
192.168.10.102 node2
192.168.10.103 node3

复制代码

创建hdoop用户组和hduser用户

[root@node1 ~]# groupadd hadoop
[root@node1 ~]# useradd -g hadoop hduser
[root@node1 ~]# passwd hduser

复制代码

为hduser用户授权

gpasswd -a hduser wheel
[root@node1 ~]# visudo
##在末尾添加：
hduser ALL=(ALL) ALL

复制代码

安装JDK

rpm -ivh jdk-8u171-linux-x64.rpm
##安装完成之后查看
java --version
[root@node1 ~]# vim /etc/profile
在末尾添加：
export JAVA_HOME=/usr/java/jdk1.8.0_171-amd64
export CLASSPATH=$JAVA_HOME/lib:$CLASSPATH
export PATH=$JAVA_HOME/bin:$PATH
[root@node1 ~]# source /etc/profile

复制代码

配置免暗码登录（在node1上配置）

[root@node1 ~]# su - hduser
[hduser@node1 ~]$ ssh-keygen -t rsa //一路回车键即可
[hduser@node1 ~]$ ssh-copy-id hduser@node1
[hduser@node1 ~]$ ssh-copy-id hduser@node2
[hduser@node1 ~]$ ssh-copy-id hduser@node3

复制代码

安装Hadoop

将hadoop包拷贝到hduser的家目次并解压
1. ##在node1上操作
2. [hduser@node1 ~]$ tar zxvf hadoop-2.6.5.tar.gz
3. [hduser@node1 ~]$ mv hadoop-2.6.5 hadoop
复制代码
配置hadoop的情况变量
1. [hduser@node1 ~]$ sudo vim /etc/profile
2. ##在末尾添加：
3. export HADOOP_HOME=/home/hduser/hadoop
4. export PATH=$HADOOP_HOME/bin:$PATH
6. [hduser@node1 ~]$ source /etc/profile
复制代码
配置hadoop-env.sh****文件
1. [hduser@node1 ~]$ cd ~/hadoop/etc/hadoop/
2. [hduser@node1 hadoop]$ vim hadoop-env.sh
3. 在末尾添加：
4. export JAVA_HOME=/usr/java/jdk1.8.0_171-amd64
复制代码
修改yarn-env.sh文件
1. [hduser@node1 hadoop]$ vim yarn-env.sh
2. 在末尾添加
3. export JAVA_HOME=/usr/java/jdk1.8.0_171-amd64
复制代码
修改slaves文件
1. [hduser@node1 hadoop]$ vim slaves
2. ##清空文件中原有的内容
3. node2
4. node3
复制代码
编辑core-site.xml文件
1. [hduser@node1 hadoop]$ vim core-site.xml
2. ##在末尾找到<configuration>模块
3. ##在里面添加配置：
4. <configuration>
5. <property>
6. <name>fs.defaultFS</name>
7. <value>hdfs://node1:9000</value>
8. </property>
9. <property>
10. <name>hadoop.tmp.dir</name>
11. <value>file:/home/hduser/hadoop/tmp</value>
12. </property>
13. </configuration>
复制代码
编辑hdfs-site.xml文件
1. [hduser@node1 hadoop]$ vim hdfs-site.xml
2. ##在末尾找到<configuration>模块
3. ##在里面添加：
4. <configuration>
5. <property><name>dfs.namenode.secondary.http-address</name><value>node1:50090</value>
6. </property>
7. <property>
8. <name>dfs.namenode.name.dir</name>
9. <value>file:/home/hduser/hadoop/dfs/name</value>
10. </property>
11. <property>
12. <name>dfs.datanode.data.dir</name>
13. <value>file:/home/hduser/hadoop/dfs/data</value>
14. </property>
15. <property>
16. <name>dfs.replication</name>
17. <value>2</value>
18. </property>
19. <property>
20. <name>dfs.webhdfs.enabled</name>
21. <value>true</value>
22. </property>
23. </configuration>
复制代码
备注：
名称节点和数据节点的存放位置，文件副本数和读取权限。
修改mapred-site.xml文件
1. [hduser@node1 hadoop]$ cp mapred-site.xml.template mapred-site.xml
2. [hduser@node1 hadoop]$ vim mapred-site.xml
3. ##在末尾找到<configuration>模块，在里面添加：
4. <configuration>
5. <property>
6. <name>mapreduce.framework.name</name>
7. <value>yarn</value>
8. </property>
9. <property>
10. <name>mapreduce.jobhistory.address</name>
11. <value>node1:10020</value>
12. </property>
13. <property>
14. <name>mapreduce.jobhistory.webapp.address</name>
15. <value>node1:19888</value>
16. </property>
17. </configuration>
复制代码
备注：Mapreduce作业记录的web地址和端口
修改yarn-site.xml文件
1. [hduser@node1 hadoop]$ vim yarn-site.xml
4. <configuration>
6. <property>
7. <name>yarn.nodemanager.aux-services</name>
8. <value>mapreduce_shuffle</value>
9. </property>
10. <property>
11. </property>
12. <property>
13. <name>yarn.resourcemanager.address</name>
14. <value>node1:8032</value>
15. </property>
16. <property>
17. <name>yarn.resourcemanager.scheduler.address</name>
19. <value>node1:8030</value>
20. </property>
21. <property>
22. <name>yarn.resourcemanager.resource-tracker.address</name>
23. <value>node1:8035</value>
24. </property>
25. <property>
26. <name>yarn.resourcemanager.admin.address</name>
27. <value>node1:8033</value>
28. </property>
29. <property>
30. <name>yarn.resourcemanager.webapp.address</name>
31. <value>node1:8088</value>
32. </property>
34. </configuration>
复制代码
备注：
resourcemanager、nodemanager的通信端口，web端口等信息
将hadoop目次拷贝到其他节点上
1. [root@node1 ~]#scp -r /home/hduser/hadoop node2:/home/hduser
2. [root@node1 ~]#scp -r /home/hduser/hadoop node3:/home/hduser
复制代码

验证安装配置

在 Master 主机（node1）上格式化 NameNode
1. [hduser@node1 ~]$ cd hadoop/
2. [hduser@node1 hadoop]$ bin/hdfs namenode -format
3. [hduser@node1 hadoop]$ sbin/start-dfs.sh
复制代码
查看进程
1. [hduser@node1 hadoop]$ jps
2. ##16721 Jps
3. ##15687 NameNode
4. ##15866 SecondaryNameNode
复制代码
启动yarn
1. [hduser@node1 hadoop]$ sbin/start-yarn.sh
复制代码
查看集群情况
1. [hduser@node1 hadoop]$ bin/hdfs dfsadmin -report
复制代码
欣赏器查看 HDFS 运行状态：
1. http://192.168.10.101:50070
复制代码

运行 Hadoop 的 WordCount 步伐

创建测试文件的目次
1. [hduser@node1 ~]$ mkdir ~/file
复制代码
编辑测试文件
1. [hduser@node1 ~]$ cd ~/file/
3. [hduser@node1 file]$ echo "ni hao hadoop">file1.txt
4. [hduser@node1 file]$ echo "hello hadoop hi china">file2.txt
复制代码
启动hadoop并创建hdfs目次
1. [hduser@node1 file]$ cd ~/hadoop/
2. [hduser@node1 hadoop]$ sbin/start-all.sh
3. [hduser@node1 hadoop]$ bin/hadoop fs -mkdir /input2
复制代码
将file1和file2拷贝到hdfs存储目次中
1. [hduser@node1 hadoop]$ bin/hadoop fs -put ~/file/file* /input2/
2. [hduser@node1 hadoop]$ bin/hadoop fs -ls /input2/
复制代码
执行WordCount步伐，对文件举行统计
1. [hduser@node1 hadoop]$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.5.jar wordcount /input2/ /output2/wordcount1
复制代码
注意：输出目次不能已存在，否则不会输出
查看执行结果
1. [hduser@node1 hadoop]$ bin/hadoop fs -cat /output2/wordcount1/*
复制代码
如果看到输出结果证明hadoop安装成功