论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com技术社区
»
论坛
›
大数据
›
数据仓库与分析
›
ubuntu22.04下Hadoop单机模式伪分布式安装过程【全网最 ...
ubuntu22.04下Hadoop单机模式伪分布式安装过程【全网最详细】 ...
王國慶
论坛元老
|
2025-4-8 22:54:11
|
显示全部楼层
|
阅读模式
楼主
主题
1864
|
帖子
1864
|
积分
5596
ubuntu22.04下Hadoop单机模式伪分布式安装过程
一、Hodoop伪分布式搭建
1 创建新用户,首先切换为root用户,添加新用户hadoop
sudo useradd -m hadoop -s /bin/bash
复制代码
2设置暗码
sudo passwd hadoop
复制代码
3为新用户赋予root权限
sudo adduser hadoop sudo
复制代码
3然后切换到Hodoop用户,实行更新命令
sudo apt-get update
sudo apt-get upgrade
复制代码
4部分linux系统会自带vim编辑器,但若在终端无法启动该编辑器,则需要安装以待后续编辑配置文件,接下来跳出的提示回复Y即可
sudo apt-get install vim
复制代码
参考 vim介绍
二、配置ssh
根据Hadoop分布式系统的特性,在任务筹划分发、心跳监测、任务管理、多租户管理等功能上,需要通过SSH(Secure Shell)进行通讯,所以必须安装配置SSH。另因为Hadoop没有提供SSH输入暗码登录的形式,因此需要将所有机器配置为NameNode可以无暗码登录的状态
1.安装ssh服务
sudo apt-get install openssh-server
复制代码
2.ssh本地连接
ssh localhost
复制代码
3.设置无暗码登录,进行无暗码登录的设置,首先先退出刚刚ssh localhost
的连接
exit
复制代码
4.接下来生成暗码并加入授权
cd ~/.ssh/
ssh-keygen -t rsa //遇到提示,一路回车即可
cat ./id_rsa.pub >> ./authorized_keys //加入授权
复制代码
##三、配置Java情况,
3.1在虚拟机中安装jdk,安装jdk之前,需要先查抄一下有没有安装过jdk java -version查看有没有,如果有,请卸载干净再下
3.2.输入命令进行命令行安装
sudo apt install openjdk-8-jre-headless
复制代码
3.3安装完后,输入echo $JAVA_HOME查看jdk目次,
这步很关键
我的如图所示
3.4通过vim编辑器打开情况变量的设置文件:
sudo vim ~/.bashrc
复制代码
3.5首先
到达文件底部
,按
o
字母在当前行的下一行添加以下语句
export JAVA_HOME=
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH
复制代码
3.6按Esc键进入普通模式,然后输入**:wq**保存修改。然后使情况变量生效
source ~/.bashrc
复制代码
3.7下载最新版Hadoop3.4.0
下载地址 Hadoop
3.8进入解压包存放的文件夹,右键属性查看压缩包的绝对路径,然后解压至/usr/local目次下
sudo tar -zxf /home/hadoop/下载/hadoop-3.4.0.tar.gz -C /usr/local
复制代码
3.9进入刚刚解压后存放的目次下
cd /usr/local/
复制代码
3.10将该文件夹的名字重命名为hadoop,屏蔽掉版本号的信息,使得后续命令行输入更为简便
sudo mv ./hadoop-3.4.0/ ./hadoop
复制代码
3.11将已重命名的该文件夹的拥有者,指定给用户hadoop,缺少这一步,将导致后续操纵特别是运行Hadoop时,反复因权限不足而制止:
sudo chmod 777 -R /usr/local/hadoop
复制代码
R:对现在目次下的所有档案与子目次进行相同的权限变动(即以递回的方式逐个变动)
777:高权限(读、写、实行)
3.12 hadoop现实运行时仍会出现找不到java-jdk的现象,故再对hadoop的情况文件进行修改,进入目次:
cd ./hadoop/etc/hadoop
复制代码
3.13使用vim编辑器,打开情况变量文件
sudo vim ~/.bashrc
复制代码
3.14按字母
o
进入插入模式在当前行的下一行添加该语句
#HADOOP VARIABLES START
export HADOOP_INSTALL=/usr/local/hadoop
export PATH=$PATH:$HADOOP_INSTALL/bin
export PATH=$PATH:$HADOOP_INSTALL/sbin
export HADOOP_MAPRED_HOME=$HADOOP_INSTALL
export HADOOP_COMMON_HOME=$HADOOP_INSTALL
export HADOOP_HDFS_HOME=$HADOOP_INSTALL
export YARN_HOME=$HADOOP_INSTALL
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_INSTALL/lib/native
export HADOOP_OPTS="-Djava.library.path=$HADOOP_INSTALL/lib"
#HADOOP VARIABLES END
复制代码
3.15按Esc键退出,然后输入**:wq**保存修改。然后使情况变量生效:
source ~/.bashrc
复制代码
3.16hadoop框架已经搭建好了,可以通过调用版本号进行测试hadoop是否可用,正确搭建应该能看到hadoop的版本号等信息:
cd /usr/local/
hadoop./bin/hadoop version
复制代码
四、配置文件
1.打开hadoop文件夹下的hadoop文件中,配置hadoop-env.sh
sudo vim /usr/local/hadoop/etc/hadoop/hadoop-env.sh
复制代码
添加如下代码
export JAVA_HOME=**改成自己的jdk路径**
export HADOOP=/usr/local/hadoop
export PATH=$PATH:/usr/local/hadoop/bin
复制代码
2.先打开 core-site.xml文件,将替换为以下内容
sudo vim /usr/local/hadoop/etc/hadoop/core-site.xml
复制代码
添加如下语句
<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value>file:/usr/local/hadoop/tmp</value>
<description>Abase for other temporary directories.</description>
</property>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
复制代码
3.打开hdfs-site.xml文件:hdfs-site.xml进行同样的替换操纵
sudo vim /usr/local/hadoop/etc/hadoop/hdfs-site.xml
复制代码
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/usr/local/hadoop/tmp/dfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/usr/local/hadoop/tmp/dfs/data</value>
</property>
</configuration>
复制代码
打开yarn-env.sh,配置yarn-env.sh文件,添加以下代码
sudo vim /usr/local/hadoop/etc/hadoop/yarn-env.sh
复制代码
添加自己变量
JAVA_HOME=和上面的变量地址一样
复制代码
6.配置yarn-site.xml,将替换为以下内容
sudo vim /usr/local/hadoop/etc/hadoop/yarn-site.xml
复制代码
<configuration>
<!-- Site specific YARN configuration properties -->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
<property>
<name>yarn.resourcemanager.address</name>
<value>127.0.0.1:8032</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address</name>
<value>127.0.0.1:8030</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address</name>
<value>127.0.0.1:8031</value>
</property>
</configuration>
复制代码
五 启动HDFS伪分布式模式
格式化namenode
hdfs namenode -format
复制代码
表现信息内若包含以下内容successfully formatted,则阐明乐成格式化
2.启动hdfs
start-all.sh
复制代码
3.表现进程
jps
复制代码
4.有六个进程表现正确
5.打开浏览器localhost:9870/
注:因为安装的是3.x版本,所以是9870,而不是57007,这个是2.x版本的
6.打开浏览器http://localhost:8088/
7.乐成安装,制止Hadoop
stop-all.sh
复制代码
参考原文链接:https://blog.csdn.net/weixin_50767513/article/details/128078096进行详细补充和修改,有安装不了的可以评论,我帮助办理
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
王國慶
论坛元老
这个人很懒什么都没写!
楼主热帖
webman
不想打开 IDE 的摆烂一天
Jupyter Notebook,太强大了
React技巧之发出http请求
【Shashlik.EventBus】.NET 事件总线, ...
【网络】https单向认证和双向认证 ...
APP内存管理
Apache DolphinScheduler 3.0.0 正式版 ...
Bluecmsv1.6-代码审计
java如何显示"html转义字符"对应的原始 ...
标签云
AI
运维
CIO
存储
服务器
浏览过的版块
鸿蒙
SQL-Server
分布式数据库
Oracle
网络安全
移动端开发
云原生
快速回复
返回顶部
返回列表