论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com
»
论坛
›
数据库
›
分布式数据库
›
Hadoop不同版本的区别
Hadoop不同版本的区别
张春
论坛元老
|
2024-12-10 13:02:21
|
显示全部楼层
|
阅读模式
楼主
主题
1035
|
帖子
1035
|
积分
3105
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
免费springboot,vue,springcloudalibaba视频,有兴趣可以看看
<!-- springboot,springboot整合redis,整合rocketmq视频: -->
https://www.bilibili.com/video/BV1nkmRYSErk/?vd_source=14d27ec13a4737c281b7c79463687112
<!-- springcloudalibaba,openfeign,nacos,gateway,sso视频:-->
https://www.bilibili.com/video/BV1cFDEYWEkY/?vd_source=14d27ec13a4737c281b7c79463687112
<!-- vue+springboot前后端分离视频:-->
https://www.bilibili.com/video/BV1JLSEYJETc/?vd_source=14d27ec13a4737c281b7c79463687112
<!-- shiro视频:-->
https://www.bilibili.com/video/BV1YVUmYJEPi/?vd_source=14d27ec13a4737c281b7c79463687112
复制代码
Hadoop的不同版本之间存在一些显著的区别,以下是一些主要的版本差异:
Hadoop 1.x vs Hadoop 2.x
YARN的引入
:Hadoop 2.0引入了YARN(Yet Another Resource Negotiator),将Hadoop从以MapReduce为中心的平台转变为更加多功能的数据处理惩罚平台。
容错机制
:Hadoop 1.x主要通过复制来处理惩罚容错,而Hadoop 2.x可以通过Erasure编码处理惩罚容错。
存储方案
:Hadoop 1.x使用3X副本方案,而Hadoop 2.x支持HDFS中的擦除编码,存储开销从200%降低到50%。
时间线服务
:Hadoop 2.x使用具有可伸缩性问题的旧时间轴服务,而Hadoop 3.x改进了时间线服务v2,提高了时间线服务的可扩展性和可靠性。
Hadoop 2.x vs Hadoop 3.x
Java版本支持
:Hadoop 2.x的最低Java支持版本是Java 7,而Hadoop 3.x的最低支持版本是Java 8。
数据平衡
:Hadoop 2.x使用HDFS平衡器进行数据平衡,而Hadoop 3.x使用Intra-data节点平衡器。
文件体系支持
:Hadoop 3.x扩展了对更多文件体系的支持,包罗Microsoft Azure Data Lake文件体系。
Datanode资源
:在Hadoop 3.x中,Datanode资源可以用于其他应用步伐,雷同于Hadoop 2.x。
MapReduce API兼容性
:Hadoop 3.x保持了与Hadoop 1.x步伐兼容的MR API,以便在Hadoop 3.x上执行。
支持操作体系
:Hadoop 3.x进一步支持了Microsoft Windows。
单点故障(SPOF)
:Hadoop 3.x具有SPOF的功能,Namenode失败后可以自动恢复,无需人工干预。
HDFS联盟
:Hadoop 3.x支持多个NameNode用于多个Namespace,提高了体系的可扩展性。
YARN Timeline Service
:Hadoop 3.x提供了新版本的YARN Timeline Service,提供了更加灵活和高效的应用步伐历史记载和监控功能。
Hadoop Common包的升级
:Hadoop 3.x中升级了Hadoop Common包,包罗一些新的功能和改进,以提高体系的性能和可靠性。
流式数据处理惩罚改进
:Hadoop 3.x中对流式数据处理惩罚功能进行了改进,包罗对Apache Kafka和Apache Storm等流处理惩罚框架的更好支持。
支持更多的硬件和操作体系平台
:Hadoop 3.x扩展了对更多硬件和操作体系平台的支持。
Shell脚本重构
:Hadoop Shell脚本已被重写,以修复许多长期存在的错误并包罗一些新功能。
MapReduce任务本地优化
:MapReduce增长了对map输出网络器的本地执行的支持,对于shuffle麋集型工作,这可以使性能提高30%或更多。
支持多个NameNode
:Hadoop 3.x支持两个以上的NameNode,提高了群集的容错能力。
默认服务端口变更
:Hadoop 3.x中多个服务的默认端口已被更改,减少了与其他应用步伐的端口冲突问题。
DataNode内部负载均衡
:Hadoop 3.x在DataNode内部添加了负载均衡功能,以优化数据存储和访问性能。
支持文件体系连接器
:Hadoop 3.x提供了对多种文件体系的连接器支持,增强了Hadoop与外部存储体系的集成能力。
Hadoop 3.3.x vs Hadoop 3.4.0
DistCp内存使用优化
:Hadoop 3.4.0中添加了-useiterator选项,使用listStatusIterator构建列表,减少客户端构建列表时的内存使用。
URI缓存
:DFS客户端在创建socket所在时可以使用URI缓存,减少URI对象创建的频率。
自动密钥库重新加载
:增长了自动重新加载密钥库的功能。
Quota初始化线程增长
:NameNode启动过程中的默认Quota初始化线程数量从4增长到12。
默认字符集替换为UTF-8
:全部默认字符集使用已被替换为UTF-8。
这些是Hadoop不同版本之间的主要区别,每个新版本都在性能、可靠性、兼容性和易用性方面进行了改进和增强。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
张春
论坛元老
这个人很懒什么都没写!
楼主热帖
聊聊容灾演练-练什么|深度好文 ...
Eclipse连接SQLServer2008
【CSDN官方】开源又好用的国产SPL ...
Redis概述及基本数据结构
Velero系列文章(四):使用Velero进行 ...
2022十三届蓝桥杯国赛题解
彻底搞懂Docker容器与Kraft模式kafka集 ...
干货|APP自动化Android特殊控件Toast识 ...
4. 事务和锁
linux跟踪技术之ebpf
标签云
AI
运维
CIO
存储
服务器
浏览过的版块
物联网
Oracle
终端安全
云原生
SQL-Server
快速回复
返回顶部
返回列表