论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
ToB企服应用市场:ToB评测及商务社交产业平台
»
论坛
›
大数据
›
数据仓库与分析
›
灵活、可用、高扩展,EasyMR 带来全新 Yarn 的队列管理 ...
灵活、可用、高扩展,EasyMR 带来全新 Yarn 的队列管理功能及可视化配置 ...
老婆出轨
金牌会员
|
2023-11-18 03:17:28
|
显示全部楼层
|
阅读模式
楼主
主题
689
|
帖子
689
|
积分
2067
YARN
(Yet Another Resource Negotiator)是 Hadoop 生态系统中的
资源调度器
,主要用于资源管理和作业调度。YARN 自身具备
队列管理功能
,通过对 YARN 资源队列进行配置和管理,实现集群资源的分配,以满足不同应用和用户的需求。YARN 的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。
在大数据环境下,企业通常会有多个应用程序同时运行,这些应用程序可能具有不同的资源需求和优先级。为了合理分配和管理资源,避免资源争夺和冲突,需要对资源进行划分和调度。
本文将为大家介绍各类资源划分和队列管理方式,以及
EasyMR
新上线的 YARN 的队列管理功能,如何通过
可视化界面管理
,给广大用户带来更高效和便捷的队列管理体验。
资源划分方式
在大数据领域中,常见的资源划分方式通常有以下几种:
按照应用程序的类型或特性进行分类
例如,可以将 CPU 密集型的应用程序放置在一个队列中,将内存密集型的应用程序放置在另一个队列中。通过这种方式,可以确保不同类型的应用程序获得各自所需的资源,并避免资源浪费和不均衡的情况发生。
按照应用程序的优先级进行分类
对于一些重要的任务或紧急任务,可以为它们分配更高的
资源配额
和优先级,以保证它们能够得到及时响应和优先处理。而对于一些次要的任务或低优先级的任务,可以为它们分配较低的资源配额,以确保其他重要任务的执行效率和优先级。
按照部门或团队的需求进行分类
不同部门可能对资源有不同的需求,通过为不同部门分配独立的资源队列,可以确保每个部门能够独立管理和分配自己的资源,不会相互干扰或影响。
虽然 YARN 自身具备队列管理功能,但在实际使用中,YARN 只能通过配置文件进行资源队列的管理,这种方式相对繁琐且需要一定的技术知识。
CDH & HDP
业界首选的基础开源数据平台要数基于 Hadoop 分布式技术的 CDH 和 HDP。
CDH(Cloudear Manager)
● Fair Share 策略
CDH 的
Cloudear Manager
采用
Fair Share 策略
,每个用户或组织的权重和优先级需要事先确定,需要管理者对系统的使用情况有较好的了解。如果这些设置不合理,可能会导致某些用户或组织长期不能获得足够的资源来执行任务。
● 调度效率影响
当有多个任务或作业同时提交时, Fair Share 的算法需要进行复杂的计算,导致调度效率下降。
HDP(Ambari)
● 管理复杂性
Ambari 采用
可视化拖拽
进行资源调整,操作简单。但是由于 Yarn 资源队列必须保证同一级队列资源之和等于100%,因此单一队列资源调整,必须调整其他队列资源保证队列资源之和等于100%,管理复杂度比较高。
● 资源配平
为保证同级队列资源之和等于100%,创建或者删除队列时,需要调整其他队列资源保证队列资源。
EasyMR 的 Yarn 资源队列管理功能
基于上述优缺点,为了改善队列管理体验,提供一个更直观、更详细的信息展示和简易明了的操作界面进行队列资源管理,
EasyMR
上线了 Yarn 的队列管理功能进行可视化界面管理,提高其灵活性、可用性和可扩展性。
EasyMR 的 Yarn 资源队列管理特点
● 容量策略
基于最大、最小
资源容量策略
,限制队列的资源使用,用户或部门可以根据自己业务需求创建属于自己的
专属资源队列
。
● 队列独立
当调整队列资源大小或者创建删除队列时,无需调整其他队列资源大小,仅需保证同一父队列下所有子队列资源小于等于100%即可。
● 用户对接
支持对接 LDAP、
OAuth 用户体系
,通过对 Yarn 资源队列-叶子队列绑定用户、用户组,实现了基于用户和用户组的访问控制和资源分配,保障资源安全。
叶子队列
:是指不能再分配子队列的队列,它可以直接用来分配资源给应用程序,在叶子队列中,可以直接运行应用程序或者将它们放置在默认分配队列中进行调度。
非叶子队列
:可以再分配子队列,以进一步划分资源并进行资源管理,不支持应用程序和任务的提交。例如,可以将 CPU 密集型应用程序和内存密集型应用程序分别放置在不同的子队列中,并为它们分配不同的资源配额和优先级。
父队列
:通常是一个非叶子队列,它包含多个子队列,并控制着这些子队列的资源分配和优先级等属性。例如,一个父队列可以包含多个子队列“memory”、“cpu”等,通过为不同的子队列设置不同的资源配额和优先级,可以更好地管理集群中的资源。
子队列
:是父队列的一部分,它们继承了父队列的所有属性,并具有自己的资源配额和优先级等属性。在子队列中可以运行应用程序不支持再次划分子队列。
EasyMR
如何创建 Yarn 资源队列,在之前的文章《
大数据计算引擎 EasyMR 如何简单高效管理 Yarn 资源队列
》中进行了详细的介绍,请点击阅读。
未来,EasyMR 会持续优化 Yarn 资源队列管理,完善资源队列的安全审计与队列监控,通过将资源队列与需求背景进行对应,制定更优资源分配策略,以更好地满足企业在大数据环境下的资源管理和调度需求。
《数栈产品白皮书》:
https://www.dtstack.com/resources/1004?src=szsm
《数据治理行业实践白皮书》下载地址:
https://www.dtstack.com/resources/1001?src=szsm
想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:
https://www.dtstack.com/?src=szbky
同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术qun」,交流最新开源技术信息,qun号码:30537511,项目地址:
https://github.com/DTStack
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
老婆出轨
金牌会员
这个人很懒什么都没写!
楼主热帖
1000套安卓(Android)毕业设计(带论 ...
Git + Jenkins 自动化 NGINX 发布简易 ...
在工作中离屏真的不重要吗,代码优化就 ...
SRC基础抓包
【Linux学习】网络基础 和 SOCKET套接 ...
设计模式必知必会系列终章
元类(一)
day09-达人探店
python采集世界大学排名并作数据可视化 ...
牛客SQL刷题第三趴——SQL大厂面试真题 ...
标签云
挺好的
服务器
快速回复
返回顶部
返回列表