IT评测·应用市场-qidao123.com技术社区

标题: 如安在AWS上构建Apache DolphinScheduler [打印本页]

作者: 东湖之滨    时间: 2024-7-19 16:51
标题: 如安在AWS上构建Apache DolphinScheduler
弁言

随着云盘算技术的发展,Amazon Web Services (AWS) 作为一个开放的平台,不停在帮助开发者更好的在云上构建和使用开源软件,同时也与开源社区紧密合作,推动开源项目的发展。
本文重要探讨2024年值得关注的一些开源软件及其在AWS上的应用情况,希望能够给大家参考使用!
2024年纪据开源软件的趋势

这张图是根据海外的数据工程师总结的数据开源软件landscape,我们可以观察到一些关键的趋势:

数据存储与管理

数据湖与数据处理

DataOps

作为一个开放的云平台,AWS不但提供技术支持,还积极与环球社区举行深度合作,帮助开发者和企业在云上构建和扩展他们的开源项目。
接下来我们总结一下开源软件为什么这么重要?是因为它们不但提供了机动性和创新的加速,而且还帮助企业优化成本并进步产物的结实性。
开源软件的四大上风

机动性和可定制性

开源软件的一个重要优点是其机动性和高度的可定制性。因为源码直接掌握在开发者或客户手中,用户可以根据自己企业的特定需求来修改和优化软件,使其更加符合自己的业务场景。
加速创新

从流式数据处理到数据堆栈和湖仓一体化,再到DataOps和人工智能,许多创新技术都是起首在开源社区中提出并发展起来的。关注开源软件,就是紧跟创新的步伐。
成本优化

无论是传统IDC机房的客户还是在云上有较大规模的客户,他们都关注怎样优化成本。开源软件提供了一种低落商业软件成本、优化资源使用的有效途径,帮助企业减轻经济负担。
社区里边有一句名言“社区重于代码”,一个开源项目的的乐成不但仅是代码的产出,而是整个社区生态的繁荣,开源软件通常拥有活跃的社区支持,代码和功能不停迭代和更新。像Apache DolphinScheduler这样的项目,其成为Apache基金会顶级项目证明了其在代码质量、功能成熟度和社区活跃度等多个维度的高标准。社区的活跃不但仅体如今代码产出上,更重要的是社区的建设和生态的美满。
我们刚才讲到帮助我们的开发者在云上去构建开源软件,那AWS能提供给开发者什么样的内容,帮助开发者做哪些东西?
数据分析服务

数据接入和处理

起首我们可以看一下下面这张图,这张图是亚马逊云科技数据分析的服务的一个团体先容,这里边会去按照像刚才的开源项目的一些分类,就是我们把从数据接入、数据处理、数据湖再到数据分析,还有一些联合 AI 模子 learning 的一些服务,做了一个分类。

AWS为数据接入和处理提供了多种服务:
数据湖和数据分析

AWS不但支持数据存储和管理,还提供了强大的数据分析工具:
DolphinScheduler的集成

为了满意更广泛的客户需求,在数据解决方案中引入了Apache DolphinScheduler::
当然我们通过链接社区的反馈,不停调整其服务以更好地服务于用户。
例如,基于用户反馈,AWS持续优化DolphinScheduler的集成,好比说如今已经集成了EMR,在 DolphinScheduler 的一个Task怎么去调理?EMR 的里面的一些参数能不能定制化,或者是做参数传递,或者是有一些更好地去更或者更方便的形式用 DolphinScheduler 去很好地去调理EMR提供更机动的使命调理选项。

其实大部分用户都是基于开源软件,然后做了很多的二次开发,然后帮助客户更快地去实现他们的业务代价,AWS通过与开源软件的深度联合,开发了多种服务和解决方案以满意差别客户的需求:
存储服务的云原生优化

AWS不但在功能上举行优化,还通过云原生技术确生存储服务的高效与成本效益:
高效的成本管理

AWS负载均衡服务

AWS的负载均衡服务提供以下关键功能:
弹性和可扩展性

通过AWS负载均衡,开源软件能够更好地应对访问量的颠簸,自动调整资源以保持高性能和稳定性。
Serverless的上风

对于依赖数据库的开源调理工具(如DolphinScheduler),选择合适的数据库设置是一个挑战。AWS的Serverless数据库服务提供了机动的解决方案:
场景应用

在高峰期,如夜间数据处理作业增多时,Serverless数据库能够自动增加资源,确保数据库性能满意需求。这种模式为开发者节省了明显的资源预算,并简化了数据库的管理工作。
我们希望通过利用AWS的负载均衡和Serverless数据库服务,开源软件项目可以获得更高的弹性、安全性和成本效率。
容器服务

容器技术已成为支持分布式系统的关键技术,海豚调理恰恰是分布式架构,AWS的Elastic Kubernetes Service (EKS) 提供了一个完全托管的Kubernetes服务,帮助开发者轻松部署和管理容器化应用。
AWS EKS的核心上风

AWS EKS答应用户在几分钟内部署一个完全兼容Kubernetes的集群,极大地简化了容器集群的设置和管理过程。

EKS保证与开源Kubernetes社区的100%兼容性,确保任何标准的Kubernetes应用都可以无缝迁移至AWS。
EKS集成了多种AWS服务,包括但不限于AWS的负载均衡和自动扩缩容服务,这些服务增强了开源软件的性能和可观测性。
Data On EKS(DoEKS)解决方案

DoEKS是一个由AWS架构师团队开发的开源项目,它旨在提供一个一键部署解决方案,使开发者能够快速在EKS上部署流行的开源软件,如Spark和Flink。
功能与上风
应用场景无论是AI模子学习、数据分析还是大数据处理,DoEKS都提供了快速和高效的部署选项,帮助开发者专注于业务逻辑而非底层基础设施。
AWS EKS和DoEKS项目为开源社区提供了强大的支持,甚至是可以一键实验脚本,直接把这个开源组件拉起来,使得开发者可以更加便捷地部署和管理分布式系统。

数据采集与处理

一键部署与管理

Serverless 盘算与ELB

综合解决方案

对于海豚调理我们也做了很多内容。好比说像刚才提到的 AWS 部署无服务器的 DolphinScheduler,我们就提供了一个无服务器的在 EKS 上快速部署的解决方案。然后还有包括 EMR Serverless,还有我们有客户或者有客户也跟我们一起合作了,帮助我们的开发者或者用户实现这种准确的监控或者是成本优化。
监控和运维支持

AWS不但关注软件的部署和性能优化,还提供一系列监控和告警解决方案,帮助客户有效管理云上资源:
AWS Marketplace的第三方产物支持

AWS的架构师团队也致力于为客户提供最佳的架构选择和优化建议,确保云上开源软件的高性能和可扩展性。
社区贡献和生态发展

云原生服务和操作指南

AWS不但提供基础的虚拟机服务,还通过云原生技术和具体的操作指南帮助客户构建和优化业务流程:
结论

AWS致力于成为企业使用和构建开源软件的首选平台。通过提供强大的服务、解决方案和社区支持,AWS确保客户能够在环球范围内顺遂实施和扩展他们的业务。末了希望本文的分享对大家有所帮助。
延展阅读:使用 Apache DolphinScheduler 构建和部署大数据平台,将使命提交至 AWS 的实践经验
本文由 白鲸开源 提供发布支持!

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 IT评测·应用市场-qidao123.com技术社区 (https://dis.qidao123.com/) Powered by Discuz! X3.4