DolphinScheduler快速上手:基于Docker Compose的安装与设置全攻略 ...

诗林  论坛元老 | 2024-10-15 17:21:16 | 显示全部楼层 | 阅读模式
打印 上一主题 下一主题

主题 1348|帖子 1348|积分 4044

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
DolphinScheduler 是一款强大的开源分布式任务调理系统,广泛应用于大数据领域,用于管理复杂的工作流。本文将详细介绍怎样通过 Docker Compose 安装和设置 DolphinScheduler,以便快速搭建并利用这一系统。
1. 环境准备

起首,确保你的系统已经安装了 Docker 和 Docker Compose。Docker 是一个开源容器化平台,允许开发者将应用程序及其依赖打包到容器中运行,具有高度的可移植性和同等性。Docker Compose 则是一款用于定义和管理多容器应用的工具,通过一个 YAML 文件来设置应用的服务,并通过一条命令启动或停止这些服务。
1.1 Docker 和 Docker Compose 安装验证

可以通过以下命令查抄 Docker 和 Docker Compose 是否已正确安装:
  1. docker --version
  2. docker-compose --version
复制代码
如果你看到了相应的版本信息,阐明安装已经成功。
2. 获取 DolphinScheduler Docker Compose 设置文件

在安装和运行 DolphinScheduler 之前,我们必要获取其 Docker Compose 设置文件。该文件定义了 DolphinScheduler 及其依赖服务的运行环境。你可以通过以下步骤获取设置文件:
2.1 克隆 DolphinScheduler 项目

起首,利用 Git 克隆 DolphinScheduler 的官方堆栈:
  1. git clone https://github.com/apache/dolphinscheduler.git
复制代码
这会将 DolphinScheduler 项目下载到你的本地机器。接着,进入项目目录:
  1. cd dolphinscheduler/docker
复制代码
在这个目录下,你会找到一个名为 docker-compose.yml 的文件,这个文件是 Docker Compose 的核心设置文件。
3. 设置 Docker Compose 文件

在 docker-compose.yml 文件中,已经定义了 DolphinScheduler 运行所需的各项服务,包括 MySQL 数据库、ZooKeeper 集群、DolphinScheduler 的 Master 和 Worker 节点等。你可以根据必要修改这个文件来调整各服务的设置。
3.1 Docker Compose 文件阐明

docker-compose.yml 文件的大抵结构如下:
  1. version: '3.1'
  2. services:
  3.   zookeeper:
  4.     image: zookeeper:3.5.6
  5.     ports:
  6.       - "2181:2181"
  7.   mysql:
  8.     image: mysql:5.7
  9.     environment:
  10.       MYSQL_ROOT_PASSWORD: root
  11.       MYSQL_DATABASE: dolphinscheduler
  12.     ports:
  13.       - "3306:3306"
  14.   dolphinscheduler-master:
  15.     image: apache/dolphinscheduler:latest
  16.     depends_on:
  17.       - mysql
  18.       - zookeeper
  19.     ports:
  20.       - "12345:12345"
  21.     environment:
  22.       - DOLPHINSCHEDULER_OPTS="-Xms512m -Xmx512m"
  23.   dolphinscheduler-worker:
  24.     image: apache/dolphinscheduler:latest
  25.     depends_on:
  26.       - dolphinscheduler-master
  27.     environment:
  28.       - DOLPHINSCHEDULER_OPTS="-Xms512m -Xmx512m"
复制代码
在这个设置文件中:

  • zookeeper:负责集群的协调和服务发现。
  • mysql:用于存储 DolphinScheduler 的元数据。
  • dolphinscheduler-master:主节点,负责调理和管理任务。
  • dolphinscheduler-worker:工作节点,实际执行任务。
4. 启动 DolphinScheduler

确认 docker-compose.yml 文件设置无误后,可以利用 Docker Compose 启动 DolphinScheduler:
  1. docker-compose up -d
复制代码
该命令将以后台模式启动所有定义在 docker-compose.yml 文件中的服务。你可以通过以下命令查看服务的运行状态:
  1. docker-compose ps
复制代码
如果所有服务均显示为 Up 状态,阐明 DolphinScheduler 已经成功启动。
5. 设置 DolphinScheduler

5.1 初始设置

启动成功后,可以通过浏览器访问 DolphinScheduler 的 Web UI。默认环境下,访问地址为:
  1. http://localhost:12345
复制代码
在登录界面中,利用默认的管理员账户 admin 和密码 admin 登录。登录后,你可以修改默认密码,以增强系统的安全性。
5.2 创建项目与任务

在 Web UI 中,你可以创建项目并定义任务。DolphinScheduler 支持多种类型的任务,如 Shell、Python、SQL 等,可以通过拖拽的方式创建任务流,并设置任务之间的依赖关系。
5.3 系统监控与日记管理

DolphinScheduler 提供了丰富的监控与日记功能,用户可以在 Web 界面上查看任务的执行环境,实时监控集群的状态,并查阅任务执行的详细日记。这对于调试和优化工作流非常有帮助。
6. 常见问题与解决方案

在利用过程中,你大概会遇到一些问题,下面列出了一些常见问题及其解决方案。
6.1 服务启动失败

如果服务未能正常启动,可以通过以下命令查看服务日记,定位问题:
  1. docker-compose logs <service_name>
复制代码
例如:
  1. docker-compose logs <service_name>dolphinscheduler-master
复制代码
日记信息可以帮助你排查错误,例如数据库毗连失败、端口冲突等问题。
6.2 数据库毗连问题

如果在启动时出现数据库毗连失败的问题,大概是因为 MySQL 服务未能及时启动。在这种环境下,可以尝试手动重启 DolphinScheduler:
  1. docker-compose restart dolphinscheduler-master dolphinscheduler-worker
复制代码
7. DolphinScheduler 的上风与应用场景

DolphinScheduler 在大数据处理和 ETL 任务调理方面表现精彩,以下是其主要上风:

  • 可视化操作界面:通过图形化界面,用户可以方便地管理和监控任务,降低了利用门槛。
  • 灵活的任务依赖管理:支持复杂的任务依赖关系定义,使得任务调理更加灵活和高效。
  • 高扩展性与高可用性:支持分布式摆设,实用于大规模数据处理场景。
8. 总结

通过以上步骤,你已经成功地利用 Docker Compose 安装并设置了 DolphinScheduler。该系统的强大功能和灵活设置使得它在分布式任务调理中得到了广泛应用。无论是在企业级大数据处理还是中小型数据集成项目中,DolphinScheduler 都是一个值得信赖的选择。
如果在实际利用中遇到问题,可以参考 DolphinScheduler 的官方文档或社区资源,获得更详细的技术支持。通过持续学习和探索,你将可以大概充分发挥 DolphinScheduler 的潜力,为你的工作流管理带来巨大提升。
本文由 白鲸开源 提供发布支持!

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

正序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

诗林

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表