【技巧帖】 DolphinScheduler 任务数据清理与备份策略,确保页面不卡顿 ...

打印 上一主题 下一主题

主题 1051|帖子 1051|积分 3153

问题形貌

由于 Apache DolphinScheduler 长期运行,任务数量不停增加,相干任务数据重要存储在数据库中的 t_ds_task_instance 和 t_ds_process_instance 两张表中。
随着这两张表数据量的持续增长,导致体系页面出现卡顿征象。

解决方案

为解决上述问题,采取的步伐是定期清理数据库中 t_ds_process_instance 和 t_ds_task_instance 两张表中一个月之前的数据。
数据备份

在进行数据清理之前,首先备份原表数据,以确保数据安全。
  1. use dolphinscheduler;
  2. -- 创建备份表 t_ds_process_instance_backup20241120 和 t_ds_task_instance_backup20241120
  3. CREATE TABLE t_ds_process_instance_backup20241120 LIKE t_ds_process_instance;
  4. CREATE TABLE t_ds_task_instance_backup20241120 LIKE t_ds_task_instance;
  5. -- 将原表数据备份到相应的备份表中
  6. INSERT INTO t_ds_process_instance_backup20241120
  7. SELECT * FROM t_ds_process_instance;
  8. INSERT INTO t_ds_task_instance_backup20241120
  9. SELECT * FROM t_ds_task_instance;
复制代码
检查备份环境

为了确保备份操作乐成,可以检查备份表和原表的数据行数。
  1. -- 检查备份表的数据行数
  2. SELECT COUNT(*) FROM t_ds_process_instance_backup20241120;
  3. SELECT COUNT(*) FROM t_ds_task_instance_backup20241120;
  4. -- 检查原表的数据行数
  5. SELECT COUNT(*) FROM t_ds_process_instance;
  6. SELECT COUNT(*) FROM t_ds_task_instance;
复制代码
数据清理

在备份完成并确认无误后,执行清理操作,删除 2024年10月19日 23:59:59 之前 的数据。
  1. -- 删除 t_ds_task_instance 表中 2024年10月19日 23:59:59 之前的数据
  2. DELETE FROM t_ds_task_instance
  3. WHERE submit_time < '2024-10-19 23:59:59';
  4. -- 删除 t_ds_process_instance 表中 2024年10月19日 23:59:59 之前的数据
  5. DELETE FROM t_ds_process_instance
  6. WHERE end_time < '2024-10-19 23:59:59';
复制代码
参考:https://blog.csdn.net/weixin_40255084/article/details/141442462
本文由 白鲸开源 提供发布支持!

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

我可以不吃啊

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表