ToB企服应用市场:ToB评测及商务社交产业平台

标题: 入门指南 | Datavines 安装部署篇 [打印本页]

作者: 半亩花草    时间: 2024-9-7 12:15
标题: 入门指南 | Datavines 安装部署篇
摘要:本文主要先容基于源码部署 Datavines 和实验查抄作业,内容主要分为以下几个部分:
Datavines 的目的是成为更好的数据可观测性领域的开源项目,为更多的用户去解决元数据管理和数据质量管理中遇到的问题。在此我们真诚欢迎更多的贡献者参与到社区建设中来,和我们一起成长,携手共建更好的社区。
https://github.com/datavane/datavines
https://github.com/datavane/datavines/issues
https://github.com/datavane/datavines/pulls

平台先容

Datavines 是一站式开源数据可观测性平台,提供元数据管理、数据概览报告、数据质量管理,数据分布查询、数据趋势洞察等核心能力,致力于帮助用户全面地了解和掌管数据,让您做到心中有数.
快速部署

环境准备

在安装 Datavines 之前请确保你的服务器上已经安装下面软件
下载代码
  1. git clone https://github.com/datavane/datavines.git
  2. cd datavines
复制代码
数据库准备

Datavines 的元数据是存储在关系型数据库中,目前支持 MySQL ,下面以 MySQL 为例说明安装步骤:
项目构建

打包并解压
  1. mvn clean package -Prelease
  2. cd datavines-dist/target
  3. tar -zxvf datavines-1.0.0-SNAPSHOT-bin.tar.gz
复制代码
解压完成以后进入目录
  1. cd datavines-1.0.0-SNAPSHOT-bin
复制代码
编辑配置信息
  1. cd conf
  2. vi application.yaml
复制代码
修改数据库信息
  1. spring:
  2. datasource:
  3.    driver-class-name: com.mysql.cj.jdbc.Driver
  4.    url: jdbc:mysql://127.0.0.1:3306/datavines?useUnicode=true&characterEncoding=UTF-8
  5.    username: root
  6.    password: 123456
复制代码
如果你是利用 Spark 做为实验引擎,并且是提交到 yarn 上面去实验的,那么需要在 common.properties 中配置 yarn 相关的信息
  1. yarn.mode=standalone
  2. yarn.application.status.address=http://%s:%s/ws/v1/cluster/apps/%s #第一个%s需要被替换成yarn的ip地址
  3. yarn.resource.manager.http.address.port=8088
复制代码
  1. yarn.mode=ha
  2. yarn.application.status.address=http://%s:%s/ws/v1/cluster/apps/%s
  3. yarn.resource.manager.http.address.port=8088
  4. yarn.resource.manager.ha.ids=192.168.0.1,192.168.0.2
复制代码
启动服务
  1. cd bin
  2. sh datavines-daemon.sh start mysql
复制代码
查看日记,如果日记内里没有报错信息,并且能看到
[INFO] 2022-04-10 12:29:05.447 io.datavines.server.DatavinesServer:[61] - Started DatavinesServer in 3.97 seconds (JVM running for 4.69) 的时间,证明服务已经成功启动。
访问前端页面

在浏览器输入: 服务器IP:5600 ,就会跳转至登录界面,输入账号密码 admin/123456

运行数据质量查抄作业

创建数据源

进入首页后,点击右上角 创建数据源 按钮,输入数据源的名称,然后选择数据源类型。以 MySQL 为例,输入 MySQL 的毗连信息,点击 测试毗连 按钮。如果成功,请单击 生存

进入数据源


点击并进入数据源,找到 作业管理 页面

创建查抄作业

查看规则作业的信息

作业列表  找到刚刚创建并实验的查抄作业。

点击 实验记录 页面, 你可以看到实验历史列表。

点击 日记 按钮,你可以看到规则实验的日记信息。

点击 结果 按钮,你可以看到规则实验的查抄结果。

点击 错误数据 按钮,你可以看到规则实验的错误数据。

结束语

本文详细先容了Datavines平台的部署安装到运行的整个过程,每个环节图文并茂,信赖许多小伙伴都跃跃欲试了,动起来吧,更多出色等着你来挖掘。
关于Datavane

Datavane 是一个专注于大数据领域的开源组织(社区),由一群大数据领域优秀的开源项目作者共同创建,旨在帮助开源项目作者更好的建设项目、为大众提供高质量的开源软件,宗旨是:只为做一个好软件。目前已经聚集了一批优质的开源项目,涉及到数据集成、大数据组件管理、数据质量等。
在 Datavane 社区中,全部的项目都是开源开放的,代码质量和架构操持优质的潜力项目。社区保持开放中立、协作创造、对峙佳构,鼓励全部的开发者、用户和贡献者积极参与我们的社区、共同合作,创新创造,建设一个更加强大的开源社区。
官 网: http://www.datavane.org/
Github : https://github.com/datavane

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4