论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
ToB企服应用市场:ToB评测及商务社交产业平台
»
论坛
›
大数据
›
数据仓库与分析
›
大宗商品贸易集团数据治理实践,夯实数字基座 | 数字化 ...
大宗商品贸易集团数据治理实践,夯实数字基座 | 数字化标杆 ...
知者何南
金牌会员
|
2024-1-8 19:05:49
|
显示全部楼层
|
阅读模式
楼主
主题
681
|
帖子
681
|
积分
2043
某大型央企是首批全国供应链创新与应用示范企业,在“十四五”规划期内以聚焦供应链管理核心主业作为主要战略发展方向。供应链运营管理以大宗商品贸易为主,其交易往往具有交易量巨大、交易环节复杂、风险交易难识别、风险客商难管控等痛点。
随着集团数字化转型不断深化,数据应用方面的需求不断扩展。但集团缺乏统一的
大数据资产管理平台
,导致在数据应用方面,出现数据价值不凸显、数据标准不统一、数据质量不可控、数据共享不畅通等问题。
在此背景下,该集团引入
袋鼠云数据治理团队
,立足于打造全集团统一,能满足覆盖运管、风控、业务全过程数字化经营管理及分析决策的
统一数据资产平台
。对集团现有存量数据进行数据治理及挖掘,搭建数据管理体系,对增量数据进行有效管理和应用。通过梳理目前集团所有存量数据,提炼运营指标及管理指标,科学化管理公司数据资产和挖掘数据价值。
01 围绕“数据治理、数据服务、数据应用”的数据治理方案
袋鼠云根据集团提出的数据治理需求,结合内部现有数据开发平台,以业务应用场景为导向,形成集团统一的数据治理方案。项目以数据治理、数据服务、数据应用三大方向展开实施,其中数据应用以聚焦供应链运营管理业务为核心,数据服务以满足集团下属各子公司数据需求为主,数据治理以统一集团数据归集方式、数据质量标准、
元数据维护标准
、数据建模标准为目标进行建设。
其中数据治理设计的步骤为:确定当前项目的目标和范围,设计本轮数据治理的模式、架构和方法。以集团当前提出的数据需求场景出发,针对场景数据进行数据治理,主要包括以下几个步骤
1、架构设计
技术架构上,从场景需求出发,结合当前企业组织架构及数据权限出发,将数据中台设计为
多项目空间
加经典ODS、DWD、DWS、ADS四层结构,其中集团为主项目空间,其余业务供应链平台为子项目空间。另外,根据前期调研结果,结合当前集团业务范围,将业务根据业务主体进行了
数据域
的设计与划分,其中重点建设数据域为:
1)客商域:企业所服务的所有客户及供应商;
2)商品域:企业自营或代理商品,SKU;
3)交易域:客户与企业发生的所有交易行为,包括交易合同,订单,采购等;
4)风险域:企业发生诉讼,处罚等风险数据;
5)仓储物流域:所有仓库出入库,在途等信息;
6)公共域:系统码值,参数信息,组织架构,人员以及标准化映射信息。
通过分层与分域的设计,将集团原本传统数据架构转变为新数据架构,统一源端数据,建设
公共事实层
,建设服务层最后满足各个不同需求,有效解决传统数据架构存在的数据孤立,事实重复建设,资产盘点困难等问题,更适应当前集团发展阶段诉求。
2、数据统一归集
当前集团源端数据大体分为三类:第一种是传统业务数据,包含SAP系统、MDM系统、CRM系统、云链、高达、南北、OA等系统;第二种是第三方数据,包含船讯网、启信宝、行情数据、价格数据等;第三种是其他手工填报数据。
其中传统业务数据存在数据源多,数据量级分布不均,部分系统只能取得界面全量数据或为高度汇总报表数据等问题,使用数栈底层数据同步工具FlinkX将不同数据接入数据中台中。
第三方数据使用
PySpark脚本任务
,通过调取特定的API服务接口,完成数据的采集及简单清洗,接入数据中台。
手工填报数据通过完成填报报表的初步设计后,回流手工填报平台(当前使用饭软),进行定期同步、定期填报、定期回流采集的形式来完成数据的收集。
3、数据集中处理及标准设计
从架构设计出发,对已接入的源端数据,进行明细事实层的建模设计,进行
指标体系
的统计和收集。
明细事实层的建模设计秉持
维度建模理念
,根据不同的主题域,将ODS层数据进行特定范围的清洗,处理,加工后形成可复用性强的描述某一颗粒度下,某一业务行为的各项信息,纵向可以进行上钻下钻,横向可以对比。
针对指标层的加工处理,在引入数据中台之前,数据计算逻辑、指标口径都存放在SAP系统的代码中,无法进行有效复用。为了解决这一问题,根据指标体系设计方法论,统一定义指标体系的各信息(包含指标ID、指标名称、指标主题、业务口径、维度、修饰词、计算方式、计算频率、时间周期、业务对接人及开发负责人),在接下来企业的数据应用过程中,完成
数据指标口径
的收口和统一。
4、数据应用场景
数据应用场景以集团供应链运营管理为核心,分别对运营管理、物流管理、信用管理数据进行统一归集,按照业务指标逻辑进行数据处理开发,满足业务人员数据报表填报和
数据统计分析
应用场景。
运营管理场景:通过重新梳理SAP客户逾期、客户赊销、现货敞口库存等业务报表数据逻辑为基础,结合大数据平台从SAP底表取数能力,实现风险周报填报、签约情况分析、重大事项填报场景建设,有效减轻业务人员每周报表加工填报的工作压力,同时提高业务数据线上留存能力。
物流管理场景:以物流合同、物流供应商、供应商库点、库点库存、库点盘点记录数据为基础,进行统一汇聚处理,按照业务指标口径进行数据开发,实现
物流合同看板
、物流供应商看板、库点盘点密度看板、库存看板四大看板,为业务人员发现潜在风险和日常业务数据便捷查询提供有利条件。
信用管理场景:以客商授信额度、客商逾期、行业产品加工利润数据为核心,结合
业务逻辑指标
进行数据开发,实现授信额度跟踪、逾期数据分析、行业加工利润填报场景建设,为业务人员控制客商授信额度、发现客商潜在风险、明确当前各行业产品盈利情况提供有效支撑。
02 夯实数字基座,有效支撑数据应用
截至目前,
集团数据中台
共构建700余张表,数据执行任务总量500余个,其中ODS数据源始层同步任务200多个、DWD数据明细层清洗加工任务40多个、DWS数据汇总层汇总任务60多个、
DIM数据
维度层维度同步任务20多个、ADS数据应用层业务场景数据推送任务100多个。
满足集团供应链运管部物流仓储管理、客商信用管理、价格管理、运营管理等部门数据分析需求,实施搭建签约销售/采购看板、物流仓储看板、授信额度跟踪看板、逾期数据分析看板、
运管风险逾期周报填报
等业务场景。
《数栈产品白皮书》下载地址:
https://www.dtstack.com/resources/1004?src=szsm
《数据治理行业实践白皮书》下载地址:
https://www.dtstack.com/resources/1001?src=szsm
想了解或咨询更多有关大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:
https://www.dtstack.com/?src=szbky
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
知者何南
金牌会员
这个人很懒什么都没写!
楼主热帖
开源二三事|ShardingSphere 与 Databa ...
SQLServer数据库基础教程
华为再次登上央视!鸿蒙系统3.0今年上 ...
C++面试八股文:C++中,函数的参数应该 ...
「笔记」某移动SRE运维体系交流 ...
Sqlserver创建用户并授权
编程体验1
web安全|渗透测试|网络安全 ...
Kubernetes(K8S) Controller - Statefu ...
最全.NET Core 、.NET 5、.NET 6和.NET ...
标签云
挺好的
服务器
快速回复
返回顶部
返回列表