论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
ToB企服应用市场:ToB评测及商务社交产业平台
»
论坛
›
大数据
›
数据仓库与分析
›
大数据之数据堆栈的分层:ODS/DWD/DWS/ADS
大数据之数据堆栈的分层:ODS/DWD/DWS/ADS
涛声依旧在
金牌会员
|
2024-11-18 19:57:55
|
显示全部楼层
|
阅读模式
楼主
主题
835
|
帖子
835
|
积分
2505
分层简介
数据堆栈按自下而上的顺序分为:
ETL层(Extract-Transform-Load):数据清洗层,存原始数据;
ODS层(Operational Data Store):操作数据源层;
CDM层(Common Dimensional Model):公共维度模型层,
主要包括DWD层(Data Warehouse Detail 数据明细层) 和 DWS层(Data Warehouse Summary 数据汇总层)两部分;
ADS层(Application Data Service):数据应用层。
复制代码
职责简介
(1).
ODS层(Operational Data Store):贴源层,也称为操作数据源层,是数据堆栈中的一个核心组成部分,该层主要用于保存原始数据,完成数据积存,通常反映了企业业务系统中的最新操作,同时也是进行数据堆栈的底子,ODS层的数据被保存在磁盘中,直接体现了数据堆栈的一个特性——非易失性。
(2).
CDM层(Common Dimensional Model):公共维度模子层,是数据堆栈中最核心和最关键的一层,该层主要用于提供标准化、共享的维度模子,为数据分析提供便利。CDM层通常包罗数据明细层(DWD)和数据汇总层(DWS)两个部分。
(2.1).
DWD层(Data Warehouse Detail):数据明细层,吸收数据堆栈ODS层的原始数据,并进行洗濯、标准化、维度退化、异常数据剔除等操作,进行统一处置处罚,用于存储详细的完备的数据,为数据分析提供支持。DWD层一般按照业务主题建模,包含多个维度表和事实表,维度表可以用来描述业务数据的特征,而事实表则包含了关键数据指标(如销量、价格等)。
(2.2).
DWS层(Data Warehouse Summary):数据汇总层,也称宽表层,通过聚合和汇总,将DWD层中的数据按照主题进行汇总,形成宽表,进而提拔数据分析性能。DWS层通常包含多个宽表,每个宽表都是由多个事实表和维度表颠末聚合和分组运算生成的,DWS层中的宽表可以满足特定主题和不同维度的分析需求,减少了对其他表的操作,提拔数据分析性能。
(3).
ADS层(Application Data Service):数据应用层,其主要功能是保存效果数据,为外部系统提供查询接口,基于数据堆栈的数据为企业提供增值应用,并将数据堆栈的数据应用于企业决策、报表、分析、控制等领域。数据堆栈ADS层通常采用OLAP(Online Analytical Processing)技术,用于快速访问和查询数据。数据堆栈ADS层一般包罗多个宽表,这些宽表一般可以通过BI工具或自界说应用程序查询和访问,以满足企业的各种数据需求,为了提高访问和查询速率,ADS层通常使用数据索引、缓存和预聚合等技术。
数据流转
借助帆软的图,来描述数据分层的数据流向。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
涛声依旧在
金牌会员
这个人很懒什么都没写!
楼主热帖
MySQL基本SQL语句之高级操作
maven配置步骤及问题
史上最全MongoDB之部署篇
Juc并发编程12——2万字深入源码:线程 ...
IOS OpenGL ES GPUImage 图像黑白色调 ...
一文读懂K-Means原理与Python实现 ...
【云原生】裸金属架构之服务器安装VMWa ...
Flink-基于 DataStream API 实现欺诈检 ...
大数据ETL开发之图解Kettle工具(入门 ...
Java 2023年接地气的中高级面试题一( ...
标签云
存储
挺好的
服务器
快速回复
返回顶部
返回列表