ToB企服应用市场:ToB评测及商务社交产业平台

标题: 数仓架构:离线数仓、实时数仓Lambda和Kappa、湖仓一体数据湖 [打印本页]

作者: 滴水恩情    时间: 昨天 19:33
标题: 数仓架构:离线数仓、实时数仓Lambda和Kappa、湖仓一体数据湖
往期推荐

  大数据HBase图文简介-CSDN博客
  数仓分层ODS、DWD、DWM、DWS、DIM、DM、ADS-CSDN博客
  数仓常见名词解析和名词之间的关系-CSDN博客
  =========================================================================
目次
往期推荐
1. 数仓架构
1.1 离线数仓架构
1.1.1 数据集市架构
1.1.1.2 独立数据集市
1.1.1.2 附属数据集市
1.1.2 Inmon企业信息工厂架构
1.1.3 Kimball数据堆栈架构
1.1.4 混合型数据堆栈架构
1.2 实时数仓架构 
1.2.1 Lambda架构
1.2.1.1 传统的Lambda实时开发
1.2.1.2 升级的Lambda实时开发
1.2.1.3 为什么Lambda架构同时存在流处理和批处理?
1.2.1.4 Lambda架构缺点
1.2.2 Kappa架构
1.2.2.1 Kappa架构缺点 
1.2.3 Kappa和Lambda对比
1.2.4 湖仓一体—数据湖 
=========================================================================
1. 数仓架构


数仓架构大致分为离线数仓架构和实时数仓架构,数仓架构可以简单理解为构成数仓的各层关系,如ODS、DWM、DWD、DWS,具体分层这里不赘述。 


1.1 离线数仓架构


   显而易见,这种架构不能处理实时数据,那么必然会有数据的流失。
  任何事物都是随着时间的演进变得越来越完善,当然也是越来越复杂,数仓也不例外。
  离线数仓架构包括数据集市架构、Inmon企业信息工厂架构、Kimball数据堆栈架构、混合型数据堆栈架构,接下来就详细说说这几种架构。
  

1.1.1 数据集市架构

数据集市架构重点在于集市二字,数据集市是按主题域组织的数据聚集,用于支持部门级的决策。有两种范例的数据集市:独立数据集市 和 附属数据集市。

   1.1.1.2 独立数据集市

  独立数据集市会合于部门所关心的单一主题域数据以部门为底子,例如制造部门、人力资源部门和其他部门都各自有他们本身的数据集市。
  

  
  
   1.1.1.2 附属数据集市

  附属数据集市的数据泉源于数据堆栈,即附属于数据堆栈。
  

  优点:
  
  

1.1.2 Inmon企业信息工厂架构

   

  
  

1.1.3 Kimball数据堆栈架构

   

  
  

1.1.4 混合型数据堆栈架构

   

  
  1.2 实时数仓架构 

在某些场景中,数据的代价随着时间的推移而逐渐淘汰。所以在传统大数据离线数仓的底子上,逐渐对 数据的实时性提出了更高的要求。


1.2.1 Lambda架构

1.2.1.1 传统的Lambda实时开发


   上述架构,在实时计算链路中,假如存在多个实时业务,每个业务都要对本身的数据进行数据洗濯等操作,而数据洗濯这操作是重复的。所以对其进行了如下优化,进步数据复用
  

1.2.1.2 升级的Lambda实时开发


   对实时链路进行数据分层,改成实时数仓,办理了数据复用的问题,可以对数据进行统一洗濯等操作。
  
1.2.1.3 为什么Lambda架构同时存在流处理和批处理?

   
  
1.2.1.4 Lambda架构缺点

   不管是传统的照旧升级后的Lambda架构,严格来说并不是纯正的实时数仓,而是离线+实时!这就导致Lambda有如下缺点:
  
  既然离线数仓占用计算压力大,存储压力大,那就不利用离线,利用纯实时的kappa架构
  

1.2.2 Kappa架构




1.2.2.1 Kappa架构缺点 

   
  

1.2.3 Kappa和Lambda对比



1.2.4 湖仓一体—数据湖 

   基于Lambda和Kappa架构的缺点,出现了批流一体
  
  

   Kafka 换成了 Iceberg,IceBerg就是数据湖技术的一种,介于上层计算引擎和底层存储格式之间的一个中间层,我们可以把它定义成一种“数据组织格式”,底层存储照旧 HDFS。除此之外数据湖另有Hudi(发展最完善)这里不具体论述。
  数据湖支持SQL查询,办理了如下问题:
  

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4