ToB企服应用市场:ToB评测及商务社交产业平台

标题: 读数据工程之道:设计和构建健壮的数据系统09示例和范例 [打印本页]

作者: 小小小幸运    时间: 2024-10-15 05:57
标题: 读数据工程之道:设计和构建健壮的数据系统09示例和范例

1. 数据架构不是凭空设计的

1.1. 数据架构是一门抽象学科,所以它有助于通过示例进行推理
2. 数据仓库

2.1. 一个面向主题的、集成的、非易失性和时变的数据集合,以支持管理决策
2.2. 数据仓库是用于报告和分析的中央数据中心
2.3. 构造型
2.4. 技术型
2.5. 云数据仓库
2.6. 数据仓库提供了开箱即用的基本数据管理功能,而SQL是编写复杂、高性能查询和转换的有效工
3. 数据集市

3.1. 数据集市是仓库的一个更精细的子集,旨在为分析和报告提供服务,专注于一个单一的子构造、部门或业务线
3.2. 数据集市使分析师和报告开发职员更容易访问数据
3.3. 数据集市在初始ETL或ELT管道提供的转换阶段之外提供了一个额外的转换阶段
4. 数据湖

4.1. 大数据期间出现的最流行的架构之一是数据湖
4.2. 数据湖有望成为一股民主化的力量,解放企业,让它们从无穷数据的源泉中畅饮
4.3. 数据湖1.0始于HDFS
4.4. 公司拥有足够的资源来构建成功的数据实践,并创建基于Hadoop的自界说工具和增强功能
5. 数据湖仓一体

5.1. 数据湖仓一体一词暗示了数据湖和数据仓库之间的融合
5.2. 云数据仓库将计算与存储分开,支持PB级的查询,存储各种非结构化数据和半结构化对象,并与先进的处置惩罚技术(如Spark或Beam)集成
5.3. AWS、Azure、Google Cloud、Snowflake和Databricks是一流的领导者,每家都提供了一系列紧密集成的工具来处置惩罚数据,从关系型到完全非结构化
5.4. 未来的数据工程师可以根据各种因素,包括供应商、生态系统和相对开放性,选择一个融合的数据平台,而不是在数据湖或数据仓库架构之间进行选择
6. 现代数据栈

6.1. 现代数据栈是目前流行的分析架构,突出了我们希望在未来几年内看到更广泛利用的抽象范例
6.2. 现代数据栈的重要结果是自助服务(分析和管道)​、敏捷数据管理以及利用开源工具或具有明白定价结构的简单专有工具
6.3. 现代数据栈现在是并将继续是数据架构的默认选择
7. Lambda架构

7.1. 在Lambda架构中​,你的系统彼此独立运行——批处置惩罚、流处置惩罚和服务
7.2. 流处置惩罚
7.3. 批处置惩罚
7.4. 服务层通过聚合来自两个层的查询结果来提供组合视图
8. Kappa架构

8.1. 通过直接读取实时事件流并重放大块数据以进行批处置惩罚,可以将实时和批处置惩罚无缝地应用于相同的数据
9. Dataflow模型

9.1. Dataflow模型的核心头脑是将所有数据视为事件,由于聚合是在各种范例的窗口上实行的
9.2. 持续的实时事件流是无边界的数据
9.3. 数据批次只是有界事件流,边界提供了一个自然窗口
9.4. “批处置惩罚作为流处置惩罚的特例”的理念现在更加普遍
10. 物联网架构

10.1. 物联网是装备的分布式集合,又称为事物——计算机、传感器、移动装备、智能家居装备以及任何其他具有互联网毗连的装备
10.2. 由定期或连续从四周情况收集数据并将其传输到目的地的装备生成
10.3. 物联网装备通常是低功耗的,并且在低资源/低带宽情况中运行
10.4. 物联网已经从未来主义的理想演变为海量数据工程领域
10.5. 装备
10.6. 物联网网关
10.7. 存储
10.8. 服务
11. 数据网格

11.1. 数据网格是最近对庞大的单一数据平台(例如集中式数据湖和数据仓库)以及“数据大分水岭”的回应,其中数据分为运营数据和分析数据
11.2. 数据网格试图反转集中式数据架构的挑战,采用领域驱动设计的概念(通常用于软件架构)并将其应用于数据架构
11.3. 关键构成部门
12. 其他数据架构

12.1. 数据中心
12.2. 缩放架构
12.3. 元数据优先架构
12.4. 事件驱动架构
12.5. 实时数据栈

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4