ToB企服应用市场:ToB评测及商务社交产业平台

标题: 读数据工程之道:计划和构建健壮的数据系统23批量获取的思量因素 [打印本页]

作者: 吴旭华    时间: 2024-10-29 06:49
标题: 读数据工程之道:计划和构建健壮的数据系统23批量获取的思量因素

1. 批量获取的思量因素

1.1. 批量获取,通常是获取数据的一种便捷方式
1.2. 基于时间隔断的批量获取在传统ETL的数据仓库中很普遍
1.3. 当数据从基于流的系统转移到对象存储时,基于数据量大小的批量获取是很常见的
1.4. 常用的批量获取数据模式
  1. >  1.4.1.2.1. 全速快照读取由于其简单性仍然非常普遍
复制代码
  1. >  1.4.1.3.1. 差异更新是最小化网络流量和节省目标存储空间的理想选择
复制代码
  1. >  1.4.2.3.1. 数据导出和准备工作是在源系统一侧完成的
复制代码
  1. >  1.4.2.4.1. 通过基于文件的获取,导出过程在数据源端运行,让源系统工程师完全控制哪些数据被导出以及数据如何被预处理
复制代码
2. 消息和流获取的思量因素

2.1. 模式演进
2.2. 迟到数据
2.3. 序次和重复发送
2.4. 重放
2.5. 生存时间
2.6. 消息大小
2.7. 错误处理和死信队列
2.8. 消费者的推送和拉取
2.9. 位置

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4