IT评测·应用市场-qidao123.com技术社区

标题: 读数据工程之道:设计和构建结实的数据系统14源系统 [打印本页]

作者: 一给    时间: 2024-10-20 08:17
标题: 读数据工程之道:设计和构建结实的数据系统14源系统

1. 源系统中的数据天生

1.1. 数据工程师的工作是从源系统获取数据,对其进行处理,使其有助于为卑鄙用例提供服务
1.2. 数据工程师的脚色将在很洪流平上转向理解数据源和目的地之间的相互作用
1.3. 数据工程的最基本的数据管道任务——将数据从A移动到B
2. 数据源

2.1. 数据是无组织的、缺乏内容形貌的事实和数据特征的聚集
2.2. 数据在我们周围的世界无处不在
3. 源系统

3.1. 源系统以各种方式天生数据
3.2. 文件和非布局化数据
3.3. API
3.4. 应用步伐数据库(OLTP系统)
3.5. 联机分析处理系统
3.6. 变动数据捕获
3.7. 日记
  1. >  3.7.5.1.1. 通过自定义的紧凑格式编码数据来提高空间效率和I/O速度
复制代码
  1. >  3.7.5.2.1. 被编码为对象序列化格式(JSON,也可能是其他)的文本
  2. >  3.7.5.2.2. 半结构化日志是机器可读和可移植的
  3. >  3.7.5.2.3. 效率远低于二进制日志
复制代码
  1. >  3.7.5.3.1. 存储从软件的控制台输出的日志
复制代码
3.8. 数据库日记
3.9. CRUD
3.10. ⑩仅插入
3.11. ⑾消息和流
3.12. ⑿时间类型
4. ACID

4.1. 对原子事务的支持是数据库关键特征之一,统称为ACID
  1. >  4.1.1.1.1. 原子事务是在一个提交中有多个更改
复制代码
4.2. 支持应用步伐后端不需要完全具备ACID特性,放宽这些限制可以大大进步性能和规模
4.3. 文档数据库集群可以通过降低一致性来获取更高的文档提交率
4.4. 图数据库还可以处理事务用例

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 IT评测·应用市场-qidao123.com技术社区 (https://dis.qidao123.com/) Powered by Discuz! X3.4