读数据质量管理:数据可靠性与数据质量问题办理之道20读后总结与感想兼导读 ...

打印 上一主题 下一主题

主题 1041|帖子 1041|积分 3123


1. 基本信息

数据质量管理:数据可靠性与数据质量问题办理之道

  • [美] 巴尔·摩西,[美] 利奥·加维什,[美] 莫莉· 著
  • 机械工业出版社,2024年5月出版
1.1. 读薄率

书籍总字数18.8万字,条记总字数61295字。
读薄率61295÷188000≈32.6%
1.2. 读厚方向


  • Data Mesh权威指南
  • 数据的边界:隐私与个人数据保护
  • 数据保护:工作负载的可规复性
  • Julia数据科学应用
  • MLOps权威指南
  • 数据自助服务实践指南:数据开放与洞察提效
  • 商战数据发掘:你需要了解的数据科学与分析头脑
  • Spark快速大数据分析(第2版)
1.3. 条记--章节对应关系

条记章节字数发布日期  
2024年读数据质量管理:数据可靠性与数据质量问题办理之道01数据质量第1章 为什么数据质量值得关注311711月12日读数据质量管理:数据可靠性与数据质量问题办理之道02数据湖仓第2章 对可靠数据体系的构建模块举行组装334511月13日读数据质量管理:数据可靠性与数据质量问题办理之道03数据目录第2章 对可靠数据体系的构建模块举行组装273411月14日读数据质量管理:数据可靠性与数据质量问题办理之道04收集与清洗第3章 收集、清洗、转换和测试数据328611月15日读数据质量管理:数据可靠性与数据质量问题办理之道05数据尺度化第3章 收集、清洗、转换和测试数据346211月16日读数据质量管理:数据可靠性与数据质量问题办理之道06数据测试第3章 收集、清洗、转换和测试数据380211月17日读数据质量管理:数据可靠性与数据质量问题办理之道07异常检测第4章 数据管道的监控和异常检测220911月18日读数据质量管理:数据可靠性与数据质量问题办理之道08扩展异常检测第4章 数据管道的监控和异常检测373811月19日读数据质量管理:数据可靠性与数据质量问题办理之道09数据可靠性第5章 为数据可靠性举行架构设计327211月20日读数据质量管理:数据可靠性与数据质量问题办理之道10数据平台第5章 为数据可靠性举行架构设计363211月21日读数据质量管理:数据可靠性与数据质量问题办理之道11根因分析第6章 办理大规模数据质量问题331911月22日读数据质量管理:数据可靠性与数据质量问题办理之道12应对与缓解第6章 办理大规模数据质量问题266911月23日读数据质量管理:数据可靠性与数据质量问题办理之道13数据沿袭第7章 构建端到端的数据沿袭347611月24日读数据质量管理:数据可靠性与数据质量问题办理之道14普及数据质量第8章 推广和普及数据质量319311月25日读数据质量管理:数据可靠性与数据质量问题办理之道15数据信托第8章 推广和普及数据质量289011月26日读数据质量管理:数据可靠性与数据质量问题办理之道16数据认证第8章 推广和普及数据质量429611月27日读数据质量管理:数据可靠性与数据质量问题办理之道17数据网格第9章 现实世界中的数据质量:对话和案例分析334611月28日读数据质量管理:数据可靠性与数据质量问题办理之道18数据发现第9章 现实世界中的数据质量:对话和案例分析282111月29日读数据质量管理:数据可靠性与数据质量问题办理之道19数据未来第10章 开创可靠数据体系的未来268811月30日$总计61295$2. 亮点

2.1 数据尺度化很重要


  • 尺度化通常是你的数据在管道中颠末的诸多此类转换中的第一个
  • 非常重要
2.2 数据测试


  • 数据测试的两个最佳工具分别是dbt测试和Great Expectation
2.3 数据沿袭


  • 通俗点说,就是来龙去脉
2.4 数据信托


  • 重中之重,不可信,有何用?

    • 实在,也是很有效的。。。。。
    • 比如,米国的那些非农啊、就业啊等等数据操控之用(冠冕堂皇地说法,预期管理)

3. 感想

3.1 总结要及时


  • 总结一定要及时啊,由于时间长了,容易忘
  • 但是,换一个说法,就是没有忘的,就是沉淀下来的英华啊
3.2 数据工程越来越重要


  • 随着期间的发展,AI是数据需求的重头戏,而数据工程是保障数据质量的关键环境,“垃圾进,垃圾出“,数据工程势必占据越来越重要的职位
3.3 数据质量保障是一个长期、持续的过程


  • 只要有数据产生,就要保障数据质量,不会一劳永逸,只会持续不断跟进
3.4 数据信托和操控


  • 前文提到了数据操控,实在照旧基于数据信托的
  • 为什么要数据操控?是由于数据不符合预期。
  • 为什么会认为数据不符合预期?是由于信赖数据得到的结果,照旧要信托啊。
  • 也许你会说,样本取样的问题?为什么样本取样有问题?为什么不全面取样?是不能照旧不敢,亦或是不为
  • 修正前期的数据又为啥?
3.5 好书,保举阅读


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

卖不甜枣

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表