论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com
»
论坛
›
运维.售后
›
运维.售后
›
什么是数据可观测性?
什么是数据可观测性?
鼠扑
论坛元老
|
2025-3-12 07:34:11
|
显示全部楼层
|
阅读模式
楼主
主题
1031
|
帖子
1031
|
积分
3093
一、定义
数据可观测性是指在组织内的各种流程、系统和管道中监控、管理和维护数据,以确保数据的质量、可用性和可靠性。它不光涉及传统监控描述问题的层面,还能近乎及时地识别、排查息争决数据问题,帮助从业者了解端到端数据质量,包括数据可靠性。
二、重要性
数据可靠性问题广泛 :大多数组织认为自身数据不可靠,如 82% 的受访者表示数据质量问题阻碍数据集成项目,80% 的高管不信任数据。不良数据影响严重,如 2022 年 5 月 Unity Software 因获取不良数据导致股票暴跌 30%,丧失 1.1 亿美元收入。
传统数据问题识别困难 :与应用程序宕机立即影响用户不同,企业可能在不知不觉中对不良数据举行操纵较长时间,如销售团队能立即知道 Salesforce 仪表板未加载,却难以及时发现仪表板数据不正确。
防止不良数据的关键 :数据可观测性监控数据管道,确保数据完整、正确和及时交付,防止数据停机,满足数据 SLA 要求,维护企业对数据的信任。
三、演变
更多外部数据源 :已往数据基础办法处置处罚少量内部运营数据,如今数据产品依赖大量内外部数据,导致意外漂移、架构更改、转换和延迟等问题。
更复杂的转换 :需转换、构建和聚合多种格式的大量外部数据,若格式变化,严格编码逻辑无法适应,引发卑鄙失败的多米诺骨牌效应。
过于关注分析工程 :复杂的摄取管道催生自动化摄取和 ETL/ELT 流程的工具,形成现代数据堆栈(MDS),但自动化程度越高,对数据交付方式的控制越少,组织需构建自定义数据管道保证数据按预期交付。
四、与 DataOps 运动
DataOps 是实现灵敏交付管道和反馈循环的工作流程,使企业高效创建和维护产品,其周期包括三个阶段:
检测 :以验证为重点,举行数据质量查抄,确保数据集符合业务规则,但本质上是被动的。
感知 :以可见性为中心,引入元数据优先方法,会合和标准化管道及数据集元数据,让团队了解组织内问题,实现更主动解决数据问题。
迭代 :以流程为中心,确保数据开发有可重复且可持续的标准,从而改善数据平台整体运行状况。
五、优势
更高的数据质量 :及早发现数据问题,如缺失值、重复记载或格式不一致等,使组织做出更好的数据驱动型决策,改善运营、客户满足度和整体绩效。
更快的故障排除 :通过非常检测、及时监控和警报快速识别数据错误或偏差,降低停机成本和严重性。
改进的协作 :共享仪表板让各长处相关者了解关键数据集状态,促进团队间协作。
进步效率 :查明瓶颈和性能问题,优化系统,进步资源利用率和缩短处置处罚时间,自动化镌汰维护数据运行状况的时间和精力。
进步合规性 :帮助金融、医疗保健和电信等受监管行业组织确保数据符合标准,降低不合规风险。
增强的客户体验 :维护正确、最新的客户数据,使组织提供更个性化、更相关的体验,进步客户满足度和忠诚度。
增加收入 :进步数据质量解锁新看法、识别趋势和发现创收机会,充分利用数据资产增加收入和增长。
六、五大支柱
新鲜度 :描述数据更新程度和频率,数据管道停止通常因新鲜度问题。
分布 :数据字段级运行状况指标,与预期分布偏差可能表示数据质量问题、错误或更改。
音量 :衡量数据天生、提取、转换和移动量以及数据表完整性,是关键指标。
架构 :描述数据组织,架构更改常导致数据破坏,数据可观测性确保数据组织一致、兼容并保持完整性。
血源 :答复数据停止时 “Where?” 的问题,查看数据从源到结束位置的过程及变化。
七、与数据质量
数据可观测性支持数据质量,但两者管理数据不同。数据可观测性可指出质量问题,但不能保证精良质量,需解决和预防数据问题;数据质量监控衡量数据集状况是否满足预期用途,根据正确性、完整性等维度查抄数据。
八、与数据治理
数据可观测性和数据治理相辅相成。数据治理确保数据可用、可用、一致且安全,符合内部标准和计谋,强盛的数据治理筹划有助于消除数据孤岛等问题,数据可观测性通过监控数据质量、可用性和相沿变化帮助治理筹划。
九、层次结构
监控运行状况、静态和动态数据
静态数据 :监督数据集作为一个整体的状态,答复数据集是否按时到达、是否按需更新、是否有预期数据量等问题。
动态数据 :监控管道状态,了解数据在转换和通过管道时的状态,答复管道性能对数据集质量的影响等问题。
列级分析 :建立新业务规则和实施现有业务规则,答复列的预期范围、架构、独特性等问题,改进数据质量框架。
行级验证 :查看每行数据值是否正确,关注数据值格式、长度及信息充分性等,但需注意结合其他层次获得全局信息。
十、实现框架步骤
定义关键指标 :确定需跟踪的指标,如数据质量指标、数据量、延迟、错误率和资源利用率等。
选择合适工具 :选择与现有基础办法兼容、可处置处罚运营规模的数据收集、存储、分析和警报工具。
标准化库 :建立用于 API 和数据管理及数据质量的标准化库,让团队同一语言并公开交换问题。
检测数据管道 :将数据收集库或代理集成到数据管道中,收集定义指标,实现全面可见性。
设置数据存储解决方案 :选择可扩展的数据库或时间序列平台存储收集指标。
实施数据分析工具 :使用提供直观可视化和复杂查询支持的工具从存储指标中获得看法。
配置警报和通知 :建立系统,在凌驾阈值或发生非常时发送自动警报,及时响应问题。
与事件管理平台集成 :将可观测性管道与事件管理系统集成,简化响应工作流程。
定期查看和更新 :随着业务发展,定期审查和更新可观测性管道,确保其提供须要洞察和性能。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
鼠扑
论坛元老
这个人很懒什么都没写!
楼主热帖
Java 基于Apache POI实现Excel读写操作 ...
Dapr 知多少 | 分布式应用运行时 ...
XAF新手入门 - 类型子系统(Types Info ...
springboot开启单元测试的方法分享 ...
记录一次NoSuchMethodError问题的解决 ...
C#生成putty格式的ppk文件(支持passph ...
5.15日 搭建青龙面板教程——狗东跑跑 ...
Python 封装SNMP调用接口
风险洞察之事件总线的探索与演进 ...
SQLSERVER大小写转换方法
标签云
运维
CIO
存储
服务器
浏览过的版块
公有云
IT职场那些事
信创/国产替代
.Net
网络安全
备份
Java
快速回复
返回顶部
返回列表