企业级统一数据平台建设思路
由于企业的业务体系信息化的分阶段建设、以各自业务为导向等原因,每个业务都积累自身的数据,形成一定的数据孤岛。而数字化转型的一个核心就是以数据为抓手来打通各个差别的业务,以数据驱动辅助经验主导的流程来辅助业务,因此必要企业建成一个统一的、可共享的数据平台,推进建设内部业务的统一数据化,为企业管理和决策提供数据底子与分析本领保障 ,帮助企业落地数字化战略。建设企业统一的数据平台必要考虑哪些问题?本文进行介绍。— 企业级统一数据平台整体建设思路—
企业级数据平台指的是支撑企业的数字化业务创新和运营的技术底子平台,提供数据驱动、精准决策的全方位技术支撑。
[*] 整体要求
从公司整体的数字化战略的视角来看,数据平台通过统一的数据整合、存储、盘算和服务本领,可以打破企业内部壁垒,服务于企业内的差别业务部分和组织部分,将无形的业务流程主动化和数据化。为了达到既定的战略要求,企业数据平台必要实现几个必要的统一,主要包括:
[*] 统一整合企业内、外部各类业务体系数据,尽量做到“应存尽存、能收则收、层级化管理”;
[*] 统一管理企业表里部数据资产,形成企业统一数据管理尺度及规范,落实数据安全管控,将数据资产化和业务化,实现“数据既能管得住,也能立即用”;
[*] 统一支撑企业以及各个组织部分、子公司等创新型应用和业务,提供包括及时盘算、离线盘算、呆板学习等在内的多样化的盘算本领,辅助按需提供的算力和数据资产,从而发现数据的业务代价,通过数据驱动来推动经营优化、创新业务探索、风险控制等新业务,推动企业数字化转型。
https://i-blog.csdnimg.cn/blog_migrate/7ff20fd8997dbf47554f7ccc6f1b2c27.png
[*] 数据架构的设计
数据架构形貌如何管理从收集到转换、分发和使用的数据。它为数据及其在数据存储体系中流动的方式设定了蓝图。它是数据处理惩罚操纵和人工智能 (AI) 应用程序的底子。
数据架构的设计应该由业务需求驱动,数据架构师和数据工程师使用这些需求来定义相应的数据模型以及支持它的底层数据结构。这些设计通常有助于满足业务需求,比方报告或数据科学计划。
随着物联网 (IoT) 等新兴技术的出现,新的数据源不断涌现,精良的数据架构可以确保数据易于管理且具有利用代价,从而支持数据生命周期管理。更具体地说,它可以避免冗余数据存储,通过清算和重复数据删除来提高数据质量,并支持新的应用程序。现代数据架构还提供了跨域(比方部分或地理区域之间)集成数据的机制,打破了数据孤岛,因而消除了将所有数据存储在同一地方所带来的巨大复杂性。
现代数据架构常常利用云平台来管理和处理惩罚数据。虽然它的本钱更高,但它的盘算可扩展性使紧张数据处理惩罚任务能够快速完成。存储可扩展性还有助于应对不断增长的数据量,并确保所有相关数据都可用,以提高练习 AI 应用程序的质量。
现代数据架构的七大特征:
[*] 云原生和支持云,让数据架构能够从云技术的弹性扩展和高可用性中受益。
[*] 强大、可扩展且可移植的数据管道,将智能工作流、认知分析和及时集成联合在一个框架中。
[*] 无缝数据集成,使用尺度 API 接口连接到原有应用程序。
[*] 及时数据支持,包括验证、分类、管理和管理。
[*] 解耦且可扩展,因此服务之间没有依赖关系,而且开放尺度支持互操纵性。
[*] 多租户支持本领
[*] 颠末优化,在本钱和简单性之间取得平衡。
— 企业级统一数据平台的五大本领要求—
起初,数据平台技术(国内约是2010年后)的定位是储存原始格式数据的大数据平台,可容纳结构化、半结构化、非结构化及二进制的数据。随着大数据技术的融合发展,数据平台的边界不断扩展,内在也发生了变化,渐渐形成了5大本领要求,如下图所示:
https://i-blog.csdnimg.cn/blog_migrate/4e6212b1b4df30e73f62f2640d3ca41d.png
企业数据平台的5大核心本领要求主要包括:
[*] 数据多源异构:数据平台能够整合和集成多源异构的海量数据,支持结构化、半结构化、非结构化等各种数据模型,这样就能够保证即使后期业务有了新的需求,数据平台也能够即时的完成数据接入、整合和最终的服务,在技术上也能够支撑企业落地“应存尽存、能收则收”的数据战略。
[*] 数据统一的存储与管理:随着分布式存储技术的快速发展,提供统一的数据存储服务已经成为业内的共识,在实现方式上可以是物理上的统一(所有数据通过物理复制到企业数据平台上)或逻辑上的统一(部分数据仍然在其他数据存储中,但可以通过元数据管理、数据联邦等方式实现逻辑的存储管理)。基于统一的数据存储和管理本领,企业才能根本上解决了“数据孤岛”的打通,而且往上对接各种盘算引擎和数据管理工具,从而为后续的数据资产化和服务化打好底子。
[*] 多范式盘算:数据资源自身能够提供的代价有限,而海量数据通过多维度的碰撞、关联分析或智能化学习后,隐蔽在数据里面的离散代价就可以被发现和发掘出来,从而将数据变成有代价的资产。由于支撑业务的多样性,企业级数据平台必要支持多种盘算引擎,满足差别数据盘算分析需求,支持离线盘算、实施盘算、图盘算、呆板学习等多种盘算范式,让差别的开辟者和分析师可以按照他们的技能范畴和业务范畴来选择符合的盘算工具或引擎,让数据被真正的开辟和利用起来。
[*] 数据服务多样化:前面提到的数据整合、存储和盘算都属于底子的数据平台技术本领,而数据服务就是衔接数据平台和业务之间的关键要素,大概说是数据平台为业务和组织生产的关键产品。企业的产品是企业实现经营性目的的核心交付方式,也是与用户创建黏性的关键介质;同样的类比也得当于数据平台,因此作为数据平台产品的各种数据服务也是保证数据平台乐成的关键要素,要做到质量高、品类丰富、安全合规和服务方式多样化,可支撑各种业务范畴。现在企业内主要的数据服务情势包括SQL、API、数据指标、数据标签和数据模型等。
[*] 应用广泛:现在各个行业的企业数据应用发展风起云涌,如面向企业经营分析的各类数据分析产品,面向政府管理的数据大屏、“健康码”等应用,以及面向消费者业务的数据决策类产品等,应用的创新速率超过数据平台本身。衡量一个数据平台的乐成与否,其最主要的KPI指标应该也是“该数据平台支撑的乐成的数据应用的数量和业务效果”。数据平台和数据应用平台可以分开建设,也可以统一建设。在统一建设的模式下,企业数据平台除了给业务应用提供数据资源或数据资产外,还可以为数据应用提供资源调理和生命周期管理本领,这样不光可以提升应用的性能,还可以提供弹性伸缩、资源隔离等应用所需的底子支撑,从而可以让数据应用更加结实和高效。
— 企业级统一数据平台的设计考量—
为了能够帮助企业快速的支撑业务的需求,更好的满足数字应用的开辟和运营,企业数据平台应该是以PaaS平台来对内对外提供服务本领,而不再应该是面向运维和管理的IaaS方式。而在PaaS构建的过程中,为了能够适应未来企业的机动、快速变化的业务需求,企业数据平台必要服从如下的几个主要设计考量:
[*] 以数据为中心,业务导向
在总体的设计思路上,我们应该从传统的以资源为中心,以运维便利性作为首要考量因素,转变为以数据为中心,以业务作为导向,将可以加速业务创新速率的技术作为更优先的指标。数据、应用和智能是数字化的三大核心质料,我们必要在一个PaaS平台上提供包括数据分析、应用开辟和智能建模等在内的完备的工具链,并开放给尽大概多的使用者来尝试创新。
[*] 云原生
传统的虚拟化技术由于有很大的技术开销,启动和关闭速率慢,扩缩容本领弱,因此并不得当包括微服务、分布式体系在内的新一代工作负载。容器技术有用解决了相关问题,可以提高数据中心的资源使用率的同时,能够给微服务提供更好的弹性和扩展本领。而通过技术创新,容器技术同样可以支持包括分布式数据库在内的复杂业务体系,同时还可以提供多租户、主动扩展、主动化冗余等本领,这对业务开辟者来说进一步降低了运维的难度。因此,容器化技术是未来。
[*] 融合互通
约瑟夫.熊彼特曾经指出,创新是生产要素的重组。重组大概主要做加法,做融合大概通用化;也大概是做减法,做分离和专用化。融合带来通用和低本钱,但是会有一些冗余;分离的优势是高性能和特定场景的本领,但是应用场景少、本钱高。融合追求大众普适,分离面向专业群体。
数字化底子设施的用户是面向企业或组织内广泛的应用开辟者、数据建模职员、以及业务职员,所有处在业务一线的职员都是数据生态的紧张职员。因此在设计数字化底子设施的时候,我们必要充分考虑通用性和低本钱,这样才能更好的服务于目的对象。
从技术的角度来分析,应用大概会运行在公有云、私有云、边缘端等任何大概有盘算本领的地方,而数据也会随着业务而沉淀,因此我们在设计的时候就必要考虑应用的跨云本领、数据的互通互联、云端和边缘端协同等,从而拒特技术烟囱,减少各种大概的孤岛问题。
[*] 层次化设计
在架构设计上,必要从传统的以应用驱动开辟的方式形成的烟囱式技术栈,转变为追求服务共享复用思路的层次化设计。
下图是企业数据平台的设计思路,做的一个概要的设计参考架构,它不光包含了技术底层,还有数据业务中心层和业务服务层。
https://i-blog.csdnimg.cn/blog_migrate/744c1b27957f222e2e62e71fe08fef1d.png
最上层是直接服务于业务的服务层,提供App、web等的之间访问和交互本领;中间层是企业的数据业务中心,也是最核心的部分,它包含企业沉淀的各种有用的业务服务和数据服务,业务按照DDD的原则进行服务划分,数据都做了有用的建模形成数据资产,这大概包含数据堆栈、数据湖大概数据中台的建设;而最底层应该是云底子平台,提供包括大数据、AI、Kubernetes、容器、数据库、盘算、网络、安全等在内的技术本领。
— 小结—
本文介绍了企业数字化转型的三层业务模式,给出了平台建设的整体思路,以及一些底子本领要求和建设上的考量。信赖大家通过阅读本文,对企业数字化建设已经有了底子概念。那么面对纷繁复杂的数据泉源,多元化的数据结构,企业数据平台建设该从何处入手呢?哪个数据管理架构得当自己的企业呢?下一篇将介绍数据堆栈、数据集市、数据湖。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页:
[1]