序号 | 定义出处 | 定义 |
1 | Wikipedia | 数据湖是一类存储数据天然/原始格式的体系或存储,通常是对象块大概文件。数据湖通常是企业中全量数据的单一存储。全量数据包罗原始体系所产生的原始数据拷贝以及为了各类任务而产生的转换数据,各类任务包罗报表、可视化、高级分析和呆板学习。数据湖中包罗来自于关系型数据库中的结构化数据(行和列)、半结构化数据(如CSV、日志、XML、JSON)、非结构化数据(如email、文档、PDF等)和二进制数据(如图像、音频、视频)。数据沼泽是一种退化的、缺乏管理的数据湖,数据沼泽对于用户来说要么是不可访问的要么就是无法提供足够的代价。 |
2 | 亚马逊AWS | 数据湖是一个会合式存储库,答应您以任意规模存储所有结构化和非结构化数据。您可以按原样存储数据(无需先对数据举行结构化处理),并运行不同类型的分析 – 从控制面板和可视化到大数据处理、及时分析和呆板学习,以指导做出更好的决策。 |
3 | 微软 | 数据湖包罗一切使得开辟者、数据科学家、分析师能更简朴的存储、处理数据的能力,这些能力使得用户可以存储任意规模、任意类型、任意产生速率的数据,而且可以跨平台、跨语言的做所有类型的分析和处理。数据湖在能资助用户加快应用数据的同时,消除了数据收罗和存储的复杂性,同时也能支持批处理、流式盘算、交互式分析等。数据湖能同现有的数据管理和管理的IT投资一起工作,保证数据的一致、可管理和安全。它也能同现有的业务数据库和数据堆栈无缝集成,资助扩显现有的数据应用。 |
序号 | 特性 |
1 | 数据湖需要提供足够用的数据存储能力,这个存储保存了一个企业/组织中的所有数据。 |
2 | 数据湖可以存储海量的任意类型的数据,包罗结构化、半结构化和非结构化数据。 |
3 | 数据湖中的数据是原始数据,是业务数据的完整副本。数据湖中的数据保持了他们在业务体系中原来的样子。 |
4 | 数据湖需要具备完满的数据管理能力(完满的元数据),可以管理各类数据相关的要素,包罗数据源、数据格式、连接信息、数据schema、权限管理等。 |
5 | 数据湖需要具备多样化的分析能力,包罗但不限于批处理、流式盘算、交互式分析以及呆板学习;同时,还需要提供一定的任务调理和管理能力。 |
6 | 数据湖需要具备完满的数据生命周期管理能力。不光需要存储原始数据,还需要能够保存各类分析处理的中间结果,并完整的记载数据的分析处理过程,能资助用户完整详细追溯任意一条数据的产生过程。 |
7 | 数据湖需要具备完满的数据获取和数据发布能力。数据湖需要能支撑各种各样的数据源,并能从相关的数据源中获取全量/增量数据;然后规范存储。数据湖能将数据分析处理的结果推送到符合的存储引擎中,满足不同的应用访问需求。 |
8 | 对于大数据的支持,包罗超大规模存储以及可扩展的大规模数据处理能力。 |
序号 | 定义 | 定义出处 |
1 | 中台就是“企业级能力复用平台”。 | 《白话中台战略-3:中台的定义》 |
2 | 中台通过聚集整个集团的运营数据能力、产品技术能力、来对各前台业务形成强力支撑。 | 《大型集团性企业的中台战略-阿里的中台战略其实是一个伪命题》 |
3 | 中台是一种需求分析的方法论,一套能力接入标准、一套运作机制,会合配置、分布实验的控制台。 | 《中台如何助力标准化业务?中台关键要快!》 |
4 | “中台”是强调资源整合、能力沉淀的平台体系,为“前台”的业务开展提供底层的技术、数据等资源和能力的支持。 | 《大中台、小前台》 |
5 | 中台是局域前台和背景之间、位于底子架构和各产品线间的业务架构。 | 《阿里巴巴中台战略思想与架构实践》 |
6 | 数据中台是将各个业务板块多年来积聚的数据,按业务特征举行横向关联和统一,按数据用途举行纵向分层,终极沉淀为公共的数据服务能力。 | 《传统企业数据中台的建立与思考》 |
7 | 数据中通的实质还是组件化、模块化,是计划模式与业务端的应用。 | 袋鼠云《浅析数据中台策略与建立实践》 |
欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) | Powered by Discuz! X3.4 |