数据仓库简介(一)

打印 上一主题 下一主题

主题 1741|帖子 1741|积分 5223

数据仓库概述

1. 什么是数据仓库?

数据仓库(Data Warehouse,简称 DW)是由 Bill Inmon 于 1990 年提出的一种用于数据分析和挖掘的系统。它的主要目的是通太过析和挖掘数据,为不同层级的决议提供支持,构成商业智能(BI)的一部门。

1.1 数据仓库的目的

数据仓库的焦点目的是:


  • 分析与挖掘数据:提供决议支持。
  • 集中数据存储:从多种来源收罗和抽取数据,形成企业数据的全局视图。
  • ETL 技能:通过数据抽取、转换和加载(ETL)技能实现数据的同一集成。
1.2 数据仓库的定义

数据仓库是一个:


  • 面向主题的:专注于特定的业务主题。
  • 集成的:从不同的数据源聚合数据。
  • 相对稳定的:数据在装入后一般不可更新,主要用于查询。
  • 反映汗青厘革的:保存汗青数据,支持管理决议。

4. 数据仓库的特点

面向主题

数据仓库专注于特定业务领域,仅保留与该主题相关的数据,清除无关细节。
随时间厘革

数据仓库可以大概保存汗青数据,支持基于时间厘革的分析,通常使用拉链表的方式在包管访问汗青快照的同时降低存储空间。
集成的

通过 ETL 操作,将来自不同来源的数据集成到同一的数据仓库中。
数据不可更新

数据仓库的数据在加载后主要举行查询操作,不支持传统数据库的增删改操作,反映的是长时间范围内的汗青数据。
5. 数据仓库与关系型数据库区别

特性数据仓库 /Hive关系型数据库/Mysql,Oracle数据范围汗青的/完备的/反映汗青厘革的数据当前在线生意业务状态数据数据厘革可添加/无删除/无更新/反应汗青厘革支持频繁的增删改查应用场景BI、支持战略决议面向业务生意业务/事件流程设计理论面向主题设计、违背范式、得当冗余面向事件设计、依照范式、制止冗余处置惩罚特点非频繁/大批量/高吞吐/有延迟频繁/小批次/高并发/低延迟服务对象分析数据、服务于决议支持捕获数据、服务于业务操作人员


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

千千梦丶琪

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表