论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com技术社区
»
论坛
›
大数据
›
数据仓库与分析
›
快速认识:数据库、数仓(数据仓库)、数据湖与数据运河 ...
快速认识:数据库、数仓(数据仓库)、数据湖与数据运河 ...
北冰洋以北
论坛元老
|
5 天前
|
显示全部楼层
|
阅读模式
楼主
主题
1820
|
帖子
1820
|
积分
5460
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
数据技术核心概念对比表
概念
核心定义
核心功能
数据特征
典型技术/工具
核心应用场景
数据库
布局化数据的「电子档案柜」,按固定 schema 存储和管理数据,支持高效读写和事件处理。实局势务处理(增删改查),确保数据一致性(ACID 特性),支持单表/关联查询。布局化数据(表格式),Schema 固定,数据高度洗濯。
关系型
:Oracle、MySQL、PostgreSQL、TiDB
非关系型
:MongoDB、Redis
向量型
:Milvus、Pinecone核心业务系统(订单管理、用户登录)、实时交易(如支付、库存扣减)。
数据仓库
面向分析的「数据实验室」,存储历史布局化数据,按主题构造,支持复杂查询和指标盘算。离线/准实时分析(OLAP),通过 ETL 洗濯整合多源数据,构建分析模型并输出报表/指标。布局化数据(表格式),Schema 稳定,数据经洗濯、整合、维度建模。
云原生
:Snowflake、BigQuery、StarRocks
传统
:Hive、Teradata
湖仓一体
:Delta Lake、Iceberg企业级报表(如贩卖日报)、历史趋势分析(用户留存率)、KPI 盘算(ROI 分析)。
数据湖
原始数据的「大熔炉」,存储多格式(布局化/半布局化/非布局化)的原始数据,保留数据原始形态。存储海量多模数据,支持数据探索、大数据分析和 AI 训练,按需处理(ELT)。多格式数据(表/JSON/日志/图片),Schema 灵活(读时定义),数据原始未洗濯。
存储
:S3、ADLS、OSS
管理
:Delta Lake、Hudi
分析
:Presto、Spark SQL机器学习训练(用户举动建模)、日志挖掘、非布局化数据归档(图片/视频存储)。
数据运河
数据流动的「管道系统」,负责在不同数据系统间实时/批量传输数据,实现数据集成与同步。数据抽取(CDC)、转换(ETL/ELT)、加载,保障跨系统数据流动的实时性和可靠性。不存储数据,仅传输,支持布局化/非布局化数据的流式或批量迁移。
实时
:Kafka、Debezium、Flink
批量
:Sqoop、Flume
可视化
:NiFi、Fivetran数据同步(跨机房备份)、实时流处理(金融风控)、多系统集成(电商订单同步至分析平台)。
一、数据库:精准的「数据档案柜」
回复
使用道具
举报
0 个回复
正序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
发新帖
回复
北冰洋以北
论坛元老
这个人很懒什么都没写!
楼主热帖
一零零七、Docker快速入门
超融合,变了?
Linux基础篇(6)---》常用命令大全(网络 ...
鸿蒙最新功能及承载设备详解:HarmonyO ...
代码审计(Java)——WebGoat_Authentica ...
作为开发人员,您应该熟悉的 7 个 Java ...
Kubernetes-namespace
kubernetes之Ingress发布Dashboard(二) ...
如何快速而优雅的解决问题(提问的智慧 ...
.net webapi 实现 接口版本控制并打通s ...
标签云
AI
运维
CIO
存储
服务器
浏览过的版块
IOS
程序人生
备份
分布式数据库
公有云
云原生
快速回复
返回顶部
返回列表