ToB企服应用市场:ToB评测及商务社交产业平台

标题: 【流计算】流计算概论 [打印本页]

作者: 泉缘泉    时间: 2024-9-29 13:15
标题: 【流计算】流计算概论
媒介
作者在之前写过一个大数据的专栏,包含GFS、BigTable、MapReduce、HDFS、Hadoop、LSM树、HBase、Spark,专栏地点:
https://blog.csdn.net/joker_zjn/category_12631789.html?fromshare=blogcolumn&sharetype=blogcolumn&sharerId=12631789&sharerefer=PC&sharesource=Joker_ZJN&sharefrom=from_link
流计算和大数据是精密相关的,现在接那个大数据专栏,继承向下写流计算专栏。这是第一篇。
目次
1.什么是流计算
2.流计算的架构


1.什么是流计算

流计算,就是对流式数据的计算,是专门用来处置惩罚流式数据的。因此在聊流计算之前,我们要先明确什么是静态数据和流式数据。
静态数据:
静态数据不是实时产生的,是有肯定历史的数据,静态数据一样平常是用来举行一些统计分析的,比如数据仓库中的数据就是典范的静态数据。再比如MapReduce做统计分析,存在HDFS中的数据也是静态数据。
流式数据:
流式数据其实就是动态数据,是实时产生的,其应用场景对实时性要求很高,基本上是要求必要对其做实时处置惩罚的数据。比如:

上面这样说只是一方面,其实仔细思索就会发现静态数据、动态数据之间没有很明确的边界,静态数据也会有新的数据进来,流式数据的业务场景中也有对历史数据计算的需求。
其实从业务场景上能更好的区分是不是流计算的场景,流计算的场景一句话就能概括:
大量数据实时产生,涌过来,从这些大量实时数据中计算出实时结果。
流式数据的特性:

2.流计算的架构

流数据的量大、产生的速度快、泉源和格式杂,这些特点都是会拉低计算速度的点,所以流计算的核心就是要就是要稳定可靠高效的处置惩罚流式数据。市面上的各种流计算框架针对这些核心问题,各自给出了自己的解法,常用的流计算框架:

流计算是整个大系统的一环,接下来我们看看引入流计算的系统架构一样平常长什么样子。
以flink为例,展示一下游计算常见架构:

观察上面系统,可以发现引入流计算的系统架构一样平常有以下部分构成:


数据收罗:
传感器、各个服务模块上的各个日志代理等。
数据收罗在软件层面无非就是从欣赏器、手机终端等设备将数据发给收罗服务器。
收罗服务器要吸取数据,在性能上要有所考虑,关于性能无非以下点:

数据传输:
负责数据的流转,数据总线,一样平常用MQ来实现,数据传输要关注的点:

数据处置惩罚:
流计算的核心,也是流计算框架主要工作的环节,用计算引擎来对流举行:

数据存储:
根据自己的业务场景来决定计算出来的结果是否必要存储?假如要存储就要考虑自己业务场景的需求:

然厥后选择对应的存储介质,内存?关系型数据库?非关系型数据库?分布式文件系统?等等等等
3.常见流计算场景

以下是流式计算的一些典范应用场景:


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4