Spark及时(二):StructuredStreaming编程模型

打印 上一主题 下一主题

主题 553|帖子 553|积分 1659


文章目次
StructuredStreaming编程模型
一、基础语义
二、事件时间和延迟数据
三、​​​​​​​容错语义


StructuredStreaming编程模型

一、基础语义

Structured Streaming处理及时数据头脑是将及时数据看成一张没有界限的表,数据源源不停的追加到这张表中,这可以让我们能像处理批数据一样处理及时数据。如下图所示,每条及时数据到来之后都对应“无界表”中的一条数据追加到表中。

以WordCount为例,Spark会针对每次增量的数据进行计算,将效果输出出来,如下图所示:


留意:StructuredStreaming并不会将每次输出的数据物化存储起来,而是每次计算都将效果状态保存起来,下个批次计算是基于当前批次数据

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

麻花痒

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表