Spark-Streaming简介 核心编程

打印 上一主题 下一主题

主题 1774|帖子 1774|积分 5322

1. Spark-Streaming概述
界说:用于处置惩罚流式数据,支持多种数据输入源,可运用Spark原语运算,结果能保存于多处。它以离散化流(DStream)为抽象表示,是RDD在实时数据处置惩罚场景的封装。
特点:易用,支持多语言编写实时计算程序;容错,可恢复丢失数据;易整合,能在Spark上运行,结合离线处置惩罚实现交互式查询。
2. Spark-Streaming架构:包含背压机制,1.5版本前靠设置静态参数限定Receiver数据吸收速率,易导致资源利用率低。1.5版本起可动态调解,通过“spark.streaming.backpressure.enabled”控制,默认不启用。
3. DStream实操 - WordCount案例

 

 

 

 

 
1. RDD队列创建DStream:可利用 ssc.queueStream(queueOfRDDs) 创建DStream,队列中的每个RDD都会被看成一个DStream处置惩罚。

 


 

 2. 自界说数据源创建DStream:自界说数据源需继承Receiver并实现 onStart 、 onStop 方法。

 

 

 

 

 

 
 
 
 

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

魏晓东

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表