马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?立即注册
×
目次
键控数据流(Keyed DataStream)
键控状态(Keyed State)
值状态(ValueState)
列表状态(ListState)
归约状态(ReducingState)
聚合状态(AggregatingState)
映射状态(MapState)
状态生存时间(TTL)
算子状态(Operator State)
广播状态(Broadcast State)
实现CheckpointedFunction 利用算子状态
对于DataStream来说,状态重要分为如下两类:
(1)键控状态(keyed state)
(2)算子状态(Operator State)
说键控状态之前,不得不提键控数据流。
键控数据流(Keyed DataStream)
如果盼望利用键控状态(keyed state),起首须要在数据流上指定一个键,该键用于对状态(以及流本身中的记载)举行分区。您可以在数据流上利用Java/Scala API中的keyBy(KeySelector)或Python API中的key_by(KeySelector)来指定键。利用该方法后将产生一个键控流KeyedStream,它答应利用键控状态的算子。
键选择器函数(key selector function)担当一条记载作为输入,并返回该记载的键。键可以是任何范例,而且必须从确定性盘算中得到。
Flink的数据模子不是基于键值对的。因此,不须要将数据集范例物理地打包到键和值中。键是“假造的”:它们被界说为实际数据上的函数,以引导分组算子。
<hr>
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!qidao123.com:ToB企服之家,中国第一个企服评测及软件市场,开放入驻,技术点评得现金 |