什么是状态?(what)
Stateful Computations over Data Streams,盘算的时间,用户想要通过某种方式(如:对象)记载信息,因此产生了状态这个说法;
对于用户本身界说、管理的状态叫作raw state,
flink 提供了内置的状态数据管理机制(简称状态机制),叫作托管状态;
本地快照,算子本身管控;全局快照,JobManager负责管理;具体可以参考Fault-tolerance in Flink学习条记
背压:数据积压来不及处置惩罚,会一级一级向上传递,最终导致数据源的数据积压;
对齐和非对齐Checkpoint的区别在于,多流输入的时间,两个流是否针对同一个barrier对齐进行Checkpoint;对齐的好处,可以大概保证EOS,缺点及无法保证数据处置惩罚效率的及时性;非对齐的只能保证at least once,一个状态可能被一个数据影响多次(现在不成熟);参考毗连:Unaligned Checkpointing