First 算子是 Flink 中的一个转换算子,它用于从输入流中选择每个 Key 的第一个元素,并将其作为输出流中的结果。在流式盘算中,常常需要根据某个特定的字段进行分组,并选择每个分组中的第一个元素,这时可以利用 First 算子来实现这个功能。First 算子是 KeyedStream 上的操纵,以是在利用之前,需要先将数据流进行分组。
First 算子在许多场景下都很有用,比方:
数据去重:假如数据流中可能包含重复的元素,而我们只关心每个元素的第一次出现,可以利用 First 算子往复重。