Spark-SQL核心编程语言

吴旭华 · 2025-4-16 14:52:35

使用IDEA开发spark-SQL

创建spark-SQL测试代码

自定义函数UDF

自定义聚合函数UDAF

强类型的 Dataset 和弱类型的 DataFrame 都提供了相关的聚合函数，如 count()，
countDistinct()，avg()，max()，min()。除此之外，用户可以设定自己的自定义聚合函数。Spark3.0之前我们使用的是UserDefinedAggregateFunction作为自定义聚合函数，从 Spark3.0 版本后可以统一接纳强类型聚合函数 Aggregator
案例:盘算均匀工资
实现方式一:RDD

实现方式二:强类型UDAF

实现方式三:弱类型UDAF

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

		自动登录	找回密码
密码			立即注册

Spark-SQL核心编程语言

本帖子中包含更多资源

0 个回复

快速回复

楼主热帖

标签云