spark.sql("SELECT COUNT(*) AS `总人数` FROM student").show() # 统计学生总人数
spark.sql("SELECT MAX(`年龄`) AS `最大年龄`,AVG(`身高`) AS `平均身高`,"
"SUM(`年龄`) AS `总年龄` FROM student").show() # 统计年龄的最大值、总值,身高的平均值。
复制代码
4. 分组 查询(GROUP BY)
在分组查询(GROUP BY)。除聚合函数外,SELECT语句中的每个列都必须在GROUP BY子句中给出。如:如果需要再查询效果中显示性别和年级,则GROUP BY子句必须给出’性别’和’年级’。如:spark.sql("SELECT 性别,年级, COUNT(*) AS 人数 FROM student GROUP BY 性别,年级 ").show() ,则查询效果会有性别和年级两列数据。
代码如下: