- 通常由
DataFrame.groupBy()
创建,用于分组聚合
-
可用的聚合函数包括:
avg、max、min、sum、count
参数:
exprs
:一个字典,键为列名,值为聚合函数字符串。也可以是一个Column
的列表
示例:
统计:
.count()
:统计每一组的记录数量,以DataFrame
的形式返回.max(*cols)
:统计数值列每一组的最大值,以DataFrame
的形式返回参数:
cols
:列名或者列名的列表
.sum(*cols)
:统计数值列每一组的和,以DataFrame
的形式返回参数:
cols
:列名或者列名的列表
.pivot(pivot_col, values=None)
:对指定列进行透视。参数:
pivot_col
:待分析的列的列名