聚合函数说明
聚合函数的作用
聚合函数允许您进行汇总或更改数据的粒度。
例如,您可能想要准确知道您的商店在特定年度有多少订单。您可以使用 COUNTD 函数对您的公司具有的准确订单数进行汇总,然后按年对可视化项进行细分。
示例
COUNTD([订单编号])
数据分析中的数值函数
ATTR - 如果它的所有行都有一个值,则返回该表达式的值。否则返回星号。
AVG - 返回表达式中所有值的平均值。
CORR - 返回两个表达式的皮尔森相关系数。
COUNT - 返回组中的项目数。
COUNTD - 返回组中不同项目的数量。
MAX - 返回表达式在所有记录中的最大值。
MEDIAN - 返回表达式在所有记录中的中位数。
MIN - 返回表达式在所有记录中的最小值。
PERCENTILE - 从给定表达式返回与指定数字对应的百分位处的值。
STDEV - 基于群体样本返回给定表达式中所有值的统计标准差。
STDEVP - 基于有偏差群体返回给定表达式中所有值的统计标准差。
SUM - 返回表达式中所有值的总计。
VAR - 基于群体样本返回给定表达式中所有值的统计方差。
VARP - 对整个群体返回给定表达式中所有值的统计方差。
求和聚合:SUM()
SUM(表达式)
返回表达式中所有值的总计。SUM 只能用于数字字段。会忽略 Null 值。
示例
SUM([销售额]) ,返回销售额的总计
平均聚合:AVG()
AVG(表达式)
返回表达式中所有值的平均值。AVG只能用于数字字段。会忽略 Null 值。
示例
AVG([销售额]) : 返回销售额的平均值
计数聚合:COUNT()
COUNT(表达式)
返回组中的项目数。不对 Null 值计数。
示例
COUNT([客户名称]) 返回客户的总数
去重计数聚合:COUNTD(表达式)
COUNTD(表达式)
返回组中不同项目的数量。不对 Null 值计数。
去重计数聚合:MEDIAN(表达式)
MEDIAN(表达式)
返回表达式在所有记录中的中位数。中位数只能用于数字字段。会忽略 Null 值。
注意,目前仅仅支持以下数据源:
- greenplum
- oracle
- sqlserver
- postgresql
- spark
- vertica
- influxdb
- impala
百分位聚合:PERCENTILE(表达式,百分位)
PERCENTILE(表达式,百分位)
从给定表达式返回与指定数字对应的百分位处的值。数字必须介于 0 到 1 之间(含 0 和 1),例如 0.66,并且必须是数值常量。
注意,目前仅仅支持以下数据源:
- greenplum
- oracle
- sqlserver
- postgresql
- spark
- vertica
- influxdb
- impala
最大值聚合:MAX(表达式)
MAX(表达式)
返回表达式在所有记录中的最大值。MAX只能用于数字、日期、日期时间字段。
最小值聚合:MIN(表达式)
MIN(表达式)
返回表达式在所有记录中的最小值。MIN只能用于数字、日期、日期时间字段。
属性值聚合:ATTR(表达式)
ATTR(表达式)
如果给定表达式对于组中的所有行仅具有单个相同值,则返回该表达式的值,否则返回Null
示例: ATTR(“ab”) = “ab”,ATTR([field])
最后编辑:admin 更新时间:2024-10-28 13:13