聚合函数说明

聚合函数的作用

聚合函数允许您进行汇总或更改数据的粒度。

例如,您可能想要准确知道您的商店在特定年度有多少订单。您可以使用 COUNTD 函数对您的公司具有的准确订单数进行汇总,然后按年对可视化项进行细分。

示例

COUNTD([订单编号])

数据分析中的数值函数

ATTR - 如果它的所有行都有一个值,则返回该表达式的值。否则返回星号。

AVG - 返回表达式中所有值的平均值。

CORR - 返回两个表达式的皮尔森相关系数。

COUNT - 返回组中的项目数。

COUNTD - 返回组中不同项目的数量。

MAX - 返回表达式在所有记录中的最大值。

MEDIAN - 返回表达式在所有记录中的中位数。

MIN - 返回表达式在所有记录中的最小值。

PERCENTILE - 从给定表达式返回与指定数字对应的百分位处的值。

STDEV - 基于群体样本返回给定表达式中所有值的统计标准差。

STDEVP - 基于有偏差群体返回给定表达式中所有值的统计标准差。

SUM - 返回表达式中所有值的总计。

VAR - 基于群体样本返回给定表达式中所有值的统计方差。

VARP - 对整个群体返回给定表达式中所有值的统计方差。


求和聚合:SUM()

SUM(表达式)

返回表达式中所有值的总计。SUM 只能用于数字字段。会忽略 Null 值。

示例

SUM([销售额]) ,返回销售额的总计


平均聚合:AVG()

AVG(表达式)

返回表达式中所有值的平均值。AVG只能用于数字字段。会忽略 Null 值。

示例

AVG([销售额]) : 返回销售额的平均值


计数聚合:COUNT()

COUNT(表达式)

返回组中的项目数。不对 Null 值计数。

示例

COUNT([客户名称]) 返回客户的总数


去重计数聚合:COUNTD(表达式)

COUNTD(表达式)

返回组中不同项目的数量。不对 Null 值计数。


去重计数聚合:MEDIAN(表达式)

MEDIAN(表达式)

返回表达式在所有记录中的中位数。中位数只能用于数字字段。会忽略 Null 值。
注意,目前仅仅支持以下数据源:

  • greenplum
  • oracle
  • sqlserver
  • postgresql
  • spark
  • vertica
  • influxdb
  • impala

百分位聚合:PERCENTILE(表达式,百分位)

PERCENTILE(表达式,百分位)

从给定表达式返回与指定数字对应的百分位处的值。数字必须介于 0 到 1 之间(含 0 和 1),例如 0.66,并且必须是数值常量。
注意,目前仅仅支持以下数据源:

  • greenplum
  • oracle
  • sqlserver
  • postgresql
  • spark
  • vertica
  • influxdb
  • impala

最大值聚合:MAX(表达式)

MAX(表达式)

返回表达式在所有记录中的最大值。MAX只能用于数字、日期、日期时间字段。


最小值聚合:MIN(表达式)

MIN(表达式)

返回表达式在所有记录中的最小值。MIN只能用于数字、日期、日期时间字段。


属性值聚合:ATTR(表达式)

ATTR(表达式)

如果给定表达式对于组中的所有行仅具有单个相同值,则返回该表达式的值,否则返回Null
示例: ATTR(“ab”) = “ab”,ATTR([field])


作者:admin  创建时间:2024-10-28 11:14
最后编辑:admin  更新时间:2024-10-28 13:13