Partilhar via


mean função de agregação

Aplica-se a:assinalado sim Databricks SQL assinalado sim Databricks Runtime

Devolve a média calculada a partir dos valores de um grupo. Esta função é sinónimo de avg função agregada.

Sintaxe

mean ( [ALL | DISTINCT] expr ) [FILTER ( WHERE cond ) ]

Esta função também pode ser invocada como uma função de janela usando a cláusula OVER.

Argumentos

  • expr: Uma expressão que é avaliada como numérica.
  • cond: Uma expressão booleana opcional filtrando as linhas usadas para agregação.

Devoluções

O tipo de resultado é calculado como para os argumentos:

  • DECIMAL(p, s): O tipo de resultado é a DECIMAL(p + 4, s + 4). Se a precisão máxima para DECIMAL for atingida, o aumento na escala é limitado para evitar a perda de dígitos significativos.
  • Intervalo ano-mês: O resultado é um INTERVAL YEAR TO MONTH.
  • Intervalo de tempo do dia: O resultado é um INTERVAL DAY TO SECOND.
  • Em todos os outros casos, o resultado é um DOUBLE.

Nulos dentro do grupo são ignorados. Se um grupo estiver vazio ou consistir apenas em nulos, o resultado será NULL.

Se DISTINCT for especificado, a média é calculada após a remoção das duplicatas.

Aviso

No Databricks Runtime, se spark.sql.ansi.enabled estiver configurado para false, um overflow retornará NULL em vez de um erro.

Exemplos

> SELECT mean(col) FROM VALUES (1), (2), (3) AS tab(col);
 2.0

> SELECT mean(DISTINCT col) FROM VALUES (1), (1), (2), (NULL) AS tab(col);
 1.5

> SELECT mean(col) FROM VALUES (1), (2), (NULL) AS tab(col);
 1.5