Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Função
Aplica-se a:
SQL do Databricks
Databricks Runtime 13.3 LTS e versões posteriores
Essa função utiliza o algoritmo HyperLogLog para contar uma aproximação probabilística do número de valores únicos em uma determinada coluna, consumindo uma representação binária conhecida como buffer de esboço gerado anteriormente pela função hll_sketch_agg e retornando o resultado como um grande inteiro.
As funções hll_union e hll_union_agg também podem combinar esboços consumindo e mesclando esses buffers como entradas.
A implementação usa a biblioteca Apache Datasketches. Confira HLL para obter mais informações.
Sintaxe
hll_sketch_estimate ( expr )
Argumentos
-
expr: uma expressãoBINARYsegurando um esboço gerado por hll_sketch_agg.
Retornos
Um valor BIGINT que é a contagem distinta aproximada representada pelo esboço de entrada.
Exemplos
> SELECT hll_sketch_estimate(hll_sketch_agg(col, 12))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3
> SELECT hll_sketch_estimate(hll_sketch_agg(col))
FROM VALUES (1), (1), (2), (2), (3) tab(col);
3