Compartilhar via


Distribuições de coluna (mineração de dados)

No Microsoft SQL Server Analysis Services, você pode definir distribuições de coluna em uma estrutura de mineração para afetar como os algoritmos processam os dados nessas colunas ao criar modelos de mineração. Para alguns algoritmos, é útil definir a distribuição de quaisquer colunas contínuas antes de processar o modelo, se as colunas forem conhecidas por conter distribuições comuns de valores. Se você não definir as distribuições, os modelos de mineração resultantes poderão produzir previsões menos precisas do que se as distribuições foram definidas, pois os algoritmos terão menos informações para interpretar os dados.

Os algoritmos disponíveis no Analysis Services dão suporte aos seguintes tipos de distribuição:

Normal Os valores da coluna contínua formam um histograma com uma distribuição normal.

Histograma com distribuição normal

Log Normal Os valores da coluna contínua formam um histograma, em que a curva é alongada na extremidade superior e é distorcida em direção à extremidade inferior.

Histograma com distribuição log-normal

Uniform Os valores da coluna contínua formam uma curva plana, na qual todos os valores são igualmente prováveis.

Histograma com distribuição uniforme

Para obter mais informações sobre os algoritmos fornecidos pelo Analysis Services, consulte Algoritmos de mineração de dados (Analysis Services – Data Mining).

Consulte Também

Tipos de conteúdo (mineração de dados)Estruturas de mineração (Analysis Services – Mineração de Dados)Métodos de Discretização (Mineração de Dados)Distribuições (DMX)Colunas da Estrutura de Mineração