Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
O Assistente de Mineração de Dados no Microsoft SQL Server Analysis Services é iniciado sempre que você adiciona uma nova estrutura de mineração a um projeto de mineração de dados. O assistente ajuda você a escolher uma fonte de dados e configurar uma exibição de fonte de dados que define os dados a serem usados para análise e, em seguida, ajuda você a criar um modelo inicial.
Na fase final do assistente, você pode, opcionalmente, dividir seus dados em conjuntos de treinamento e teste, e habilitar recursos como consulta detalhada.
O que saber antes de começar
Aqui estão os detalhes que você precisa saber antes de iniciar o assistente.
Você criará a estrutura de mineração de dados e modelos de um banco de dados relacional ou de um cubo existente em um banco de dados OLAP?
Quais colunas contêm as chaves que identificam exclusivamente um registro de caso?
Quais colunas ou atributos você deseja usar para previsão? Quais colunas ou atributos são bons para usar como entrada para análise?
Qual algoritmo você deve usar? Os algoritmos fornecidos no SQL Server Analysis Services têm características diferentes e produzem resultados diferentes. Felizmente, você não está limitado a um modelo para cada conjunto de dados, portanto, fique à vontade para experimentar adicionando modelos diferentes.
Você precisa ser capaz de testar seus modelos em um conjunto de dados unificado? Nesse caso, considere usar a opção para reservar alguns dados para teste. Você pode escolher uma porcentagem e limitar isso por um número especificado de linhas, se desejado.
Iniciando o Assistente de Mineração de Dados
Para usar o Assistente de Mineração de Dados, você deve ter aberto uma solução no SSDT (SQL Server Data Tools) que contenha pelo menos um projeto de mineração de dados ou OLAP.
Se a solução estiver pronta para mineração de dados, você poderá simplesmente clicar com o botão direito do mouse no nó Estruturas de Mineração no Gerenciador de Soluções e selecionar Nova Estrutura de Mineração para iniciar o assistente.
Se a solução não contiver nenhum projeto existente, você poderá adicionar um novo projeto de mineração de dados. No menu Arquivo , selecione Novo e, em seguida, selecione Project. Certifique-se de escolher o modelo Projeto Multidimensional e de Mineração de Dados do Analysis Services.
Você também pode usar o Assistente de Importação do Analysis Services para obter metadados de uma solução de mineração de dados existente. No entanto, você não pode selecionar os objetos individuais a serem importados; todo o banco de dados é importado, incluindo cubos, exibições de fonte de dados etc. Observe também que a nova solução criada por meio da importação é configurada automaticamente para usar o banco de dados padrão local. Talvez seja necessário alterar isso para outra instância antes de processar ou procurar os objetos e, se estiver importando de uma versão anterior do Analysis Services, talvez seja necessário atualizar referências aos provedores.
Em seguida, você criará a estrutura de mineração e um modelo de mineração de dados associado. Você também pode criar apenas a estrutura de mineração e adicionar modelos mais tarde, mas geralmente é mais fácil criar um modelo de teste primeiro.
Modelos de mineração relacionais vs. OLAP
A próxima opção importante que você tem é usar uma fonte de dados relacional ou basear seu modelo em dados multidimensionais (OLAP).
O Assistente de Mineração de Dados se ramifica em dois caminhos neste momento, dependendo se a fonte de dados é relacional ou está em um cubo. Todo o resto, exceto o processo de seleção de dados, é o mesmo: o algoritmo escolhido, a capacidade de adicionar um conjunto de dados de validação etc.; contudo, selecionar dados de cubo é um pouco mais complexo do que usar dados relacionais. (Você também obterá algumas opções adicionais no final se criar um modelo com base em um cubo.)
Confira os tópicos a seguir para obter um passo a passo de cada opção com mais detalhes:
Criar uma estrutura de mineração relacional
Orienta você pelas decisões tomadas ao criar um modelo de mineração de dados relacional.
Criar uma estrutura de mineração OLAP
Descreve as opções e seleções adicionais a serem executadas ao escolher dados de um cubo OLAP.
Observação
Você não precisa ter um cubo ou um banco de dados OLAP para fazer a mineração de dados. A menos que seus dados já estejam armazenados em um cubo ou que você queira minerar dimensões OLAP ou resultados de agregações ou cálculos OLAP, recomendamos que você use uma tabela relacional ou uma fonte de dados para mineração de dados.
Escolhendo um algoritmo
Em seguida, você deve decidir sobre qual algoritmo usar no processamento de seus dados. Essa decisão pode ser difícil de tomar. Cada algoritmo fornecido no Analysis Services tem recursos diferentes e produz resultados diferentes, para que você possa experimentar e experimentar vários modelos diferentes antes de determinar quais são os mais apropriados para seus dados e seu problema de negócios. Consulte o tópico a seguir para obter uma explicação das tarefas para as quais cada algoritmo é mais adequado:
Algoritmos de mineração de dados (Analysis Services – Mineração de Dados)
Novamente, você pode criar vários modelos usando algoritmos diferentes ou alterar parâmetros para os algoritmos criarem modelos diferentes. Você não está bloqueado em sua escolha de algoritmo e é uma boa prática criar vários modelos diferentes nos mesmos dados.
Definir os dados usados para modelagem
Além de escolher os dados de uma fonte, você deve especificar qual da tabela na exibição da fonte de dados contém os dados de caso. A tabela de casos será usada para treinar o modelo de mineração de dados e, como tal, deve conter as entidades que você deseja analisar: por exemplo, os clientes e suas informações demográficas. Cada caso deve ser exclusivo e deve ser identificável por uma chave de caso.
Além de especificar a tabela de casos, você pode incluir tabelas aninhadas em seus dados. Uma tabela aninhada geralmente contém informações adicionais sobre as entidades na tabela de casos, como transações realizadas pelo cliente ou atributos que têm uma relação muitos para um com a entidade. Por exemplo, uma tabela aninhada unida à tabela de casos Clientes pode incluir uma lista de produtos comprados por cada cliente. Em um modelo que analisa o tráfego para um site, a tabela aninhada pode incluir as sequências de páginas que o usuário visitou. Para obter mais informações, consulte Tabelas Aninhadas (Analysis Services – Mineração de Dados)
Recursos adicionais
Para ajudá-lo a escolher os dados certos e configurar as fontes de dados corretamente, o Assistente de Mineração de Dados fornece estes recursos adicionais:
Auto -detection de tipos de dados: o assistente examinará a exclusividade e a distribuição dos valores das colunas e, em seguida, recomendará o melhor tipo de dados, e sugerirá um tipo de uso para os dados. Você pode substituir essas sugestões selecionando valores de uma lista.
Sugestões de variáveis: você pode clicar em uma caixa de diálogo e iniciar um analisador que calcula correlações entre as colunas incluídas no modelo e determina se as colunas provavelmente são preditores do atributo de resultado, considerando a configuração do modelo até agora. Você pode substituir essas sugestões digitando valores diferentes.
Seleção de recursos: a maioria dos algoritmos detectará automaticamente colunas que são bons preditores e as usará preferencialmente. Em colunas que contêm muitos valores, a seleção de recursos será aplicada, para reduzir a cardinalidade dos dados e melhorar as chances de encontrar um padrão significativo. Você pode afetar o comportamento de seleção de recursos usando parâmetros de modelo.
Corte automático de cubo: se o modelo de mineração for baseado em uma fonte de dados OLAP, a capacidade de fatiar o modelo usando atributos de cubo será fornecida automaticamente. Isso é útil para criar modelos com base em subconjuntos de dados do cubo.
Conclusão do Assistente de Configuração
A última etapa do assistente é dar nome à estrutura de mineração e ao modelo de mineração associado. Dependendo do tipo de modelo criado, você também pode ter as seguintes opções importantes:
Se você selecionar Permitir detalhamento, a capacidade de fazer detalhamento será habilitada no modelo. Com o drillthrough, os usuários que têm as permissões apropriadas podem explorar os dados de origem usados para criar o modelo.
Se você estiver criando um modelo OLAP, poderá selecionar as opções, criar um novo cubo de mineração de dadosou criar uma dimensão de mineração de dados. Ambas as opções facilitam a navegação do modelo concluído e a busca detalhada dos dados subjacentes.
Depois de concluir o Assistente de Mineração de Dados, use o Designer de Mineração de Dados para modificar a estrutura de mineração e os modelos, para exibir a precisão do modelo, exibir características da estrutura e dos modelos ou fazer previsões usando os modelos.
Conteúdo relacionado
Para saber mais sobre as decisões que você precisa tomar ao criar um modelo de mineração de dados, consulte os seguintes links:
Algoritmos de mineração de dados (Analysis Services – Mineração de Dados)
Tipos de conteúdo (mineração de dados)
Tipos de dados (mineração de dados)
Seleção de Atributos (Mineração de Dados)
Valores ausentes (Analysis Services – Mineração de Dados)
Exploração detalhada nos modelos de mineração
Consulte Também
Ferramentas de Mineração de Dados
Soluções de mineração de dados