Compartilhar via


Criar uma nova estrutura de mineração OLAP

Você pode usar o Assistente de Mineração de Dados no Microsoft SQL Server Analysis Services para criar uma estrutura de mineração que usa dados de um modelo multidimensional. Modelos de mineração baseados em cubos OLAP podem usar a coluna e os valores em tabelas de fatos, dimensões e grupos de medidas como atributos para análise.

Para criar uma nova estrutura de mineração OLAP

  1. No Gerenciador de Soluções no SSDT (SQL Server Data Tools), clique com o botão direito do mouse na pasta Estruturas de Mineração em um projeto do Analysis Services e clique em Nova Estrutura de Mineração para abrir o Assistente de Mineração de Dados.

  2. Na página Bem-vindo ao Assistente de Mineração de Dados , clique em Avançar.

  3. Na página Selecionar o Método de Definição , selecione De cubo existente e clique em Avançar.

    Se você receber um erro com a mensagem, não será possível recuperar uma lista de algoritmos de mineração de dados com suporte, abra a caixa de diálogo Propriedades do Projeto e verifique se você especificou o nome de uma instância do Analysis Services que dá suporte a modelos multidimensionais. Não é possível criar modelos de mineração em uma instância do Analysis Services que dê suporte à modelagem tabular.

  4. Na página Criar a Estrutura de Mineração de Dados , decida se você criará apenas uma estrutura de mineração ou uma estrutura de mineração mais um modelo de mineração relacionado. Geralmente, é mais fácil criar um modelo de mineração ao mesmo tempo, para que você possa ser solicitado a incluir as colunas necessárias.

    Se você criar um modelo de mineração, selecione o algoritmo de mineração de dados que deseja usar e clique em Avançar. Para obter mais informações sobre como escolher um algoritmo, consulte Algoritmos de Mineração de Dados (Analysis Services – Mineração de Dados).

  5. Na página Selecionar a Dimensão do Cubo de Origem , em Selecionar uma Dimensão do Cubo de Origem, localize a dimensão que contém a maioria dos dados de caso.

    Por exemplo, se você estiver tentando identificar agrupamentos de clientes, poderá escolher a dimensão Cliente; se você estiver tentando analisar compras entre transações, poderá escolher a dimensão Detalhes do Pedido de Vendas da Internet. Você não está restrito a usar apenas os dados nessa dimensão, mas eles devem conter atributos importantes a serem usados na análise.

    Clique em Próximo.

  6. Na página Selecionar a Chave do Caso, em Atributos, selecione o atributo que será a chave da estrutura de mineração e clique em Avançar.

    Normalmente, o atributo que você usa como chave para a estrutura de mineração também é uma chave para a dimensão e será pré-selecionado.

  7. Na página Selecionar Colunas de Nível de Caso , em Atributos e Medidas Relacionados, selecione os atributos e medidas que contêm valores que você deseja adicionar à estrutura de mineração como dados de caso. Clique em Próximo.

  8. Na página Especificar Uso da Coluna do Modelo de Mineração , na estrutura do modelo de mineração, primeiro defina a coluna previsível e escolha as colunas a serem usadas como entradas.

    • Marque a caixa de seleção na coluna mais à esquerda para incluir os dados na estrutura de mineração. Você pode incluir colunas na estrutura que você usará para referência, mas não usá-las para análise.

    • Marque a caixa de seleção na coluna Entrada para usar o atributo como uma variável na análise.

    • Marque a caixa de seleção na coluna Prever somente para atributos previsíveis.

    Observe que as colunas designadas como chaves não podem ser usadas para entrada ou previsão.

    Clique em Próximo.

  9. Na página Especificar Uso da Coluna do Modelo de Mineração , você também pode adicionar e remover tabelas aninhadas à estrutura de mineração usando Adicionar Tabelas Aninhadas e Tabelas Aninhadas.

    Em um modelo de mineração de dados OLAP, uma tabela aninhada é outro conjunto de dados dentro do cubo que tem uma relação um-para-muitos com a dimensão que representa os atributos de caso. Portanto, quando a caixa de diálogo é aberta, ela seleciona previamente os grupos de medidas que já estão relacionados à dimensão que você selecionou como a tabela de casos. Neste ponto, você escolheria uma dimensão diferente que contenha informações adicionais úteis para análise.

    Por exemplo, se você estiver analisando clientes, usará a dimensão [Cliente] como a tabela de casos. Para a tabela aninhada, você pode adicionar o motivo pelos quais os clientes citaram ao fazer uma compra, que está incluída na dimensão [Razão de Vendas].

    Se você adicionar dados aninhados, deverá especificar duas colunas adicionais:

    • A chave da tabela aninhada: ela deve ser pré-selecionada na página, Selecionar Chave de Tabela Aninhada.

    • Os atributos a serem usados para análise: a página Selecionar Colunas de Tabela Aninhadas, fornece uma lista de medidas e atributos na seleção da tabela aninhada.

      • Para cada atributo que você incluir no modelo, marque a caixa de seleção na coluna esquerda.

      • Se você quiser usar o atributo somente para análise, verifique a entrada.

      • Se você quiser incluir a coluna como um dos atributos previsíveis para o modelo, selecione Prever.

      • Qualquer item que você incluir na estrutura, mas não especificar como um atributo de entrada ou previsível, é adicionado à estrutura com o indicador Ignore; isso significa que os dados são processados quando você cria o modelo, mas não são usados na análise e apenas estão disponíveis para detalhamento. Isso pode ser útil se você quiser incluir detalhes como nomes de clientes, mas não quiser usá-los na análise.

    Clique em Concluir para fechar a parte do assistente que funciona com tabelas aninhadas. Você pode repetir o processo para adicionar múltiplas colunas aninhadas.

  10. Na página Especificar Conteúdo e Tipo de Dados das Colunas , na estrutura do modelo de mineração, defina o tipo de conteúdo e o tipo de dados para cada coluna.

    Observação

    Os modelos de mineração OLAP não dão suporte ao uso do recurso Detectar para detectar automaticamente se uma coluna contém dados contínuos ou discretos.

    Clique em Próximo.

  11. Na página Cubo de Fonte de Fatia, é possível filtrar os dados que são usados para criar a estrutura de mineração.

    Cortar o cubo permite restringir os dados usados para criar o modelo. Por exemplo, você pode criar modelos separados para cada região segmentando pela hierarquia Geografia.

    • Dimensão: escolha uma dimensão relacionada na lista suspensa.

    • Hierarquia: selecione o nível da hierarquia de dimensões no qual você deseja aplicar o filtro. Por exemplo, se você estiver segmentando pela dimensão [Geografia], escolherá um nível de hierarquia, como [Nome do País da Região].

    • Operador: escolha um operador na lista.

    • Expressão de filtro: digite um valor ou expressão para servir como a condição de filtro ou use a lista suspensa para selecionar um valor na lista de membros no nível especificado da hierarquia.

      Por exemplo, se você selecionou [Geografia] como a dimensão e [Nome do País da Região] como o nível da hierarquia, a lista suspensa contém todos os países/regiões válidos que você pode usar como uma condição de filtro. Você pode fazer várias seleções. Como resultado, os dados na estrutura de mineração serão limitados aos dados de cubo dessas áreas geográficas.

    • Parâmetros: ignore esta caixa de seleção. Essa caixa de diálogo dá suporte a vários cenários de filtragem de cubo e essa opção não é relevante para a criação de uma estrutura de mineração.

    Clique em Próximo.

  12. Na página Dividir dados em conjuntos de treinamento e teste , especifique um percentual dos dados da estrutura de mineração a serem reservados para teste ou especifique o número máximo de casos de teste. Clique em Próximo.

    Se você especificar ambos os valores, os limites serão combinados para usar o que for mais baixo.

  13. Na página Concluindo o Assistente , forneça um nome para a nova estrutura de mineração OLAP e o modelo de mineração inicial.

  14. Clique em Concluir.

  15. Na página Concluindo o Assistente, você pode optar por criar uma dimensão de modelo de mineração e/ou um cubo utilizando essa dimensão de modelo de mineração. Essas opções têm suporte apenas para modelos criados usando os seguintes algoritmos:

    • Algoritmo de clustering da Microsoft

    • Algoritmo Árvores de Decisão da Microsoft

    • Algoritmo de Regras de Associação da Microsoft

    Crie uma dimensão de modelo de mineração: marque esta caixa de seleção e forneça um nome de tipo para a dimensão do modelo de mineração. Quando você usa essa opção, uma nova dimensão é criada dentro do cubo original que foi usado para criar a estrutura de mineração. Você pode usar essa dimensão para fazer drill down e realizar análises adicionais. Como a dimensão está localizada dentro do cubo, ela é mapeada automaticamente para a dimensão de dados do caso.

    Crie um cubo usando a dimensão do modelo de mineração: marque esta caixa de seleção e forneça um nome para o novo cubo. Quando você usa essa opção, um novo cubo é criado que contém as dimensões existentes que foram usadas na criação da estrutura e a nova dimensão de mineração de dados que contém os resultados do modelo.

Consulte Também

Tarefas e instruções da estrutura de mineração