Compartilhar via


Lição 1: Criando o modelo de mineração de dados para comprador de bicicletas

Nesta lição, você criará uma estrutura de mineração que permite prever se um potencial cliente da Adventure Works Cycles comprará uma bicicleta. Se você não estiver familiarizado com as estruturas de mineração e sua função na mineração de dados, consulte Estruturas de Mineração (Analysis Services – Mineração de Dados).

A estrutura de mineração do Bike Buyer que você irá criar nesta lição dá suporte à adição de modelos de mineração com base no Algoritmo de Clustering da Microsoft e no Algoritmo de Árvores de Decisão da Microsoft. Em lições posteriores, você usará modelos de mineração de agrupamento para explorar as diferentes maneiras de agrupar os clientes e usará modelos de árvore de decisão para prever se um cliente em potencial comprará ou não uma bicicleta.

Instrução CREATE MINING STRUCTURE

Para criar uma estrutura de mineração, use a instrução CREATE MINING STRUCTURE (DMX ). O código na instrução pode ser dividido nas seguintes partes:

  • Nomeando a estrutura.

  • Definindo a coluna chave.

  • Definindo as colunas de mineração.

  • Definindo um conjunto de dados de teste opcional.

Veja a seguir um exemplo genérico da instrução CREATE MINING STRUCTURE:

CREATE MINING STRUCTURE [<mining structure name>]  
(  
    <key column>,  
    <mining structure columns>  
)   
WITH HOLDOUT (<holdout specifier>)  

A primeira linha do código define o nome da estrutura:

CREATE MINING STRUCTURE [<mining structure name>]  

Para obter informações sobre como nomear um objeto em DMX (Extensões de Mineração de Dados), consulte Identificadores (DMX).

A próxima linha do código define a coluna de chave para a estrutura de mineração, que identifica exclusivamente uma entidade nos dados de origem:

<key column>,  

Na estrutura de mineração que você criará, o identificador do cliente, CustomerKeydefine uma entidade nos dados de origem.

A próxima linha do código é usada para definir as colunas de mineração que serão usadas pelos modelos de mineração associados à estrutura de mineração:

<mining structure columns>  

Você pode usar a função DISCRETIZE nas <colunas de estrutura de mineração> para discretizar colunas contínuas usando a seguinte sintaxe:

DISCRETIZE(<method>,<number of buckets>)

Para obter mais informações sobre a discretização de colunas, consulte Métodos de Discretização (Mineração de Dados). Para obter mais informações sobre os tipos de colunas de estrutura de mineração que você pode definir, consulte Colunas de Estrutura de Mineração.

A linha final do código define uma partição opcional na estrutura de mineração:

WITH HOLDOUT (<holdout specifier>)  

Especifique algumas partes dos dados a serem usados para testar modelos de mineração relacionados à estrutura e os dados restantes são usados para treinar os modelos. Por padrão, o Analysis Services cria um conjunto de dados de teste que contém 30% de todos os dados de caso. Você adicionará a especificação de que o conjunto de dados de teste deve conter 30% dos casos até um máximo de 1000 casos. Se 30% dos casos for menor que 1000, o conjunto de dados de teste conterá a quantidade menor.

Tarefas da lição

Você executará as seguintes tarefas nesta lição:

  • Crie uma nova consulta em branco.

  • Altere a consulta para criar a estrutura de mineração.

  • Execute a consulta.

Criando a consulta

A primeira etapa é conectar-se a uma instância do Analysis Services e criar uma nova consulta DMX no SQL Server Management Studio.

Para criar uma nova consulta DMX no SQL Server Management Studio

  1. Abra o SQL Server Management Studio.

  2. Na caixa de diálogo Conectar ao Servidor , para tipo de servidor, selecione Analysis Services. No nome do servidor, digite LocalHostou digite o nome da instância do Analysis Services ao qual você deseja se conectar para esta lição. Clique em Conectar.

  3. No Pesquisador de Objetos, clique com o botão direito do mouse na instância do Analysis Services, aponte para Nova Consulta e clique em DMX para abrir o Editor de Consultas e uma nova consulta em branco.

Alterando a consulta

A próxima etapa é modificar a instrução CREATE MINING STRUCTURE descrita acima para criar a estrutura de mineração do Bike Buyer.

Para personalizar a instrução CREATE MINING STRUCTURE

  1. No Editor de Consultas, copie o exemplo genérico da instrução CREATE MINING STRUCTURE na consulta em branco.

  2. Substitua o seguinte:

    [<mining structure>]   
    

    por:

    [Bike Buyer]  
    
  3. Substitua o seguinte:

    <key column>   
    

    por:

    CustomerKey LONG KEY  
    
  4. Substitua o seguinte:

    <mining structure columns>   
    

    por:

    [Age] LONG DISCRETIZED(Automatic,10),  
    [Bike Buyer] LONG DISCRETE,  
    [Commute Distance] TEXT DISCRETE,  
    [Education] TEXT DISCRETE,  
    [Gender] TEXT DISCRETE,  
    [House Owner Flag] TEXT DISCRETE,  
    [Marital Status] TEXT DISCRETE,  
    [Number Cars Owned] LONG DISCRETE,  
    [Number Children At Home] LONG DISCRETE,  
    [Occupation] TEXT DISCRETE,  
    [Region] TEXT DISCRETE,  
    [Total Children]LONG DISCRETE,  
    [Yearly Income] DOUBLE CONTINUOUS  
    
  5. Substitua o seguinte:

    WITH HOLDOUT (holdout specifier>)  
    

    por:

    WITH HOLDOUT (30 PERCENT or 1000 CASES)  
    

    A declaração completa da estrutura de mineração deve ser agora a seguinte:

    CREATE MINING STRUCTURE [Bike Buyer]  
    (  
       [Customer Key] LONG KEY,  
       [Age]LONG DISCRETIZED(Automatic,10),  
       [Bike Buyer] LONG DISCRETE,  
       [Commute Distance] TEXT DISCRETE,  
       [Education] TEXT DISCRETE,  
       [Gender] TEXT DISCRETE,  
       [House Owner Flag] TEXT DISCRETE,  
       [Marital Status] TEXT DISCRETE,  
       [Number Cars Owned]LONG DISCRETE,  
       [Number Children At Home]LONG DISCRETE,  
       [Occupation] TEXT DISCRETE,  
       [Region] TEXT DISCRETE,  
       [Total Children]LONG DISCRETE,  
       [Yearly Income] DOUBLE CONTINUOUS  
    )  
    WITH HOLDOUT (30 PERCENT or 1000 CASES)  
    
    
  6. No menu Arquivo , clique em Salvar DMXQuery1.dmx Como.

  7. Na caixa de diálogo Salvar como , navegue até a pasta apropriada e nomeie o arquivo Bike Buyer Structure.dmx.

Executando a consulta

A etapa final é executar a consulta. Depois que uma consulta é criada e salva, ela precisa ser executada. Ou seja, a instrução precisa ser executada para criar a estrutura de mineração no servidor. Para obter mais informações sobre como executar consultas no Editor de Consultas, consulte o Editor de Consultas do Mecanismo de Banco de Dados (SQL Server Management Studio).

Para executar a consulta

  1. No Editor de Consultas, na barra de ferramentas, clique em Executar.

    O status da consulta é exibido na guia Mensagens na parte inferior do Editor de Consultas após a conclusão da execução da instrução. As mensagens devem ser exibidas:

    Executing the query   
    Execution complete  
    

    Uma nova estrutura chamada Bike Buyer agora existe no servidor.

Na próxima lição, você adicionará modelos de mineração à estrutura que acabou de criar.

Próxima lição

Lição 2: Adicionando modelos de mineração à estrutura de mineração de Comprador de Bicicleta