Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Ao criar uma consulta em relação a um modelo de mineração de dados, você pode criar uma consulta de conteúdo, que fornece detalhes sobre as regras e conjuntos de itens descobertos durante a análise, ou você pode criar uma consulta de previsão, que usa as associações descobertas nos dados para fazer previsões. Para um modelo de associação, as previsões normalmente são baseadas em regras e podem ser usadas para fazer recomendações, enquanto as consultas no conteúdo normalmente exploram a relação entre os conjuntos de itens. Você também pode recuperar metadados sobre o modelo.
Esta seção explica como criar esses tipos de consultas para modelos baseados no algoritmo Regras de Associação da Microsoft.
Consultas de conteúdo
Obtendo dados de metadados de modelo usando DMX
Obtendo metadados do conjunto de linhas de esquema
Recuperando os parâmetros originais para o modelo
Recuperando uma lista de conjuntos de itens e produtos
Retornando os 10 principais conjuntos de itens
Consultas de previsão
Determinando a confiança para conjuntos de itens relacionados
Localizando informações sobre o modelo
Todos os modelos de mineração expõem o conteúdo aprendido pelo algoritmo de acordo com um esquema padronizado, que é chamado de conjunto de linhas de esquema de modelo de mineração. Você pode criar consultas no conjunto de linhas de esquema do modelo de mineração usando instruções DMX (Extensões de Mineração de Dados) ou usando procedimentos armazenados do Analysis Services. No SQL Server 2014, você também pode consultar os conjuntos de linhas de esquema diretamente como tabelas do sistema usando uma sintaxe semelhante a SQL.
Consulta de exemplo 1: Obtendo metadados de modelo usando DMX
A consulta a seguir retorna metadados básicos sobre o modelo de associação, Associationcomo o nome do modelo, o banco de dados em que o modelo é armazenado e o número de nós filho no modelo. Essa consulta usa uma consulta de conteúdo DMX para recuperar os metadados do nó pai do modelo:
SELECT MODEL_CATALOG, MODEL_NAME, NODE_CAPTION,
NODE_SUPPORT, [CHILDREN_CARDINALITY], NODE_DESCRIPTION
FROM Association.CONTENT
WHERE NODE_TYPE = 1
Observação
Você deve colocar o nome da coluna, CHILDREN_CARDINALITY, entre colchetes para distingui-la da palavra-chave reservada MDX de mesmo nome.
Resultados do exemplo:
| CATÁLOGO_DE_MODELOS | Teste de associação |
| MODEL_NAME | Associação |
| NODE_CAPTION | Modelo de regras de associação |
| NODE_SUPPORT | 14879 |
| CARDINALIDADE_DOS_FILHOS | 942 |
| NODE_DESCRIPTION | Modelo de regras de associação; ITEMSET_COUNT=679; RULE_COUNT=263; MIN_SUPPORT=14; MAX_SUPPORT=4334; MIN_ITEMSET_SIZE=0; MAX_ITEMSET_SIZE=3; MIN_PROBABILITY=0,400390625; MAX_PROBABILITY=1; MIN_LIFT=0,14309369632511; MAX_LIFT=1,95758227647523 |
Para obter uma definição do que essas colunas significam em um modelo de associação, consulte o Conteúdo do Modelo de Mineração para Modelos de Associação (Analysis Services – Mineração de Dados).
Consulta de exemplo 2: Obtendo metadados adicionais do conjunto de linhas de esquema
Consultando o conjunto de linhas do esquema de mineração de dados, você pode encontrar as mesmas informações retornadas em uma consulta de conteúdo DMX. No entanto, o conjunto de linhas de esquema fornece algumas colunas adicionais, como a data em que o modelo foi processado pela última vez, a estrutura de mineração e o nome da coluna usada como o atributo previsível.
SELECT MODEL_CATALOG, MODEL_NAME, SERVICE_NAME, PREDICTION_ENTITY,
MINING_STRUCTURE, LAST_PROCESSED
FROM $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'Association'
Resultados do exemplo:
| CATÁLOGO_DE_MODELOS | Adventure Works DW Multidimensional 2012 |
| MODEL_NAME | Associação |
| SERVICE_NAME | Modelo de regras de associação |
| PREDICTION_ENTITY | Itens de linha sequenciais do v Assoc |
| Estrutura de Mineração | Associação |
| Último_Processado | 29/09/2007 22:21:24 PM |
Consulta de exemplo 3: recuperando parâmetros originais para o modelo
A consulta a seguir retorna uma única coluna que contém detalhes sobre as configurações de parâmetro que foram usadas quando o modelo foi criado.
SELECT MINING_PARAMETERS
from $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'Association'
Resultados do exemplo:
MAXIMUM_ITEMSET_COUNT=200000,MAXIMUM_ITEMSET_SIZE=3,MAXIMUM_SUPPORT=1,MINIMUM_SUPPORT=9,40923449156529E-04,MINIMUM_IMPORTANCE=-9999999999,MINIMUM_ITEMSET_SIZE=0,MINIMUM_PROBABILITY=0,4
Localizando informações sobre regras e conjuntos de itens
Há dois usos comuns de um modelo de associação: descobrir informações sobre conjuntos de itens frequentes e extrair detalhes sobre regras e conjuntos de itens específicos. Por exemplo, talvez você queira extrair uma lista de regras que foram pontuadas como especialmente interessantes ou criar uma lista dos conjuntos de itens mais comuns. Você recupera essas informações usando uma consulta de conteúdo DMX. Você também pode procurar essas informações usando o Visualizador da Associação da Microsoft.
Consulta de exemplo 4: Recuperando lista de conjuntos de itens e produtos
A consulta a seguir recupera todos os conjuntos de itens, juntamente com uma tabela aninhada que lista os produtos incluídos em cada conjunto de itens. A coluna NODE_NAME contém a ID exclusiva do conjunto de itens dentro do modelo, enquanto o NODE_CAPTION fornece uma descrição de texto dos itens. Neste exemplo, a tabela aninhada é nivelada, de modo que um conjunto de itens que contém dois produtos gere duas linhas nos resultados. Você pode omitir a palavra-chave FLATTENED se o cliente der suporte a dados hierárquicos.
SELECT FLATTENED NODE_NAME, NODE_CAPTION,
NODE_PROBABILITY, NODE_SUPPORT,
(SELECT ATTRIBUTE_NAME FROM NODE_DISTRIBUTION) as PurchasedProducts
FROM Association.CONTENT
WHERE NODE_TYPE = 7
Resultados do exemplo:
| NODE_NAME | 37 |
| NODE_CAPTION | Sport-100 = Existente |
| PROBABILIDADE_DO_NÓ | 0.291283016331743 |
| NODE_SUPPORT | 4334 |
| PRODUTOS COMPRADOS.NOME_DO_ATRIBUTO | v Itens de Linha de Sequência Associados (Sport-100) |
Consulta de exemplo 5: Retornando os 10 principais conjuntos de itens
Este exemplo demonstra como usar algumas das funções de agrupamento e ordenação que o DMX fornece por padrão. A consulta retorna os 10 principais conjuntos de itens quando ordenada pelo suporte para cada nó. Observe que você não precisa agrupar explicitamente os resultados, como faria no Transact-SQL; no entanto, você pode usar apenas uma função de agregação em cada consulta.
SELECT TOP 10 (NODE_SUPPORT),NODE_NAME, NODE_CAPTION
FROM Association.CONTENT
WHERE NODE_TYPE = 7
Resultados do exemplo:
| NODE_SUPPORT | 4334 |
| NODE_NAME | 37 |
| NODE_CAPTION | Sport-100 = Existente |
Fazendo previsões usando o modelo
Um modelo de regras de associação geralmente é usado para gerar recomendações, que são baseadas em correlações descobertas nos conjuntos de itens. Portanto, ao criar uma consulta de previsão com base em um modelo de regras de associação, você normalmente está usando as regras no modelo para fazer suposições com base em novos dados. PredictAssociation (DMX) é a função que retorna recomendações e tem vários argumentos que você pode usar para personalizar os resultados da consulta.
Outro exemplo de onde as consultas em um modelo de associação podem ser úteis é retornar a confiança para várias regras e conjuntos de itens para que você possa comparar a eficácia de diferentes estratégias de venda cruzada. Os exemplos a seguir ilustram como criar essas consultas.
Consulta de exemplo 6: Prevendo itens associados
Este exemplo usa o modelo de Associação criado no Tutorial de Mineração de Dados Intermediário (Analysis Services – Mineração de Dados). Ele demonstra como criar uma consulta de previsão que informa quais produtos recomendar a um cliente que comprou um produto específico. Esse tipo de consulta, em que você fornece valores para o modelo em uma SELECT...UNION instrução, é chamado de consulta singleton. Como a coluna de modelo previsível que corresponde aos novos valores é uma tabela aninhada, você deve usar uma cláusula SELECT para mapear o novo valor para a coluna da tabela aninhada [Model] e outra cláusula SELECT para mapear a coluna da tabela aninhada para a coluna de nível de caso [v Assoc Seq Line Items]. Adicionar a palavra-chave INCLUDE-STATISTICS à consulta permite que você veja a probabilidade e o suporte para as recomendações.
SELECT PredictAssociation([Association].[vAssocSeqLineItems],INCLUDE_STATISTICS, 3)
FROM [Association]
NATURAL PREDICTION JOIN
(SELECT
(SELECT 'Classic Vest' as [Model])
AS [v Assoc Seq Line Items])
AS t
Resultados do exemplo:
| Modelo | $SUPPORT | $PROBABILITY | $ADJUSTEDPROBABILITY |
|---|---|---|---|
| Sport-100 | 4334 | 0.291283 | 0.252696 |
| Garrafa de água | 2866 | 0.19262 | 0.175205 |
| Kit de patch | 2113 | 0.142012 | 0.132389 |
Consulta de exemplo 7: determinando a confiança para conjuntos de itens relacionados
Enquanto as regras são úteis para gerar recomendações, os conjuntos de itens são mais interessantes para uma análise mais profunda dos padrões no conjunto de dados. Por exemplo, se você não estava satisfeito com a recomendação retornada pela consulta de exemplo anterior, poderá examinar outros conjuntos de itens que contêm o Produto A para ter uma ideia melhor de se o Produto A é um acessório que as pessoas tendem a comprar com todos os tipos de produtos ou se A está fortemente correlacionado com compras de produtos específicos. A maneira mais fácil de explorar essas relações é filtrando os conjuntos de itens no Microsoft Association Viewer; no entanto, você pode recuperar as mesmas informações com uma consulta.
A consulta de exemplo a seguir retorna todos os conjuntos de itens que incluem o item garrafa de água, incluindo o único item Garrafa de água.
SELECT TOP 100 FROM
(
SELECT FLATTENED NODE_CAPTION, NODE_SUPPORT,
(SELECT ATTRIBUTE_NAME from NODE_DISTRIBUTION
WHERE ATTRIBUTE_NAME = 'v Assoc Seq Line Items(Water Bottle)') as D
FROM Association.CONTENT
WHERE NODE_TYPE = 7
) AS Items
WHERE [D.ATTRIBUTE_NAME] <> NULL
ORDER BY NODE_SUPPORT DESC
Resultados do exemplo:
| NODE_CAPTION | NODE_SUPPORT | D.NOME_ATRIBUTO |
|---|---|---|
| Garrafa de Água = Existente | 2866 | Itens de linha sequenciais associados (garrafa de água) |
| Gaiola de Garrafa de Montanha = Existente, Garrafa de Água = Existente | 1136 | v Itens de Linha Sequencial Associados (Garrafa de Água) |
| Gaiola de Garrafa de Estrada = Existente, Garrafa de Água = Existente | 1068 | v Itens de Linha Sequencial Associados (Garrafa de Água) |
| Garrafa de Água = Existente, Sport-100 = Existente | 734 | v Itens de Linha Sequenciais Associados (Garrafa de Água) |
Essa consulta retorna todas as linhas da tabela aninhada que correspondem aos critérios e todas as linhas da tabela externa ou de casos. Portanto, você deve adicionar uma condição que elimine as linhas da tabela de casos que tenham um valor nulo para o nome do atributo de destino.
Lista de funções
Todos os algoritmos da Microsoft dão suporte a um conjunto comum de funções. No entanto, o algoritmo Associação da Microsoft dá suporte às funções adicionais listadas na tabela a seguir.
| Função de previsão | Uso |
| IsDescendant (DMX) | Determina se um nó é filho de outro nó no grafo de rede neural. |
| IsInNode (DMX) | Indica se o nó especificado contém o caso atual. |
| PredictAdjustedProbability (DMX) | Retorna a probabilidade ponderada. |
| PredictAssociation (DMX) | Prevê a associação em um conjunto de dados associativo. |
| PredictHistogram (DMX) | Retorna uma tabela de valores relacionada ao valor previsto atual. |
| PredictNodeId (DMX) | Retorna o Node_ID para cada caso. |
| PredictProbability (DMX) | Retorna a probabilidade para o valor previsto. |
| PredictSupport (DMX) | Retorna o valor de suporte para um estado especificado. |
| PredictVariance (DMX) | Retorna a variância para o valor previsto. |
Consulte Também
Algoritmo de Associação da Microsoft
Referência técnica do algoritmo de associação da Microsoft
Conteúdo do modelo de mineração para modelos de associação (Analysis Services – Mineração de dados)