Compartilhar via


Algoritmo de Associação da Microsoft

O algoritmo associação da Microsoft é um algoritmo de associação fornecido pelo Analysis Services que é útil para mecanismos de recomendação. Um mecanismo de recomendação recomenda produtos aos clientes com base em itens que eles já compraram ou nos quais eles indicaram interesse. O algoritmo de associação da Microsoft também é útil para análise de cesta de compras. Para obter um exemplo de análise de cesta de mercado, consulte a Lição 3: Criando um cenário de cesta de mercado (Tutorial de mineração de dados intermediário) no Tutorial de Mineração de Dados.

Os modelos de associação são criados em conjuntos de dados que contêm identificadores tanto para casos individuais quanto para os itens que os casos contêm. Um grupo de itens em um caso é chamado de conjunto de itens. Um modelo de associação consiste em uma série de conjuntos de itens e as regras que descrevem como esses itens são agrupados dentro dos casos. As regras identificadas pelo algoritmo podem ser usadas para prever as compras futuras prováveis de um cliente, com base nos itens que já existem no carrinho de compras do cliente. O diagrama a seguir mostra uma série de regras em um conjunto de itens.

Um conjunto de regras para um modelo de associação

Como ilustra o diagrama, o algoritmo da Associação da Microsoft pode potencialmente encontrar muitas regras em um conjunto de dados. O algoritmo usa dois parâmetros, suporte e probabilidade, para descrever os conjuntos de itens e as regras que ele gera. Por exemplo, se X e Y representam dois itens que podem estar em um carrinho de compras, o parâmetro de suporte é o número de casos no conjunto de dados que contêm a combinação de itens, X e Y. Usando o parâmetro de suporte em combinação com os parâmetros definidos pelo usuário, MINIMUM_SUPPORT e MAXIMUM_SUPPORT, o algoritmo controla o número de conjuntos de itens gerados. O parâmetro de probabilidade, também chamado de confiança, representa a fração de casos no conjunto de dados que contêm X e que também contêm Y. Usando o parâmetro de probabilidade em combinação com o parâmetro MINIMUM_PROBABILITY , o algoritmo controla o número de regras geradas.

Exemplo

A empresa Adventure Works Cycle está redesenhando a funcionalidade de seu site. A meta da reformulação é aumentar a venda de produtos. Como a empresa registra cada venda em um banco de dados transacional, ela pode usar o algoritmo da Associação da Microsoft para identificar conjuntos de produtos que tendem a ser comprados juntos. Em seguida, eles podem prever itens adicionais nos quais um cliente pode estar interessado, com base em itens que já estão na cesta de compras do cliente.

Como o algoritmo funciona

O algoritmo da Associação da Microsoft percorre um conjunto de dados para localizar itens que aparecem juntos em um caso. Em seguida, o algoritmo agrupa em conjuntos de itens todos os itens associados que aparecem, no mínimo, no número de casos especificados pelo parâmetro MINIMUM_SUPPORT . Por exemplo, um conjunto de itens poderia ser "Mountain 200=Existing, Sport 100=Existing" e ter um suporte de 710. Em seguida, o algoritmo gera regras dos conjuntos de itens. Essas regras são usadas para prever a presença de um item no banco de dados, com base na presença de outros itens específicos que o algoritmo identifica como importantes. Por exemplo, uma regra pode ser "se Touring 1000=existente e suporte de garrafa de estrada=existente, então garrafa de água=existente", e poderia ter uma probabilidade de 0,812. Neste exemplo, o algoritmo identifica que a presença na cesta do pneu Touring 1000 e da gaiola da garrafa de água prevê que uma garrafa de água também provavelmente estaria na cesta.

Para obter uma explicação mais detalhada do algoritmo, juntamente com uma lista de parâmetros para personalizar o comportamento do algoritmo e controlar os resultados no modelo de mineração, consulte a Referência Técnica do Algoritmo de Associação da Microsoft.

Dados necessários para modelos de associação

Ao preparar dados para uso em um modelo de regras de associação, você deve entender os requisitos para o algoritmo específico, incluindo a quantidade de dados necessária e como os dados são usados.

Os requisitos para um modelo de regras de associação são os seguintes:

  • Uma única coluna de chave Cada modelo deve conter uma coluna numérica ou de texto que identifique exclusivamente cada registro. chaves compostas não permitidas.

  • Uma única coluna previsível Um modelo de associação pode ter apenas uma coluna previsível. Normalmente, é a coluna-chave da tabela aninhada, como o campo que contém os produtos que foram comprados. Os valores devem ser discretos ou discretizados.

  • Colunas de entrada . As colunas de entrada devem ser discretas. Os dados de entrada de um modelo de associação geralmente estão contidos em duas tabelas. Por exemplo, uma tabela pode conter informações do cliente enquanto outra tabela contém compras de clientes. Você pode inserir esses dados no modelo usando uma tabela aninhada. Para obter mais informações sobre tabelas aninhadas, consulte Tabelas Aninhadas (Analysis Services – Mineração de Dados).

Para obter informações mais detalhadas sobre os tipos de conteúdo e tipos de dados com suporte para modelos de associação, consulte a seção Requisitos da Referência Técnica do Algoritmo de Associação da Microsoft.

Exibindo um modelo de associação

Para explorar o modelo, você pode usar o Visualizador da Associação da Microsoft. Quando você exibe um modelo de associação, o Analysis Services apresenta as correlações de diferentes ângulos para que você possa entender melhor as relações e as regras que foram encontradas nos dados. O painel Conjunto de Itens no visualizador fornece um detalhamento das combinações mais comuns ou conjuntos de itens. O painel Regras apresenta uma lista de regras que foram generalizadas dos dados, adiciona cálculos de probabilidade e classifica as regras por importância relativa. o visualizador de rede de dependência permite explorar visualmente como itens diferentes individuais são conectados. Para obter mais informações, consulte Procurar um modelo usando o Visualizador de Cluster da Microsoft.

Se você quiser saber mais detalhes sobre qualquer um dos conjuntos de itens e regras, navegue pelo modelo no Visualizador de Árvore de Conteúdo Genérico da Microsoft. O conteúdo armazenado para o modelo inclui o suporte para cada conjunto de itens, uma pontuação para cada regra e outras estatísticas. Para obter mais informações, consulte Conteúdo do Modelo de Mineração para Modelos de Associação (Analysis Services – Mineração de Dados).

Criando previsões

Depois que o modelo for processado, você poderá usar as regras e os conjuntos de itens para fazer previsões. Em um modelo de associação, uma previsão informa qual item provavelmente ocorrerá dada a presença do item especificado, e a previsão pode incluir informações como a probabilidade, o suporte ou a importância. Para obter exemplos de como criar consultas em relação a um modelo de associação, consulte Exemplos de consulta de modelo de associação.

Para obter informações gerais sobre como criar uma consulta em relação a um modelo de mineração de dados, consulte Consultas de mineração de dados.

Desempenho

O processo de criação de conjuntos de itens e de contagem de correlações pode ser demorado. Embora o algoritmo Regras de Associação da Microsoft use técnicas de otimização para economizar espaço e tornar o processamento mais rápido, você deve saber que problemas de desempenho podem ocorrer em condições como a seguinte:

  • O conjunto de dados é grande com muitos itens individuais.

  • O tamanho mínimo do conjunto de itens é definido muito baixo.

Para minimizar o tempo de processamento e reduzir a complexidade dos conjuntos de itens, você pode tentar agrupar itens relacionados por categorias antes de analisar os dados.

Observações

  • Não dá suporte ao uso da PMML (Predictive Model Markup Language) para criar modelos de mineração.

  • Permite detalhamento por meio de drill-through.

  • Dá suporte ao uso de modelos de mineração OLAP.

  • Dá suporte à criação de dimensões de mineração de dados.

Consulte Também

Algoritmos de Mineração de Dados (Analysis Services - Mineração de Dados)Navegue por um modelo usando o Visualizador de Regras de Associação da MicrosoftConteúdo do Modelo de Mineração para Modelos de Associação (Analysis Services - Mineração de Dados)Referência Técnica do Algoritmo de Associação da MicrosoftExemplos de Consulta de Modelo de Associação