Compartir a través de


Asistente para asociación (Cliente de minería de datos para Excel)

Asistente para asociar en la cinta

El Asistente para asociar le ayuda a crear un modelo de minería de datos mediante el algoritmo de reglas de asociación de Microsoft. Estos modelos de minería de datos son especialmente útiles para crear sistemas de recomendación.

Lo que funciona es que el algoritmo de reglas de asociación de Microsoft examina un conjunto de datos formado por transacciones o eventos y busca las combinaciones que aparecen con frecuencia juntas. Puede haber muchos miles de combinaciones pero el algoritmo puede personalizar para buscar más o menos, y para conservar solo las combinaciones más probables.

Puede aplicar análisis de asociación a varios problemas. La aplicación más popular de este método es el análisis de la cesta de la compra, que busca productos individuales que se suelen comprar juntos a menudo. Puede utilizar esa información para recomendar productos a los clientes basándose en los elementos que han comprado previamente.

Usar el Asistente para asociación

  1. En la cinta de opciones Minería de datos , haga clic en Asociar.

  2. En la página Seleccionar datos de origen, elija una tabla o un intervalo de datos de Excel y haga clic en Siguiente.

    El libro de datos de ejemplo contiene un ejemplo, en la pestaña Asociado, de cómo los datos de la transacción se organizan normalmente si, por ejemplo, tiene varios productos en cada transacción o varios registros de compra por cada cliente que desea analizar.

    Si desea usar datos externos para crear un modelo de asociación mediante el Asistente para asociar, primero debe agregar los datos a Excel y aplanar los datos. Para obtener más información sobre cómo preparar los datos para el modelado de asociaciones, vea Tablas anidadas (Analysis Services - Minería de datos) en SQL Server Libros en pantalla.

  3. En la página Asociación , elija la columna que identifica la transacción.

    Para los modelos de cesta de la compra, este identificador representa la unidad que desea modelar. ¿Desea analizar los elementos que clientes particulares han comprado a lo largo del tiempo o desea analizar varias transacciones que implican a varios clientes? En el primer caso, elegirá el identificador del cliente; en el último elegirá el pedido de compra u otro identificador de transacción.

  4. En Elemento, seleccione la columna que contiene las cosas entre las que necesita buscar asociaciones.

    Por ejemplo, en un modelo de cesta de la compra, elegiría un campo de productos, para analizar qué productos se suelen comprar a menudo. Si hay demasiados productos individuales para correlacionarlos de forma eficaz, puede elegir una categoría de producto o un campo de subcategoría.

  5. En Umbrales, puede establecer valores que controlan o afectan a la salida del modelo:

    • Compatibilidad mínima. Especifica cuántas veces debe aparecer un grupo de elementos para que se considere importante. El algoritmo omitirá cualquier combinación de elementos que no cumpla este criterio. Por ejemplo, puede que desee ver solo los conjuntos de elementos en el que los elementos aparecían juntos al menos 10 veces en total.

    • Probabilidad mínima de regla. Especifica el valor de la probabilidad mínima necesaria para que una regla se guarde. Se analiza el conjunto de datos completo para buscar todas las combinaciones y entonces se calcula la probabilidad. Si este umbral es bajo, el asistente podría asociar elementos que sólo están relativamente relacionados. Si este umbral es demasiado alto, podrían omitirse algunas asociaciones por no tener suficientes datos de compatibilidad.

    En general, cambiar estos valores tiene los efectos siguientes:

    • Si reduce el valor de la compatibilidad, aumenta el número de combinaciones encontradas.

    • Si reduce la compatibilidad máxima, se filtran elementos que se producen con tanta frecuencia que son poco significativos.

    • Si reduce la probabilidad de una regla, reduce los requisitos que debe cumplir una combinación para que se considere importante en el contexto del conjunto completo de datos.

    Propina: Es recomendable crear varios modelos de minería de datos mediante diferentes combinaciones de compatibilidad y probabilidad. Para realizar un seguimiento de la configuración que usó para cada modelo, puede usar el Asistente para modelo de documentos, disponible en el cliente de minería de datos para Excel y usar la opción Informe detallado . Para obtener más información, vea Documenting Mining Models (Data Mining Add-ins for Excel).

  6. Opcionalmente, haga clic en Parámetros para cambiar los parámetros del algoritmo y personalizar el comportamiento del modelo de minería de datos.

    El cuadro de diálogo Parámetros de algoritmo incluye todos los parámetros que establezca en el asistente, más algunos que son de uso menos frecuente, como MAXIMUM_SUPPORT. Para obtener información sobre cómo usar estos parámetros, consulte Referencia técnica del algoritmo de asociación de Microsoft.

  7. En la página Finalizar , escriba un nombre único para el conjunto de datos y el modelo.

  8. En Opciones, se define cómo desea trabajar con el modelo una vez completado:

    • Examinar. Cuando el modelo está listo, el asistente abre una ventana que muestra las reglas, los conjuntos de elementos y un gráfico de red de dependencias que ilustra las asociaciones.

      Para obtener más información sobre cómo interpretar los datos en el visor de modelos de asociación, vea Examinar un modelo de reglas de asociación.

    • Habilite la obtención de detalles. Seleccione esta opción para obtener acceso a los datos subyacentes, a través del modelo.

      La obtención de detalles es útil, por ejemplo, si desea hacer clic en un conjunto de elementos determinado y ver los datos de origen.

    • Use el modelo temporal. Seleccione esta opción si no desea que el modelo se guarde en el servidor. Se eliminan los modelos temporales al cerrar Excel.

  9. El asistente analiza todas las combinaciones posibles y crea un informe que contiene conjuntos de elementos y reglas.

Más información sobre los modelos de asociación

El algoritmo de reglas de asociación de Microsoft examina los datos de entrenamiento para buscar elementos que aparecen juntos en una transacción. Cada grupo de elementos constituye un conjunto de elementos. A continuación, el algoritmo cuenta el número de veces que aparece cada conjunto de elementos y calcula importancia relativa de cada uno de ellos en todas las transacciones.

El algoritmo usa esta información sobre los conjuntos de elementos para generar reglas que se puedan usar para predecir asociaciones o realizar recomendaciones. Por ejemplo, una regla podría ser "si el usuario ha comprado un libro de Autor 1 y un libro de Autor 2, es probable que el usuario compre también un libro de Autor 3". A cada recomendación se le asigna una probabilidad en función de la solidez de las asociaciones.

Requisitos

Para usar el Asistente para asociar, debe estar conectado a una base de datos de Analysis Services.

Los datos de origen deben estar organizados como una tabla de transacciones. Los datos de origen deben contener una columna con el identificador de la transacción. Esta columna identifica cada grupo de elementos. Esta columna de transacción debe mantener una relación de uno a varios con una segunda columna, el Id. de elemento, que almacena los nombres o números de Id. de los elementos individuales del grupo.

Conceptualmente, esto puede comprenderse más fácilmente si se recupera el ejemplo de la cesta de la compra. Si a la cesta de la compra se le asigna un identificador, el identificador de cesta de la compra sirve como identificador de la transacción. Cada elemento de la cesta de la compra, como patatas o leche, es un miembro de la transacción. El algoritmo de asociación puede hacer el seguimiento de los elementos entre transacciones: por ejemplo, para determinar cuántas veces aparecen dentro de cada transacción los elementos patatas y leche.

Los datos de origen se deben ordenar por la columna del identificador de la transacción.

Consulte también

Crear un modelo de minería de datos
Examinar un modelo de reglas de asociación
Análisis de la cesta de compras (Herramientas de análisis de tabla para Excel)
Tutorial del diagrama de red de dependencias (Complementos de minería de datos)