Compartir a través de


Exploración de un modelo de reglas de asociación

Al abrir un modelo de asociación mediante Examinar, el modelo se muestra en un visor interactivo, similar al Visor de reglas de asociación en Analysis Services. El visor le permite ver de un vistazo qué elementos se correlacionaron entre sí y muestra reglas que puede usar para la predicción o realizar recomendaciones.

Exploración del modelo

Al abrir un modelo de minería de datos que se creó mediante el algoritmo de reglas de asociación de Microsoft, la ventana Examinar incluye las siguientes vistas, cada una diseñada para permitirle explorar un aspecto diferente del modelo:

Tome nota de la opción en cada pestaña, Mostrar nombre largo . Al seleccionar esta opción, puede mostrar u ocultar la tabla desde la que se origina el conjunto de elementos y acortar o alargar el nombre de la regla o el conjunto de elementos. Esta opción es especialmente útil cuando los datos de casos y los datos de atributo proceden de orígenes de datos diferentes.

Para experimentar con un modelo de asociación, puede usar los datos de ejemplo en la pestaña Asociar del libro de datos de ejemplo y crear un modelo de asociación con todos los valores predeterminados. También puede crear un modelo de análisis de cesta de la compra y abrirlo mediante Examinar.

Conjuntos de elementos

La pestaña Conjuntos de elementos es un buen lugar para empezar a explorar un modelo de asociación. En esta pestaña se muestra una lista de los elementos que el modelo ha encontrado con frecuencia juntos.

Lista de elementos de un modelo de asociación

El ejemplo más común de conjuntos de artículos se encuentra en un modelo de cesta de la compra, donde un conjunto de artículos representa pares o conjuntos de productos que muchos clientes compran al mismo tiempo. Sin embargo, dependiendo de cómo se agrupan y ordena los elementos, el conjunto de elementos puede contener una secuencia de películas que los clientes ordena durante un período de tiempo, o eventos que tienden a producirse en una ubicación determinada.

Un conjunto de elementos puede contener desde un solo elemento hasta dos, tres, o tantos como se establezca como el tamaño máximo del conjunto de elementos para el modelo. Para cada conjunto de elementos, el visor muestra la compatibilidad, la probabilidad y el tamaño del conjunto de elementos. La compatibilidad y la probabilidad son las estadísticas principales que se usan para clasificar los conjuntos de elementos y las reglas generados por un modelo de asociación. Estos valores también se usan para calcular y describir su importancia.

Soporte técnico. El soporte significa el número de casos o filas de datos de entrada que tienen este elemento. Por ejemplo, si un conjunto de elementos contiene dos elementos que se encuentran en un carro de la compra, el número de la columna Soporte indica cuántas veces se produjo esa combinación de elementos en los datos de origen.

Tamaño. Al cambiar el tamaño del conjunto de elementos, puede controlar la longitud de las listas de conjuntos de elementos. Si no desea ver productos únicos en la lista, cambie la opción Tamaño mínimo del conjunto de elementos a 2 o más. Restringir la lista aumentando el tamaño mínimo de los conjuntos de elementos permite buscar patrones muy específicos. Esto puede ser útil si está trabajando con un conjunto de datos muy grande.

Puede filtrar el número de conjuntos de elementos que se muestran en la pestaña cambiando los valores De compatibilidad mínima y Número máximo de filas . Si aumenta el valor de soporte mínimo, la lista mostrará menos conjuntos de elementos, pero serán los más comunes en los datos de entrada. Si común es lo mismo que importante es otra pregunta, que puede explorar a través de la pestaña Reglas.

Tenga en cuenta que cambiar el valor de compatibilidad u otros controles de la pestaña Conjuntos de elementos solo cambia los elementos que se muestran y no afecta al modelo subyacente. Si desea generar menos o más conjuntos de elementos o limitar su tamaño, debe usar los parámetros MINIMUM_SUPPORT y MAXIMUM_SUPPORT, disponibles en el cuadro de diálogo Parámetros de Algoritmo.

Explorar la lista de conjuntos de elementos
  1. Haga clic en la columna Soporte técnico para ordenar por la compatibilidad más alta a la más baja. Esto le dará una idea de lo que los clientes compran con más frecuencia.

  2. Para centrarse en un conjunto de elementos concreto de interés, fuera de las miles de combinaciones posibles, escriba algún texto en el cuadro Conjunto de elementos de filtro .

    Aquí hemos escrito Gloves. Al aplicar el filtro, la lista se actualiza para mostrar solo los conjuntos de elementos que contienen guantes. Esto le permite centrarse en las transacciones en las que los clientes compraron guantes y algún otro artículo.

    La opción Filtrar conjunto de elementos también muestra una lista de los filtros que ha usado anteriormente.

  3. Cambie el valor de Tamaño mínimo del conjunto de artículos para filtrar los clientes que solo compraron guantes y ningún otro elemento.

  4. Haga clic en la lista desplegable de la opción Mostrar para controlar cómo se muestran los atributos:

    • Mostrar el nombre y el valor del atributo

    • Mostrar solo el valor del atributo

    • Mostrar solo el nombre del atributo

    Observe cómo cambia el nombre. En el caso de un modelo de cesta de mercado, que se basa en tablas anidadas de productos adquiridos por varios clientes, el nombre del atributo suele ser el nombre del producto y la presencia del producto en la lista se marca como Existing, lo que significa que el cliente compró el artículo.

    Lo contrario de Existing es Missing, que puede ser un atributo muy útil para investigar en la minería de datos. Por ejemplo, supongamos que el conjunto de elementos A +B es tan popular que quería encontrar a los clientes que compraron el artículo A, pero no el elemento B. Para ello, puede usar una consulta de predicción y recuperar las transacciones con una, pero no la otra, y realizar algunos análisis adicionales sobre ellos. Para obtener información sobre cómo crear consultas de predicción en modelos de asociación, vea Ejemplos de consultas de modelos de asociación en los Libros en línea de SQL Server.

  5. Para forzar que la lista de conjuntos de ítems se vuelva a mostrar con los nuevos criterios de filtro, puede activar o desactivar la casilla de verificación Mostrar nombre largo.

Volver a la parte superior

Reglas

La pestaña Reglas combina información sobre los conjuntos de elementos y su valor relativo.

Lista de reglas creadas por un modelo

La probabilidad representa la fracción de casos del conjunto de datos que contienen la combinación de elementos de destino. La probabilidad es similar al concepto estadístico de confianza y proporciona una indicación de la probabilidad de que se produzca el resultado de una regla. Puede cambiar el valor de Probabilidad mínima en este panel para filtrar las reglas que se muestran.

El valor de Probabilidad mínima que ve inicialmente es el valor de umbral que usó el algoritmo al compilar el modelo. Una vez completado el modelo, no puede reducir este valor, pero puede aumentarlo para mostrar solo los elementos de probabilidad más altos.

La importancia está diseñada para medir la utilidad de una regla. Una regla muy común podría ser tan ubicuo que tenga poco valor de información. Cuanto mayor sea la importancia, más valiosa será la regla para predecir el resultado. En la herramienta Análisis de cesta de la compra (Table AnalysisTools for Excel), la importancia se puede combinar con el precio de los artículos para determinar los paquetes que son potencialmente más valiosos en términos de ventas.

Exploración de la lista de reglas
  1. Intente hacer clic en los encabezados de columna - Probabilidad, Importancia y Regla - para ver cómo cambian los datos.

  2. Use la opción Regla de filtro para escribir valores y centrarse en las reglas de destino.

    Por ejemplo, si desea ver todas las reglas que predicen lo que es probable que los clientes compren junto con guantes, escriba "guantes" en el cuadro de texto y actualice el panel.

    La opción Filtrar conjunto de elementos también muestra una lista de los filtros que ha usado anteriormente.

  3. Para forzar que se vuelvan a mostrar las reglas en la lista utilizando criterios de filtrado, puede activar o desactivar la casilla Mostrar nombre largo.

  4. Use la opción Mostrar para controlar la forma en que se muestran los nombres de regla.

  5. Establezca el valor de la opción Número máximo de filas en 100 y, a continuación, haga clic en Copiar en Excel.

    Tenga en cuenta que cambiar este valor no tiene ningún efecto en la cantidad de datos del modelo; simplemente controla el número de filas de la lista para mostrar. Esta opción puede ser útil al trabajar con modelos muy grandes.

Volver a la parte superior

Red de dependencias

La pestaña Red de dependencias es un mapa visual de las correlaciones entre los elementos. Cada óvalo del gráfico (denominado nodo) representa un par atributo-valor, como "Vest = Existing" o "Age = 1-30". Cada línea que conecta los óvalos (denominado borde) representa un tipo de correlación.

Gráfico de red de dependencias para un modelo de asociación

Exploración de la red de dependencias
  1. Haga clic en el botón Buscar y use el cuadro de diálogo Buscar nodo para escribir un elemento de interés.

    Por ejemplo, escriba "guantes" y, a continuación, maximice el gráfico en la ventana para que pueda ver fácilmente los resultados.

    El nodo que contiene el elemento está resaltado, mientras que las flechas que apuntan al nodo representan una regla que conecta los elementos.

    La dirección de la flecha indica la dirección de la regla. Por ejemplo, si alguien que compra guantes también es probable que compre un chaleco, la flecha comenzará desde el nodo "guante" y finalizará en el nodo "vest".

    Para obtener estadísticas adicionales sobre esta regla, puede hacer clic en la pestaña Reglas y buscar una regla con la descripción "Guante - Existente" - "Chaleco - Existente".

  2. Haga clic y arrastre el control deslizante a la izquierda del visor.

    El control deslizante actúa como filtro sobre la probabilidad de las reglas. Al reducir el control deslizante, solo se muestran las reglas más fuertes.

  3. Haga clic en Copiar en Excel para copiar una instantánea de la ventana actual en Excel.

    No podrá trabajar con el gráfico que copie en Excel; si necesita un gráfico de red interactivo, use la opción Visualización de modelos de minería de datos en Visio (complementos de minería de datos).

Volver a la parte superior

Más información sobre los modelos de asociación

Puede usar la característica Examinar para abrir y explorar cualquier modelo que se creó mediante el algoritmo de reglas de asociación de Microsoft. Esto incluye modelos creados con la herramienta Análisis de Cesta de Compra (Herramientas de Análisis de Tabla para Excel), en la cinta de opciones Herramientas de Análisis de Tabla o en Analysis Services.

Si crea un modelo de reglas de asociación mediante la herramienta Análisis de cesta de la compra, muchas de las opciones avanzadas se configuran automáticamente.

Si desea establecer parámetros avanzados o modificar la probabilidad mínima y la compatibilidad, use el Asistente para asociar (cliente de minería de datos para Excel) o cree su propio modelo mediante la opción de modelado Agregar modelo a estructura (complementos de minería de datos para Excel).

  • Conjuntos de elementos: Al crear el modelo, también puede controlar el número de conjuntos de elementos que se generan asignando un valor al parámetro MINIMUM_PROBABILITY. Este parámetro está disponible en el cuadro de diálogo Parámetros de algoritmo.

  • Reglas: El algoritmo de reglas de asociación de Microsoft usa valores de probabilidad para restringir el número de reglas que se generan. Puede controlar el número de reglas estableciendo los parámetros MINIMUM_PROBABILITY o MINIMUM _IMPORTANCE.

Para obtener más información sobre cómo configurar parámetros avanzados, vea Algoritmos de minería de datos (complementos de minería de datos de SQL Server).

Véase también

Examinar modelos en Excel (complementos de minería de datos de SQL Server)