Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Al abrir un modelo de agrupación en clústeres mediante Examinar, el modelo se muestra en un visor interactivo, similar al visor de agrupación en clústeres de Analysis Services. El visor le ayuda a explorar los clústeres que se crearon y a comprender las características del clúster. También puede comparar y contrastar segmentos individuales con otros segmentos o con la población.
Exploración del modelo
La ventana Examinar incluye las siguientes herramientas para ayudarle a comprender el modelo de agrupación en clústeres y a explorar los atributos de los grupos de datos subyacentes:
Para experimentar con un modelo de agrupación en clústeres, puede usar los datos de ejemplo en la pestaña Entrenamiento del libro de datos de ejemplo y crear un modelo de agrupación en clústeres mediante el Asistente para clústeres (Complementos de minería de datos para Excel) y todos los valores predeterminados.
Diagrama de clústeres
La pestaña Diagrama de clúster muestra todos los clústeres que se encuentran en un modelo de minería. Aquí puede ver cuántas agrupaciones diferentes se encontraron en el conjunto de datos y qué tan cerca o lejos están entre sí.
Exploración del diagrama del clúster
Haga clic en Clúster 1 en el diagrama.
Observe cómo cambian las líneas grises que conectan todos los clústeres para que las líneas que conducen al clúster seleccionado estén resaltadas en azul brillante.
La intensidad de la línea que conecta un clúster a otro representa la intensidad de la similitud de los clústeres. Si el sombreado es ligero o inexistente, los clústeres no son muy similares. A medida que la línea se vuelve más oscura, indica que la similitud entre los dos clústeres es más fuerte.
Haga clic y arrastre el control deslizante a la izquierda del diagrama del clúster para ajustar cuántas líneas muestra el visor.
Al arrastrar el control deslizante hacia abajo, solo se muestran los vínculos más fuertes entre los clústeres. Esto le ayuda a centrarse en grupos relacionados.
Observe el control Variable de sombreado en la esquina superior derecha de la ventana Diagrama de clústeres .
De forma predeterminada, se establece en Población. Esto significa que los clústeres más oscuros tienen mayor compatibilidad.
Deténgase sobre cualquier grupo con el cursor.
Se muestra un ToolTip que contiene la población de ese clúster.
Ahora, haga clic en la lista desplegable Variable de sombreado y elija la variable Age . Al hacerlo, aparece una lista de valores en el cuadro de texto Estado .
La columna Age usada como entrada para este modelo contiene valores numéricos continuos, pero para el propósito de la agrupación en clústeres, el algoritmo siempre discretiza los números. Aquí puede ver los contenedores o grupos creados por el algoritmo, como "Muy bajo (<=27)" y "Muy alto (>=63)".
En las listas desplegables Estado, seleccione Muy alto y vea cómo cambia el diagrama.
Al cambiar la variable de sombreado, puede ver de un vistazo qué clústeres contienen más de este grupo de edad de destino y qué clústeres contienen muy pocos clientes en este grupo de edad.
Cuanto más oscuro sea el sombreado, mayor será la proporción del atributo objetivo y la distribución de valores que se agrupan.
Busque el clúster que está sombreado más oscuro cuando la variable de sombreado está establecida en Edad >65.
Mantenga el mouse sobre el clúster.
El valor que se muestra en la información sobre herramientas ahora muestra la población de clientes de este clúster que tienen más de 65 años.
Haga clic con el botón derecho en el clúster y seleccione Cambiar nombre del clúster. Escriba un nuevo nombre descriptivo, como Más de 65. El nuevo nombre se guarda con el modelo en el servidor y se puede usar para identificar el clúster en las otras vistas de agrupación en clústeres.
Perfiles de clúster
La pestaña Perfiles de clúster permite comparar la composición de todos los clústeres de un vistazo. Este es un buen lugar para empezar cuando estás familiarizándote con el modelo. Esta vista también es útil más adelante, si ha estado explorando un clúster determinado y decide que necesita encontrar otras relacionadas.
Los perfiles de clúster también proporcionan una buena visión general de cómo los clústeres son diferentes entre sí. Por lo tanto, es posible que le resulte conveniente usar esta vista para asignar a cada clúster un nombre descriptivo.
Exploración de los perfiles de clúster
Haga clic en la celda Ocupación, en la columna Estados , para ver la lista de todos los valores de Ocupación.
Ahora mueva el cursor sobre Ocupación en los perfiles del clúster.
El Tooltip muestra la distribución de las ocupaciones en ese grupo.
Observe que, en algunos clústeres (como el que se encuentra en el gráfico), la lista de ocupación no está completa y algunas ocupacións se reemplazan por la etiqueta, Other.
Esto es por diseño, ya que puede ser difícil de decir la diferencia entre muchas barras pequeñas en un histograma. De forma predeterminada, solo se conservan las barras de mayor importancia y las barras restantes se agrupan en un cubo gris Other .
Para cambiar el número de barras visibles en cualquier histograma, use la opción Barras de histograma.
Tenga en cuenta que la columna Age es diferente de las demás. Haga clic en el diamante del gráfico usado para representar Edad.
La columna Age originalmente contenía solo números continuos. El algoritmo de agrupación en clústeres requiere valores discretos, por lo que agrupó los valores numéricos de la columna Age en un número limitado de grupos de edad, en función de la distribución de valores.
Haga clic en uno de los gráficos de diamantes de un perfil de clúster.
Estos gráficos de diamantes solo se muestran cuando los datos de origen usan valores numéricos continuos. Los gráficos de diamantes proporcionan algunas estadísticas descriptivas útiles, incluida la media y la desviación estándar para ese valor en cada clúster:
La línea del gráfico de diamantes representa el intervalo de valores para el atributo . Los valores también se muestran en la columna Estados a la izquierda del gráfico Perfiles .
El centro del diamante se coloca en la media del nodo.
El ancho del diamante representa la varianza del atributo en ese nodo. Por lo tanto, un diamante más delgado indica que el nodo puede crear una predicción más precisa.
Para hacer más espacio en el gráfico, haga clic con el botón derecho en un clúster que no necesite ver inmediatamente y seleccione Ocultar columna. Esto no lo elimina del modelo, simplemente contrae la columna temporalmente.
Para ver los clústeres que ha ocultado, puede hacer clic y arrastrar el borde de la columna o seleccionar el nombre del clúster de la lista , Más clústeres.
Desplácese hacia abajo en la lista de atributos hasta que encuentre Bike Buyer y, a continuación, busque el clúster que tiene el porcentaje más alto de valores Sí.
Haga clic con el botón derecho en el encabezado de columna del clúster al que desea cambiar el nombre, seleccione Cambiar nombre del clúster y escriba Bike Buyers.
El nuevo nombre del clúster se conserva en todas las vistas y, en el servidor, hasta que se vuelve a procesar el modelo.
el
Sugerencias
Haga clic en un encabezado de columna para ordenar los atributos en orden de importancia para ese clúster.
Arrastre las columnas para reordenarlas en el visor.
Haga clic en cualquier celda del gráfico de perfiles para ver estadísticas detalladas en la Mining Legend.
Para generar la información subyacente en una nueva hoja de cálculo en Excel, haga clic con el botón derecho en cualquier celda y seleccione Columnas del modelo de detalles profundos.
Haga clic con el botón derecho en el encabezado de la columna del clúster y seleccione Profundizar para estructurar los datos para obtener información detallada sobre los miembros del clúster que no se incluyeron en el modelo.
Por ejemplo, si está realizando un perfilamiento de clientes, puede dejar la información de contacto en los datos subyacentes (la estructura de minería), pero no incluirla en el modelo, ya que no es útil para el análisis. Sin embargo, después de que los clientes se hayan asignado a clústeres, puede ver los datos detallados mediante la navegación detallada.
Características del clúster
La vista Características del clúster le permite explorar realmente un único clúster para buscar qué atributos caracterizan más fuertemente este grupo de datos.
Exploración de las características del clúster
Seleccione el clúster Más de 65 de la lista Clúster.
Después de seleccionar un clúster, puede ver en detalle las características que componen ese clúster específico.
Los atributos que contiene el clúster se enumeran en las columnas Variables y el estado del atributo enumerado aparece en la columna Valores .
Los estados de atributo se muestran en orden de importancia, acompañados de su probabilidad en este clúster, representados como una barra coloreado en la columna Probabilidad .
Haga clic en la columna Variables para ordenar por atributo.
Al cambiar la variable de ordenación, puede ver más fácilmente cómo se distribuyen los valores de las variables como ingresos o propiedad del automóvil en el grupo.
Haga clic en Copiar en Excel.
Se agrega una nueva hoja de cálculo al libro que contiene las características del clúster seleccionado.
Ahora elija un clúster diferente de la lista , Bike Buyers.
Haga clic en Copiar en Excel.
Tenga en cuenta que el nuevo gráfico de características del clúster se agrega en su propia hoja de cálculo. Puede moverla a la misma hoja de cálculo que el otro perfil para facilitar su comparación, lo que hará en el paso siguiente.
Sugerencias
Tenga en cuenta que la característica principal del cliente en el clúster de más de 65 es que no compran su producto. Si quiere saber por qué esto es así, puede examinar clústeres y comparar grupos, o puede crear un modelo relacionado mediante un algoritmo que sea bueno para explorar las causas y los resultados, como un modelo de árbol de decisión o un modelo Bayes naïve.
Si desea obtener una lista completa de atributos y probabilidades para este clúster (o todos los clústeres), puede crear una consulta. Para obtener ejemplos de consultas sobre modelos de agrupación en clústeres, consulte Ejemplos de consultas de modelos de agrupación en clústeres.
Discriminación de clústeres
Use la pestaña Discriminación del clúster para comparar atributos entre dos clústeres, o entre un clúster y todos los demás casos del conjunto de datos.
Para resaltar las características de este visor, la compararemos con las tablas en paralelo de Excel que creó en función de la vista Características del clúster .
Exploración de la discriminación de clústeres
Use las listas Clúster 1 y Clúster 2 para seleccionar los clústeres que se van a comparar.
En Clúster 1, seleccione Más de 65.
Para el Clúster 2, seleccione Compradores de bicicletas.
La comparación debe tener un aspecto similar al gráfico siguiente.
Tenga en cuenta que, tras bambalinas, el visor Discriminación de Clúster envía consultas complejas al servidor de minería de datos para extraer los atributos más importantes para distinguir entre los dos grupos, facilitando la comparación de dos conjuntos de clientes.
Haga clic en cualquiera de las columnas de Favoritos....
La barra situada a la derecha de la lista de atributos y valores muestra qué características o valores son más importantes como una característica del clúster seleccionado.
Ahora compare las listas en Excel.
Dado que las estadísticas subyacentes que se usaron para compilar la imagen en el visor se guardan en Excel como tablas, puede filtrar y ordenar y ver los valores de probabilidad reales.
Además de usar Excel, se recomienda probar el visor de clústeres para Visio, que también permite no solo ver puntos de datos, sino también modificar y mejorar el grafo. Para obtener más información, vea Cluster Diagram Walkthrough (Data Mining Add-ins) (Tutorial de diagrama de clústeres [Complementos de minería de datos]).
Sugerencias
Después de obtener información sobre grupos de clientes, pruebe a usar las herramientas Escenario deWhat-If o escenario de búsqueda de objetivos (Herramientas de análisis de tablas de Excel), para explorar los factores del modelo que podrían cambiarse para influir en el resultado.
Véase también
Examinar modelos en Excel (complementos de minería de datos de SQL Server)
Asistente para clústeres (complementos de minería de datos para Excel)