Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
El algoritmo de agrupación en clústeres de Microsoft agrupa los casos en clústeres que contienen características similares. Estas agrupaciones son útiles para explorar datos, identificar anomalías en los datos y crear predicciones.
El Visor de clústeres de Microsoft proporciona las siguientes pestañas para su uso en la exploración de modelos de minería de datos de agrupación en clústeres:
Pestaña Diagrama de clúster
La pestaña Diagrama de clúster muestra todos los clústeres que se encuentran en un modelo de minería de datos. Las líneas entre los clústeres representan "proximidad" y se sombrean en función de la similitud de los clústeres. El color real de cada clúster representa la frecuencia de la variable y el estado del clúster.
Para explorar el modelo en la pestaña Diagrama de clústeres
Use la lista Modelo de minería en la parte superior de la pestaña Visor de modelos de minería para cambiar al modelo
TM_Clustering.En la lista Visor , seleccione Visor de clústeres de Microsoft.
En el cuadro Variable de sombreado , seleccione Bike Buyer.
La variable predeterminada es Population, pero puede cambiarla a cualquier atributo del modelo para detectar qué clústeres contienen miembros que tienen los atributos que desea.
Seleccione 1 en el cuadro Estado para explorar los casos en los que se compró una bicicleta.
La leyenda Densidad describe la densidad del par de estado del atributo seleccionado en la Variable de sombreado y el estado. En este ejemplo se indica que el clúster con el sombreado más oscuro tiene el porcentaje más alto de compradores de bicicletas.
Coloca el ratón sobre el clúster con el sombreado más oscuro.
Una información sobre herramientas muestra el porcentaje de casos que tienen el atributo ,
Bike Buyer = 1.Seleccione el clúster que tiene la mayor densidad, haga clic con el botón derecho en el clúster, seleccione Cambiar nombre del clúster y escriba Bike Buyers High para la identificación posterior. Haz clic en Aceptar.
Busque el clúster que tiene el sombreado más ligero (y la densidad más baja). Haga clic con el botón derecho en el clúster, seleccione Cambiar nombre del clúster y escriba Bike Buyers Low (Compradores de bicicletas bajos). Haz clic en Aceptar.
Haga clic en el clúster Bike Buyers High y arrástrelo a un área del panel que le proporcionará una vista clara de sus conexiones a los demás clústeres.
Al seleccionar un clúster, se resaltan las líneas que conectan este clúster a otros clústeres para que pueda ver fácilmente todas las relaciones de este clúster. Cuando el clúster no está seleccionado, puede determinarse por la oscuridad de las líneas la fuerza de las relaciones entre todos los clústeres del diagrama. Si el sombreado es ligero o inexistente, los clústeres no son muy similares.
Use el control deslizante a la izquierda de la red para filtrar los vínculos más débiles y buscar los clústeres con las relaciones más cercanas. Es posible que el departamento de marketing Adventure Works Cycles quiera combinar clústeres similares al determinar el mejor método para entregar el correo dirigido.
Pestaña Perfiles de clúster
La pestaña Perfiles de clúster proporciona una vista general del TM_Clustering modelo. La pestaña Perfiles de clúster contiene una columna para cada clúster del modelo. En la primera columna se enumeran los atributos asociados a al menos un clúster. El resto del visor contiene la distribución de los estados de un atributo para cada clúster. La distribución de una variable discreta se muestra como una barra de color con el número máximo de barras mostradas en la lista de barras de histograma . Los atributos continuos se muestran con un gráfico de diamantes, que representa la desviación media y estándar en cada clúster.
Para explorar el modelo en la pestaña Perfiles de clúster
Establezca Barras de histograma en 5.
En nuestro modelo, 5 es el número máximo de estados para cualquier variable.
Si Mining Legend bloquea la presentación de los perfiles de atributo, retírela.
Seleccione la columna Bike Buyers High y arrástrela a la derecha de la columna Población .
Seleccione la columna Bike Buyers Low (Compradores de bicicletas bajas ) y arrástrela a la derecha de la columna Bike Buyers High (Alto comprador de bicicletas ).
Haga clic en la columna Bike Buyers High (Alto de bike buyers ).
La columna Variables se ordena en orden de importancia para ese clúster. Desplácese por la columna y revise las características del clúster Bike Buyer High. Por ejemplo, es más probable que tengan un viaje corto.
Haga doble clic en la celda Edad en la columna Bike Buyers High.
La leyenda de minería de datos muestra una vista más detallada y puede ver el intervalo de edad de estos clientes, así como la edad media.
Haga clic con el botón derecho en la columna Bike Buyers Low y seleccione Ocultar columna.
Pestaña Características del clúster
Con la pestaña Características del clúster , puede examinar con más detalle las características que componen un clúster. En lugar de comparar las características de todos los clústeres (como en la pestaña Perfiles de clúster), puede explorar un clúster a la vez. Por ejemplo, si selecciona Bike Buyers High en la lista Clúster , puede ver las características de los clientes de este clúster. Aunque la pantalla es diferente del visor de perfiles de clúster, los resultados son los mismos.
Nota:
A menos que establezca un valor inicial para holdoutseed, los resultados variarán cada vez que procese el modelo. Para obtener más información, consulte Elemento HoldoutSeed.
Pestaña Discriminación de clúster
Con la pestaña Discriminación de clúster, puede explorar las características que distinguen un clúster de otro. Después de seleccionar dos clústeres, uno de la lista Clúster 1 y otro de la lista Clúster 2 , el visor calcula las diferencias entre los clústeres y muestra una lista de los atributos que distinguen los clústeres más.
Para explorar el modelo en la pestaña Discriminación de clúster
En el cuadro Clúster 1, seleccione Altos compradores de bicicletas.
En el cuadro Clúster 2, seleccione Compradores de bicicletas poco frecuentes.
Haga clic en Variables para ordenar alfabéticamente.
Algunas de las diferencias más importantes entre los clientes de los clústeres Bike Buyers Low y Bike Buyers High incluyen edad, propiedad del automóvil, número de niños y regiones.
Tareas relacionadas
Consulte los temas siguientes para explorar los otros modelos de minería de datos.
Exploración del modelo de árbol de decisión (Tutorial básico de minería de datos)
Exploración del modelo Bayes naive (Tutorial básico de minería de datos)
Siguiente tarea de la lección
Exploración del modelo Bayes naive (Tutorial básico de minería de datos)
Tarea anterior en la lección
Exploración del modelo de árbol de decisión (Tutorial básico de minería de datos)
Véase también
Examinar un modelo mediante el Visor de clústeres de Microsoft
Pestaña de Discriminación de Clúster (Visor de modelos de minería de datos)
Pestaña Perfiles de clúster (Visor de modelos de minería de datos)
Pestaña de características de agrupamiento (Visor de modelo de minería de datos)
Pestaña Diagrama de Clúster (Visor de Modelos de Minería de Datos)