Compartir a través de


Exploración del modelo de árbol de decisión (Tutorial básico de minería de datos)

El algoritmo de árboles de decisión de Microsoft predice qué columnas influyen en la decisión de comprar una bicicleta en función de las columnas restantes del conjunto de entrenamiento.

Pestaña Árbol de decisión

En la pestaña Árbol de decisión, puede ver los árboles de decisión de cada atributo de predicción del conjunto de datos.

En este caso, el modelo predice solo una columna, Bike Buyer, por lo que solo hay un árbol para ver. Si hubiera más árboles, podría usar el cuadro Árbol para elegir otro árbol.

Al ver el TM_Decision_Tree modelo en el visor de árbol de decisión, puede ver los atributos más importantes en el lado izquierdo del gráfico. "Más importante" significa que estos atributos tienen la mayor influencia en el resultado. Los atributos más abajo del árbol (a la derecha del gráfico) tienen menos efecto.

En este ejemplo, la edad es el factor más importante para predecir la compra de bicicletas. El modelo agrupa los clientes por edad y, a continuación, muestra el siguiente atributo más importante para cada grupo de edad. Por ejemplo, en el grupo de clientes de entre 34 y 40 años, el número de coches propiedad es el predictor más fuerte después de la edad.

Para explorar el modelo en la pestaña Árbol de decisión

  1. Seleccione la pestaña Visor de modelosde minería de datos en el Diseñador de minería de datos.

    De forma predeterminada, el diseñador se abre al primer modelo que se agregó a la estructura , en este caso, TM_Decision_Tree.

  2. Use los botones de lupa para ajustar el tamaño de la pantalla de árbol.

    De forma predeterminada, el Visor de árboles de Microsoft muestra solo los tres primeros niveles del árbol. Si el árbol contiene menos de tres niveles, el visor solo muestra los niveles existentes. Puede ver más niveles mediante el control deslizante Mostrar nivel o la lista Expansión predeterminada .

  3. Desplaza Nivel de presentación hasta la cuarta barra.

  4. Cambie el valor background a 1.

    Al cambiar la configuración Fondo , puede ver rápidamente el número de casos en cada nodo que tiene el valor de destino de 1 para [Bike Buyer]. Recuerde que en este escenario concreto, cada caso representa a un cliente. El valor 1 indica que el cliente compró previamente una bicicleta; el valor 0 indica que el cliente no ha comprado una bicicleta. Cuanto más oscuro sea el sombreado del nodo, mayor será el porcentaje de casos del nodo que tienen el valor objetivo.

  5. Coloque el cursor sobre el nodo con la etiqueta Todo. Una información sobre herramientas mostrará la siguiente información:

    • Número total de casos

    • Número de casos de no compradores de bicicletas

    • Número de casos de compradores de bicicletas

    • Número de casos con valores que faltan para [Bike Buyer]

    Como alternativa, coloque el cursor sobre cualquier nodo del árbol para ver la condición necesaria para llegar a ese nodo desde el nodo que viene antes. También puede ver esta misma información en la Mining Legend.

  6. Haga clic en el nodo Edad >=34 y < 41. El histograma se muestra como una barra horizontal delgada en el nodo y representa la distribución de los clientes de este intervalo de edad que anteriormente compraron una bicicleta (rosa) y no compraron una bicicleta (azul). El Visualizador nos muestra que los clientes de entre 34 y 40 años que tienen uno o ningún coche probablemente compren una bicicleta. Tomando un paso más, encontramos que la probabilidad de comprar una bicicleta aumenta si el cliente es realmente de 38 a 40 años.

Dado que activó la función de excavación profunda al crear la estructura y el modelo, puede recuperar información detallada de los casos del modelo y de la estructura de minería, incluidas las columnas que no se incluyeron en el modelo de minería (por ejemplo, emailAddress, FirstName).

Para obtener más información, consulte Consultas de drillthrough (Minería de datos).

Para acceder a los datos de casos

  1. Haga clic con el botón derecho en un nodo y seleccione Drill Through y, después, Solo columnas del modelo.

    Los detalles de cada caso de entrenamiento se muestran en formato de hoja de cálculo. Estos detalles proceden de la vista vTargetMail que seleccionó como tabla de casos al compilar la estructura minera de datos.

  2. Haga clic con el botón derecho en un nodo y seleccione Profundizar luego Columnas del Modelo y de la Estructura.

    La misma hoja de cálculo se muestra con las columnas de estructura anexadas al final.

Pestaña Red de dependencias

La pestaña Red de dependencias muestra las relaciones entre los atributos que contribuyen a la capacidad predictiva del modelo de minería de datos. El visor de Dependency Network refuerza nuestros hallazgos de que la edad y la región son factores importantes en la predicción de la compra de bicicletas.

Para explorar el modelo en la pestaña Red de Dependencias
  1. Haga clic en el Bike Buyer nodo para identificar sus dependencias.

    El nodo central de la red de dependencias, Bike Buyer, representa el atributo de predicción en el modelo de minería de datos. El gráfico resalta los nodos conectados que tienen un efecto en el atributo de predicción.

  2. Ajuste el control deslizante Todos los vínculos para identificar el atributo más influyente.

    Al arrastrar el control deslizante, los atributos que tienen un efecto débil en la columna [Bike Buyer] se eliminan del gráfico. Al ajustar el control deslizante, puede descubrir que La edad y la región son los factores más importantes para predecir si alguien es un comprador de bicicletas.

Consulte estos temas para explorar los datos mediante los otros tipos de modelos.

Siguiente tarea de la lección

Exploración del modelo de agrupación en clústeres (Tutorial básico de minería de datos)

Véase también

Tareas y procedimientos del Visor de Modelos de Minería
Pestaña Árbol de decisión (Visor de modelos de minería de datos)
Pestaña Red de dependencias (Visor de modelos de minería de datos)
Examinar un modelo mediante el Visor de árboles de Microsoft