Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Al abrir un modelo de clasificación mediante Examinar, el modelo se muestra en un visor de árbol de decisión interactivo, similar al visor de árboles de decisión de Microsoft en Analysis Services. El visor muestra los resultados de la clasificación como un gráfico diseñado para resaltar los criterios que diferencian un grupo de datos de otro. También puede profundizar en subconjuntos individuales del árbol y recuperar los datos subyacentes.
Exploración del modelo
Los modelos basados en el algoritmo árboles de decisión tienen mucha información interesante para explorar. La ventana Examinar incluye las siguientes pestañas y paneles para ayudarle a aprender los patrones y predecir resultados mediante el gráfico:
Para experimentar con un modelo de árboles de decisión, puede usar los datos de ejemplo en la pestaña Datos de entrenamiento (o Datos de origen) del libro de datos de ejemplo y crear un modelo de árbol de decisión mediante Bike Buyer como atributo de predicción.
Árbol de decisión
Esta vista está pensada para ayudarle a comprender y explorar los factores que conducen a un resultado.
El gráfico del árbol de decisión se puede leer de izquierda a derecha de la siguiente manera:
Los rectángulos, a los que se hace referencia como nodos, contienen subconjuntos de los datos. La etiqueta del nodo indica las características de definición de ese subconjunto.
El nodo situado más a la izquierda, con la etiqueta All, representa el conjunto de datos completo. Todos los nodos subsiguientes representan subconjuntos de los datos.
Un árbol de decisión contiene muchas divisiones o lugares en los que los datos se dividen en varios conjuntos en función de los atributos.
Por ejemplo, la primera división del modelo de ejemplo divide el conjunto de datos en tres grupos por edad.
La división inmediatamente después del nodo Todo es más importante porque muestra la condición principal que divide este conjunto de datos.
Las divisiones adicionales se producen a la derecha. Por lo tanto, mediante el análisis de diferentes segmentos del árbol, puede aprender qué atributos tuvieron la mayor influencia en el comportamiento de compra.
Con esta información, puede centrar una campaña de marketing en los clientes que simplemente necesiten aliento para realizar una compra.
Exploración del árbol de decisión
Haga clic en el nodo Todo y consulte la Leyenda de Minería.
Muestra el recuento exacto de casos en el conjunto de datos de entrenamiento, así como un desglose de los resultados.
Puede ver la misma información en un mensaje emergente si detiene el ratón sobre un nodo.
Haga clic en los signos más y menos situados junto a cada nodo para expandir o contraer el árbol.
También puede usar el control deslizante Mostrar nivel para expandir o reducir el árbol.
Observe que algunos nodos son más oscuros que otros?
De forma predeterminada, Population se usa como variable de sombreado, lo que significa que la intensidad del color muestra qué nodos tienen más compatibilidad.
Por lo tanto, el nodo más a la izquierda es más oscuro, ya que contiene todo el conjunto de datos.
Cambie el valor de Fondo de Todos los casos a Sí.
Ahora la intensidad del color indica cuántos clientes de cada nodo compraron una bicicleta, que es el comportamiento que le interesa.
Observe las barras de color dentro de cada nodo. Este es un histograma que muestra la distribución de resultados dentro de este subconjunto de datos. Por ejemplo, en el árbol de decisión de ejemplo de Comprador de Bicicletas, la barra de colores muestra la proporción de clientes que compraron bicicletas (valores Sí) frente a los que no (valores No). Para obtener los valores exactos, puede hacer clic en el nodo y ver la Mining Legend.
Al seguir el gráfico, puede ver cómo cada subconjunto de datos se descompone aún más en grupos más pequeños y qué atributos son más útiles para predecir un resultado.
Simplemente examinando la intensidad del sombreado, puede centrarse en un par de grupos de interés y obtener datos más detallados sobre ellos para la comparación. Por ejemplo, estos grupos tienen una probabilidad bastante alta de comprar bicicletas:
Edad >= 32 y < 53 e Ingresos >anuales = 26000 y Niños = 0
Total de casos: 1150
Probabilidad del comprador de bicicletas: 18%
Edad >= 32 y < 53 y Ingresos anuales >= 26000 y Hijos no = 0 y Estado civil = 'Soltero'
Total de casos: 402
Probabilidad del comprador de bicicletas: 16%
Cambie el valor de Fondo de Sí a No y vea cómo cambia el gráfico.
Sugerencias
Si los datos se pueden dividir en varias series, se crea un modelo diferente para cada conjunto de datos que desea modelar.
En el modelo de datos de ejemplo, solo hay un resultado predecible : Bike Buyer, pero supongamos que tenía información sobre si el cliente compró un plan de servicio y quería predecirlo también. En ese caso, tendría esos datos en una columna independiente e incluir dos atributos de predicción en el modelo.
Haga clic en la opción Histograma , en la esquina superior izquierda del panel Árbol de decisión, para cambiar el número máximo de estados que pueden aparecer en los histogramas del árbol. Esto resulta útil si el atributo de predicción tiene muchos estados. Los estados aparecen en un histograma en orden de popularidad de izquierda a derecha.
También puede usar las opciones de la pestaña Árbol de decisión para afectar a cómo se muestra el árbol, al acercar o alejar el gráfico para ajustarlo a la ventana.
Use Expansión predeterminada para establecer el número predeterminado de niveles que se muestran para todos los árboles del modelo.
Seleccione Mostrar nombre largo para mostrar el nombre completo del atributo, incluido el origen de datos. Los nombres cortos y los nombres largos son los mismos a menos que los casos se obtengan de un origen de datos diferente al de los atributos de cada caso.
Red de dependencias
La vista Red de dependencias muestra las conexiones entre los atributos de entrada y los atributos de predicción del modelo.
Haga clic y arrastre el control deslizante a la izquierda del visor.
En la posición superior, se muestran todas las conexiones. Al arrastrar el control deslizante hacia abajo, solo se muestran los vínculos más fuertes en el visualizador.
Ahora haga clic en el nodo Bike Buyer.
Al seleccionar un nodo, el visor resalta las dependencias específicas del nodo. En este caso, el visor resalta cada nodo que ayuda a predecir el resultado.
Si el visor contiene muchos nodos, puede buscar nodos específicos mediante el botón Buscar nodo . Al hacer clic en Buscar nodo , se abre el cuadro de diálogo Buscar nodo , en el que puede usar un filtro para buscar y seleccionar nodos específicos.
La leyenda de la parte inferior del visor vincula los códigos de color al tipo de dependencia del gráfico. Por ejemplo, al seleccionar un nodo de predicción, el nodo de predicción está sombreado de color turquesa y los nodos que predicen el nodo seleccionado están sombreados en naranja.
Profundizar en los datos subyacentes
Varios tipos de modelos admiten la capacidad de profundizar desde el modelo hasta los datos de casos subyacentes. Esto puede ser muy útil si desea ponerse en contacto con los clientes de un segmento determinado o extraer los datos para realizar un análisis posterior.
Obtención de datos de casos
Haga clic con el botón derecho en el nodo del árbol que contiene los datos deseados y seleccione una de estas opciones:
Modelo de Perforación. Esta opción obtiene los casos que pertenecen al nodo seleccionado y los guarda en una tabla de Excel. Solo se recuperan las columnas de datos que se usaron realmente en la creación del modelo.
Perforar las columnas de estructura. Esta opción obtiene los casos que pertenecen al nodo seleccionado y los guarda en una tabla de Excel. Obtiene toda la información que estaba disponible en los datos subyacentes al construirlo, incluso si una columna no fue utilizada en el modelo. Por ejemplo, podría haber excluido la dirección del cliente y el código postal porque esos campos no son útiles con el análisis, pero los dejó en la estructura.
Vuelva a Excel para ver los datos. El visor de navegación ejecuta una consulta, guarda los datos en una tabla de una nueva hoja de cálculo y etiqueta los resultados.
.
Véase también
Examinar modelos en Excel (complementos de minería de datos de SQL Server)