Compartir a través de


Asistente para clasificar (complementos de minería de datos para Excel)

Asistente para clasificar en la cinta de Minería de Datos

El Asistente para clasificar le ayuda a crear un modelo de clasificación basado en datos existentes en una tabla de Excel, un intervalo de Excel o un origen de datos externo.

Un modelo de clasificación extrae patrones en los datos que indican similitudes y le ayuda a realizar predicciones basadas en agrupaciones de valores. Por ejemplo, un modelo de clasificación se puede usar para predecir el riesgo en función de los patrones de ingresos o gastos.

Usar el Asistente para clasificar

  1. En la cinta de opciones Minería de datos, haga clic en Clasificar y luego haga clic en Siguiente.

  2. En la página Seleccionar datos de origen, elija los datos que se van a analizar.

    Este asistente admite varios tipos de datos: tablas de Excel, intervalos de Excel y orígenes de datos externos. Con los datos externos, puede agregarlos a Excel o elegir un conjunto de tablas o vistas en un origen de datos de Analysis Services. También puede agregar tablas y cambiar columnas para crear orígenes de datos ad hoc.

  3. En la página Clasificación , elija la columna que desea clasificar.

    Revise las columnas de la lista, las columnas de entrada, y anule la selección de las columnas que contengan valores únicos y por lo tanto no sean útiles para crear patrones, como números de identificación, nombres de clientes, etc. También debe quitar columnas que básicamente duplican la columna clasificable.

    Por ejemplo, si va a clasificar la predicción de la categoría de un producto, debe excluir el campo subcategoría si hay una regla de negocio conocida o, de lo contrario, la intensidad de esa regla podría impedir que detecte otras correlaciones.

  4. Opcionalmente, haga clic en Parámetros para cambiar los parámetros del algoritmo y personalizar el comportamiento del modelo de agrupación en clústeres.

  5. En la página Dividir datos en conjuntos de entrenamiento y pruebas , especifique la cantidad de datos que se deben mantener en espera para las pruebas. El resto siempre se usa para entrenar el modelo.

    La configuración predeterminada es 30% datos de prueba y 70% datos de entrenamiento.

  6. En la página Finalizar , proporcione un nombre descriptivo para el conjunto de datos y el modelo y establezca las siguientes opciones que controlan cómo funciona con el modelo terminado:

    • Examinar modelo. Cuando se selecciona esta opción, tan pronto como el asistente termine de procesar el modelo, se abrirá una ventana Examinar para ayudarle a explorar los resultados. El contenido del visor depende del tipo de modelo que ha creado. Para obtener más información, consulte Examinar un modelo de árboles de decisión y examinar un modelo de red neuronal.

    • Habilite la obtención de detalles. Seleccione esta opción para ver los datos subyacentes del modelo terminado. Esta opción solo está disponible si crea un modelo de árbol de decisión.

    • Usar modelo temporal. Si selecciona esta opción, el modelo no se guardará en el servidor. Los modelos temporales se eliminan al cerrar Excel.

Más información sobre los modelos de clasificación

En el cuadro de diálogo Parámetros de algoritmo , también puede elegir el método de clasificación entre estos algoritmos proporcionados en Analysis Services:

  • Árbol de decisión de Microsoft

  • Regresión logística de Microsoft

  • Microsoft Naïve Bayes

  • Red neuronal de Microsoft

Aunque los algoritmos pueden producir resultados similares, analizan los datos de forma diferente, por lo que se recomienda probar varios algoritmos y comparar los resultados. El método predeterminado es Árboles de decisión de Microsoft.

En la lista Parámetros, puede cambiar las opciones avanzadas , que dependen del tipo de algoritmo que elija. Los parámetros de cada algoritmo se describen en detalle en la documentación en línea de SQL Server.

Referencia técnica del algoritmo de árboles de decisión de Microsoft

Referencia técnica del algoritmo de regresión logística de Microsoft

Referencia técnica del algoritmo Bayes naive de Microsoft

Referencia técnica del algoritmo de red neuronal de Microsoft

Requisitos

Para usar el Asistente para clasificar , debe estar conectado a una base de datos de Analysis Services. Para obtener información sobre cómo crear una conexión, consulte Conexión a datos de origen (cliente de minería de datos para Excel).

Véase también

Creación de un modelo de minería de datos