Compartir a través de


Crear un informe de validación cruzada

Este tema le guía a través de la creación de un informe de validación cruzada mediante la pestaña Gráfico de precisión del Diseñador de minería de datos. Para obtener información general sobre el aspecto de un informe de validación cruzada y las medidas estadísticas que incluye, consulte Validación cruzada (Analysis Services - Minería de datos).

Un informe de validación cruzada es fundamentalmente diferente de un gráfico de precisión, como un gráfico de elevación o una matriz de clasificación.

  • La validación cruzada evalúa la distribución general de los datos que se usan en un modelo o estructura; por lo tanto, no se especifica un conjunto de datos de prueba. La validación cruzada siempre usa solo los datos originales que se usaron para entrenar el modelo o la estructura de minería.

  • La validación cruzada solo se puede realizar con respecto a un único resultado predecible. Si la estructura admite modelos que tienen atributos de predicción diferentes, debe crear informes independientes para cada salida predecible.

  • Solo los modelos relacionados con la estructura seleccionada actualmente están disponibles para la validación cruzada.

  • Si la estructura que está seleccionada actualmente admite una combinación de modelos de agrupación en clústeres y no agrupados, al hacer clic en Obtener resultados, el procedimiento almacenado de validación cruzada cargará automáticamente los modelos que tienen la misma columna prevista y omitirá los modelos de agrupación en clústeres que no comparten el mismo atributo de predicción.

  • Puede crear un informe de validación cruzada en un modelo de agrupamiento que no tenga un atributo predecible solo si la estructura de minería no admite ningún otro atributo predecible.

Selecciona una estructura de minería

  1. Abra el Diseñador de minería de datos en SQL Server Data Tools (SSDT).

  2. En el Explorador de soluciones, abra la base de datos que contiene la estructura o el modelo para los que desea crear un informe.

  3. Haga doble clic en la estructura de minería de datos para abrir la estructura y sus modelos relacionados en el Diseñador de minería de datos.

  4. Haga clic en la pestaña Gráfico de Exactitud de Minería.

  5. Haga clic en la pestaña Validación cruzada .

Establecimiento de opciones de validación cruzada

  1. En la pestaña Validación cruzada, en Número de pliegues, haga clic en la flecha hacia abajo para seleccionar un número entre 1 y 10. El valor predeterminado es 10.

    El número de pliegues representa la cantidad de particiones que se crearán en el conjunto de datos original. Si establece Fold Count en 1, el conjunto de entrenamiento se usará sin crear particiones.

  2. En Atributo de destino, haga clic en la flecha abajo y seleccione una columna de la lista. Si el modelo es un modelo de agrupación en clústeres, seleccione #Cluster para indicar que el modelo no tiene un atributo de predicción. Tenga en cuenta que el valor, #Cluster, solo está disponible cuando la estructura de minería de datos no admite otros tipos de atributos predecibles.

    Solo puede seleccionar un atributo de predicción por informe. De forma predeterminada, todos los modelos relacionados que tienen el mismo atributo de predicción se incluyen en el informe.

  3. En Casos máximos, escriba un número lo suficientemente grande como para proporcionar una muestra representativa de datos cuando los datos se dividen entre el número especificado de subconjuntos. Si el número es mayor que el recuento de casos en el conjunto de entrenamiento del modelo, se usarán todos los casos.

    Si el conjunto de datos de entrenamiento es muy grande, establecer el valor de Casos máximos limita el número total de casos procesados y permite que el informe finalice más rápido. Sin embargo, no debe establecer Casos Máximos demasiado bajos o puede haber datos insuficientes para la validación cruzada.

  4. Opcionalmente, en Estado de destino, escriba el valor del atributo de predicción que desea modelar. Por ejemplo, si la columna [Bike Buyer] tiene dos valores posibles, 1 (Sí) y 2 (No), puede escribir el valor 1 para evaluar la precisión del modelo solo para el resultado deseado.

    Nota:

    Si no especifica un valor, la opción Umbral de destino no está disponible y el modelo se evalúa para todos los valores posibles del atributo de predicción.

  5. Opcionalmente, en Umbral de destino, escriba un número decimal entre 0 y 1 para especificar la probabilidad mínima de que una predicción debe tener que contarse como precisa.

    Para obtener sugerencias adicionales sobre cómo establecer umbrales de probabilidad, consulte Medidas en el informe de validación cruzada.

  6. Haga clic en Obtener resultados.

  1. Haga clic con el botón derecho en el informe completado en la pestaña Validación cruzada .

  2. En el menú contextual, seleccione Imprimir o Imprimir vista previa para revisar primero el informe.

Crear una copia del informe en Microsoft Excel

  1. Haga clic con el botón derecho en el informe completado en la pestaña Validación cruzada .

  2. En el menú contextual, seleccione Seleccionar todo.

  3. Haga clic con el botón derecho en el texto seleccionado y seleccione Copiar.

  4. Pegue la selección en un libro de Excel abierto. Si usa la opción Pegar , el informe se pega en Excel como HTML, que conserva el formato de fila y columna. Si pega el informe mediante las opciones Pegar especiales para texto o texto Unicode, el informe se pega en formato delimitado por fila.

Véase también

Medidas en el informe de validación cruzada