Compartir a través de


Elegir y mapear los datos de prueba de modelos

Para crear un gráfico de precisión en Analysis Services, debe elegir los datos que se usarán para probar el modelo y asignar los datos al modelo.

De forma predeterminada, Analysis Services usará los datos de prueba del modelo de minería, siempre que haya creado un conjunto de datos de validación al construir la estructura de minería. La creación de un conjunto de prueba de retención es la forma más sencilla de probar modelos basados en la misma estructura de minería, ya que los nombres de columna y los tipos de datos siempre coincidirán con el modelo, y puede estar bastante seguro de que la distribución de los datos es similar. Además, el diseñador creará automáticamente las relaciones entre las columnas de entrada y modelo.

Como alternativa, puede especificar un origen externo de datos. Para los datos externos, hay algunos requisitos adicionales:

  • El conjunto de datos externo debe definirse como una vista del origen de datos en una instancia de Analysis Services.

  • El conjunto de datos externos debe contener al menos una columna que se pueda asignar a la columna predecible del modelo de minería de datos. Puede optar por omitir algunas columnas.

  • No se pueden agregar nuevas columnas ni asignar columnas en una vista diferente del origen de datos. La vista del origen de datos que seleccione debe contener todas las columnas que necesita para la consulta de predicción.

  • Si los nombres de columna externos coinciden exactamente con los del modelo, el diseñador los asignará automáticamente. Si las asignaciones son incorrectas, puede cambiarlas o eliminarlas y crear nuevas asignaciones para las columnas existentes.

  • Si usa un origen de datos externo, puede aplicar filtros para restringir los datos de prueba a un subconjunto pertinente de casos.

  • Incluso cuando se usa el conjunto de prueba reservado, debe tener en cuenta que los filtros pueden causar diferencias entre los datos de prueba asociados a una estructura de minería de datos y los casos de prueba del modelo de minería de datos.

En este tema se describe cómo elegir y asignar los datos de prueba:

Seleccione las tablas de entrada para comprobar la precisión de un modelo de minería

Asignar columnas de modelo a las columnas de los datos de prueba

Cambiar la forma en que las columnas de los datos de prueba se asignan al modelo

Para seleccionar tablas de entrada para probar la precisión de un modelo de minería de datos

  1. En el Diseñador de minería de datos de SQL Server Data Tools (SSDT), haga doble clic en la estructura de minería de datos que contiene los modelos que desea trazar.

  2. Seleccione la pestaña Gráfico de precisión de minería.

  3. En la pestaña Selección de entrada de la vista Gráfico de precisión de minería de datos, seleccione una de las siguientes opciones:

    Utilice casos de prueba del modelo de minería

    Casos de prueba de estructura de minería

    Especificar un conjunto de datos diferente

  4. Si seleccionó Especificar un conjunto de datos diferente, opcionalmente haga clic en Abrir editor de filtros para crear condiciones de filtro en el conjunto de datos de entrada. Haz clic en Aceptar.

  5. Haga clic en la pestaña Gráfico de elevación o en la pestaña Matriz de clasificación para compilar automáticamente el gráfico mediante los datos de prueba especificados.

Para asignar columnas de modelo a las columnas de los datos de prueba

  1. Haga doble clic en la estructura de minería de datos que contiene los modelos que desea trazar para abrir la estructura y los modelos en el Diseñador de minería de datos.

  2. Seleccione la pestaña Gráfico de precisión de minería de datos y, a continuación, seleccione la pestaña Selección de entrada .

  3. En la pestaña Selección de entrada , en Seleccionar conjunto de datos que se va a usar para gráfico de precisión, seleccione Especificar un conjunto de datos diferente.

  4. Haga clic en el botón Examinar (...) para abrir un cuadro de diálogo y compilar la definición del conjunto de datos externo.

  5. En el cuadro de diálogo Seleccionar estructura de minería, seleccione la estructura de minería que contiene los modelos con los que desea trabajar y, a continuación, haga clic en Aceptar.

  6. En la tabla Seleccionar tablas de entrada de la pestaña Gráfico de precisión de minería, haga clic en Seleccionar tabla de casos para abrir el cuadro de diálogo Seleccionar tabla.

  7. En el cuadro de diálogo Seleccionar tabla , seleccione un origen de datos en la lista Origen de datos . Elija una tabla que contenga los datos que desea usar en las consultas de predicción para determinar la precisión de los modelos.

  8. En el cuadro Nombre de tabla o vista , seleccione la tabla que contiene los datos que desea usar para probar los modelos.

  9. Edite los mapeos, si es necesario. Las columnas de la estructura de minería de datos se asignan automáticamente a las columnas con el mismo nombre en la tabla de entrada. Para crear asignaciones manualmente, haga clic en una columna de la tabla Seleccionar tablas de entrada y arrástrela a la columna correspondiente de la tabla Estructura de minería. Para eliminar una asignación, haga clic en la línea que vincula la columna de la tabla Estructura de minería a la columna asignada en la tabla tabla(s) de entrada seleccionada(s) y presione DELETE.

  10. Haz clic en Aceptar.

Para modificar la forma en que los datos de entrada se asignan al modelo

  1. En el Diseñador de minería de datos, haga doble clic en la estructura que contiene los modelos que desea trazar.

  2. Seleccione la pestaña Gráfico de Precisión de Minería.

  3. Haga clic en la pestaña Selección de entrada .

  4. En Seleccionar conjunto de datos que se va a usar para el gráfico de precisión, seleccione la opción Especificar un conjunto de datos diferente.

  5. Haga clic en el botón Examinar (...) para abrir un cuadro de diálogo y crear la definición del origen de datos externo.

  6. En el cuadro de diálogo Especificar asignación de columnas , haga clic en Seleccionar tabla de casos.

  7. En el cuadro de diálogo Seleccionar tabla, seleccione una vista del origen de datos de la lista y seleccione la tabla que contiene los datos de casos. Haz clic en Aceptar.

  8. Si las tablas que necesita no están disponibles, cierre el cuadro de diálogo y cree una nueva vista del origen de datos que contenga la tabla. Para obtener información sobre cómo crear una vista de origen de datos, consulte Definición de una vista de origen de datos (Analysis Services).

  9. Si el modelo de minería de datos contiene una tabla anidada, haga clic en Seleccionar tabla anidada y seleccione la tabla anidada en la lista de tablas de la vista del origen de datos. Haz clic en Aceptar.

  10. Seleccione la línea de unión de la asignación que desea modificar y seleccione Modificar conexiones.

    Se abre el cuadro de diálogo Modificar mapeo. En la tabla de este cuadro de diálogo, Columna de estructura de minería de datos enumera cada columna que contiene la estructura de minería de datos seleccionada y Columna de tabla enumera las columnas de las tablas de entrada asignadas a columnas de la estructura de minería de datos.

  11. En Columna de tabla, seleccione la fila que corresponde a la fila en Columna de estructura de minería de datos para la que desea modificar una relación. Seleccione una nueva columna de la lista o seleccione la entrada en blanco de la lista para eliminar la columna.

  12. Haz clic en Aceptar.

    Las nuevas asignaciones de columnas se muestran en el cuadro de diálogo Especificar asignación de columnas. Puede quitar una asignación seleccionando la línea entre las columnas y presionando la tecla DELETE. Puede crear una nueva conexión seleccionando una columna en la tabla Estructura de minería de datos y arrastrándola a la columna correspondiente de la tabla SelectInput Table(s).

Véase también

Tareas y procedimientos de prueba y validación (minería de datos)