Creación de la estructura de un modelo de minería de datos para agrupamiento de secuencias (Tutorial intermedio de minería de datos)

El primer paso para crear un modelo de minería de datos de agrupación en clústeres de secuencia consiste en usar el Asistente para minería de datos para crear una nueva estructura de minería de datos y un modelo de minería de datos basado en el algoritmo de agrupación en clústeres de secuencia de Microsoft.

Usará la misma vista del origen de datos que usó para el análisis de la cesta del mercado, pero agregará una columna que contenga el sequence identificador. En este escenario, la secuencia significa el orden en el que el cliente agregó artículos a la cesta de la compra.

También agregará algunas columnas que se usan en uno de los modelos para agrupar clientes por datos demográficos.

Para crear una estructura y un modelo de agrupamiento de secuencias

En el Explorador de soluciones de SQL Server Data Tools (SSDT), haga clic con el botón derecho en Estructuras de minería de datos y seleccione Nueva estructura de minería de datos.
En la página Bienvenido al Asistente para minería de datos, haga clic en Siguiente.
En la página Seleccionar el Método de Definición, compruebe que Desde base de datos relacional o almacén de datos existente está seleccionado, y a continuación, haga clic en Siguiente.
En la página Crear la estructura de minería de datos, compruebe que la opción Crear estructura de minería de datos con un modelo de minería está seleccionada. A continuación, haga clic en la lista desplegable de la opción ¿Qué técnica de minería de datos desea usar? y seleccione Clústeres de secuencia de Microsoft. Haga clic en Next.

Aparece la página Seleccionar vista del origen de datos . En Vistas de origen de datos disponibles, seleccione Orders.

Los pedidos son la misma vista del origen de datos que usó para el escenario de cesta de mercado. Si no ha creado esta vista del origen de datos, consulte Adición de una vista del origen de datos con tablas anidadas (Tutorial intermedio de minería de datos).
Haga clic en Next.
En la página Especificar tipos de tabla, active la casilla Case situada junto a la tabla vAssocSeqOrders y active la casilla Nested situada junto a la tabla vAssocSeqLineItems. Haga clic en Next.

Nota:

Si se produce un error al seleccionar las casillas Caso o Anidado, puede ser que la combinación en la vista del origen de datos no sea correcta. La tabla anidada, vAssocSeqLineItems, debe estar conectada a la tabla de casos, vAssocSeqOrders, mediante una unión de muchos a uno. Para editar la relación, haga clic con el botón derecho en la línea de combinación y vuelva a invertir la dirección de la combinación. Para obtener más información, vea Cuadro de diálogo Crear o editar relación (Analysis Services - Datos multidimensionales).
En la página Especificar los datos de entrenamiento , elija las columnas que se van a usar en el modelo activando una casilla de la siguiente manera:
- IncomeGroup Seleccione la casilla de verificación de Entrada de Datos.
  
  Esta columna contiene información interesante sobre los clientes que puede usar para la agrupación en clústeres. Lo usará en el primer modelo y, a continuación, lo omitirá en el segundo modelo.
- OrderNumber Active la Key casilla.
  
  Este campo se usará como identificador para la tabla de casos o Key. En general, nunca debe usar el campo clave de la tabla case como entrada, ya que la clave contiene valores únicos que no son útiles para la agrupación en clústeres.
- Región Seleccione la casilla Entrada .
  
  Esta columna contiene información interesante sobre los clientes que puede usar para la agrupación en clústeres. Lo usará en el primer modelo y, a continuación, lo omitirá en el segundo modelo.
- LineNumber Seleccione las casillas Key y Entrada.
  
  El campo LineNumber se usará como identificador de la tabla anidada o Sequence Key. La clave de una tabla anidada siempre debe usarse para la entrada.
- Modelo Seleccione las casillas Entrada y Predecible.
Compruebe que las selecciones son correctas y, a continuación, haga clic en Siguiente.

En la página Especificar contenido y tipo de datos de columnas , compruebe que la cuadrícula contiene las columnas, los tipos de contenido y los tipos de datos que se muestran en la tabla siguiente y, a continuación, haga clic en Siguiente.

Tablas y columnas	Tipo de contenido	Tipo de datos
Grupo de ingresos	Discreto	Mensaje de texto
Número de pedido	Clave	Mensaje de texto
Región	Discreto	Mensaje de texto
vAssocSeqLineItems
Número de línea	Secuencia de claves	long
Modelo	Discreto	Mensaje de texto

En la página Crear conjunto de pruebas , cambie el Porcentaje de datos para las pruebas a 20 y, a continuación, haga clic en Siguiente.
En la página Finalización del Asistente, para el nombre de la estructura de minería, escriba Sequence Clustering with Region.
Para el nombre del modelo de minería, escriba Sequence Clustering with Region.
Active la casilla Permitir obtención de detalles y luego haga clic en Finalizar.

Siguiente tarea de la lección

Procesamiento del modelo de agrupación en clústeres de secuencia

Véase también

Diseñador de minería de datos
Algoritmo de agrupación en clústeres de secuencia de Microsoft

Last updated on 2017-03-06

Compartir a través de

Creación de la estructura de un modelo de minería de datos para agrupamiento de secuencias (Tutorial intermedio de minería de datos)

Para crear una estructura y un modelo de agrupamiento de secuencias

Siguiente tarea de la lección

Véase también

Recursos adicionales