Compartir a través de


Creación de predicciones en un modelo de agrupación en clústeres de secuencia (Tutorial intermedio de minería de datos)

Después de comprender mejor el modelo de agrupación de secuencias al explorarlo en el visor, puede crear consultas de predicción mediante el Generador de consultas de predicción en la pestaña Predicción del modelo de Minería de Datos en el Diseñador de Minería de Datos. Para crear una predicción, primero seleccione el modelo de agrupación en clústeres de secuencia y, a continuación, seleccione los datos de entrada. En el caso de las entradas, puede usar un origen de datos externo o puede crear una consulta singleton y proporcionar valores en un cuadro de diálogo.

En esta lección se supone que ya está familiarizado con cómo usar el generador de consultas de predicción y desea aprender a crear consultas específicas de un modelo de agrupación en clústeres de secuencia. Para obtener información general sobre cómo usar el Generador de consultas de predicción, consulte Interfaces de consulta de minería de datos o la sección del tutorial básico de minería de datos, Creación de predicciones (Tutorial básico de minería de datos).

Creación de predicciones en el modelo regional

En este escenario, primero creará algunas consultas de predicción únicas para obtener una idea de cómo las predicciones pueden variar según la región.

Para crear una consulta individual en un modelo de agrupación de secuencias en clústeres

  1. Haga clic en la pestaña Predicción de modelo de minería del Diseñador de minería de datos.

  2. En el menú de la columna Modelo de Minería, seleccione Consulta Singleton.

    Aparecerán el panel Modelo de minería de datos y el panel Entrada de consulta única.

  3. En el panel Modelo de minería de datos, haga clic en Seleccionar modelo. (Puede omitir este paso si el modo de agrupación en clústeres de secuencia ya está seleccionado).

    Se abre el cuadro de diálogo Seleccionar modelo de minería.

  4. Expanda el nodo que representa la estructura de minería Sequence Clustering with Region y seleccione el modelo Sequence Clustering with Region. Haz clic en Aceptar. Por ahora, omita el panel de entrada; especificará las entradas después de configurar las funciones de predicción.

  5. En la cuadrícula, haga clic en la celda vacía en Origen y seleccione Función de predicción. En la celda en Campo, seleccione PredictSequence.

    Nota:

    También puede usar la función Predict . Si lo hace, asegúrese de elegir la versión de la función Predict que toma una columna de tabla como argumento.

  6. En el panel Modelo de minería, seleccione la tabla v Assoc Seq Line Items anidada y arrástrela a la cuadrícula, hacia el cuadro Criterios/argumento de la función PredictSequence.

    Arrastrar y quitar nombres de tabla y columna le permite crear instrucciones complejas sin errores de sintaxis. Sin embargo, reemplaza el contenido actual de la celda, que incluye otros argumentos opcionales para la función PredictSequence . Para ver los otros argumentos, puede agregar temporalmente una segunda instancia de la función a la cuadrícula como referencia.

  7. Haga clic en el botón Resultado en la esquina superior del Generador de consultas de predicción.

Los resultados esperados contienen una sola columna con el encabezado Expression. La columna Expresión contiene una tabla anidada con tres columnas de la siguiente manera:

$SEQUENCE Número de línea Modelo
1 Montaña-200

¿Qué significan estos resultados? Recuerde que no especificó ninguna entrada. Por lo tanto, la predicción se realiza contra la población total de casos, y Analysis Services devuelve la predicción más probable en conjunto.

Agregar entradas a una consulta de predicción única

Hasta ahora, no ha especificado ninguna entrada. En la próxima tarea, utilizará el panel Entrada de consulta única para especificar algunas entradas para la consulta. En primer lugar, usará [Región] como entrada para el modelo de agrupación en clústeres de secuencia regional, para determinar si las secuencias predichas son las mismas para todas las regiones. A continuación, aprenderá a modificar la consulta para agregar la probabilidad de cada predicción y aplanar los resultados para que sean más fáciles de ver.

Para generar predicciones para un grupo de clientes específico
  1. Haga clic en el botón Diseño de la esquina superior izquierda del Generador de consultas de predicción para volver a la cuadrícula de creación de consultas.

  2. En el cuadro de diálogo Entrada de consulta singleton , haga clic en el cuadro Valor de Regiony seleccione Europa.

  3. Haga clic en el botón Resultado para ver las predicciones de los clientes de Europa.

  4. Haga clic en el botón Diseño de la esquina superior izquierda del Generador de consultas de predicción para volver a la cuadrícula de creación de consultas.

  5. En el cuadro de diálogo Entrada de consulta singleton , haga clic en el cuadro Valor de Regiony seleccione Norteamérica.

  6. Haga clic en el botón Resultado para ver las predicciones de los clientes de Norteamérica.

Agregar probabilidades mediante una expresión personalizada

Para generar la probabilidad de cada predicción es ligeramente más complicada, ya que la probabilidad es un atributo de la predicción y se genera como una tabla anidada. Si está familiarizado con las extensiones de minería de datos (DMX), puede modificar fácilmente la consulta para agregar una instrucción de selección secundaria en la tabla anidada. Sin embargo, también puede crear una instrucción de selección secundaria en el Generador de consultas de predicción agregando una expresión personalizada.

Para generar probabilidades de una secuencia predicha mediante una expresión personalizada
  1. Haga clic en el botón Diseño de la esquina superior izquierda del Generador de consultas de predicción para volver a la cuadrícula de creación de consultas.

  2. En la cuadrícula, en Origen, haga clic en una nueva fila y seleccione Expresión personalizada.

  3. Deje el cuadro bajo Campo en blanco.

  4. En Alias, escriba t.

  5. En el cuadro Criteria/Argument (Criterios/argumento), escriba la instrucción completa sub-select como se muestra en el ejemplo de código siguiente. Asegúrese de incluir los paréntesis inicial y final.

    (SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))  
    
  6. Haga clic en el botón Resultado para ver las predicciones de los clientes de Europa.

Los resultados ahora contienen dos tablas anidadas, una con la predicción y otra con la probabilidad de la predicción. Si la consulta no funciona, puede cambiar a la vista de diseño de consultas y revisar la instrucción de consulta completa, que debe ser la siguiente:

SELECT  
  PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]),  
  ( (SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))) as [t]  
FROM  
  [Sequence Clustering with Region]  
NATURAL PREDICTION JOIN  
(SELECT 'Europe' AS [Region]) AS t  

Trabajar con resultados

Cuando hay muchas tablas anidadas en los resultados, es posible que desee aplanar los resultados para facilitar la visualización. Para ello, puede modificar manualmente la consulta y agregar la FLATTENED palabra clave .

Para aplanar conjuntos de filas anidados en una consulta de predicción
  1. Haga clic en el botón Consulta de la esquina del Generador de consultas de predicción.

    La cuadrícula cambia a un panel abierto donde puede ver y modificar la instrucción DMX creada por el Generador de consultas de predicción.

  2. Después de la SELECT palabra clave , escriba FLATTENED.

    El texto completo de la consulta debe ser similar al siguiente:

    SELECT FLATTENED  
      PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]),  
      ( (SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))) as [t]  
    FROM  
      [Sequence Clustering with Region]  
    NATURAL PREDICTION JOIN  
    (SELECT 'Europe' AS [Region]) AS t  
    
  3. Haga clic en el botón Resultados en la esquina superior del Generador de consultas de predicción.

Después de editar manualmente una consulta, no podrá volver a la vista Diseño sin perder los cambios. Sin embargo, puede guardar la instrucción DMX que creó manualmente en un archivo de texto y, a continuación, volver a cambiar a la vista Diseño. Al hacerlo, la consulta se revierte a la última versión válida en la vista Diseño.

En los ejemplos anteriores se utilizaba una columna de la tabla caso, Región, como entrada para la consulta de predicción singleton, puesto que estaba interesado en saber si el modelo había encontrado diferencias entre las regiones. Sin embargo, después de explorar el modelo, ha decidido que las diferencias no son lo suficientemente sólidas como para justificar la personalización de recomendaciones de productos por región. Lo que realmente le interesa predecir es los elementos que seleccionan los clientes. Por lo tanto, en las consultas siguientes, usará el modelo de agrupación en clústeres de secuencia que no incluye Región para generar recomendaciones para todos los clientes.

Usar columnas de tabla anidadas como entrada

En primer lugar, creará una consulta de predicción única que toma un solo elemento como entrada y devuelve el siguiente elemento más probable. Para obtener una predicción de este tipo, debe usar una columna de tabla anidada como valor de entrada. Esto se debe a que el atributo que va a predecir, Model, forma parte de una tabla anidada. Analysis Services proporciona el cuadro de diálogo Entrada de tabla anidada para ayudarle a crear fácilmente consultas de predicción en atributos de tabla anidados utilizando el Generador de Consultas de Predicción.

Para usar una tabla anidada como entrada para una predicción
  1. Haga clic en el botón Diseño de la esquina superior izquierda del Generador de consultas de predicción para volver a la cuadrícula de creación de consultas.

  2. En el cuadro de diálogo Entrada de consulta Singleton , haga clic en el cuadro Valor de Regiony seleccione la fila vacía para borrar la entrada de este campo.

  3. En el cuadro de diálogo Entrada de consulta singleton , haga clic en el cuadro Valor de vAssocSeqLineItemsy, a continuación, haga clic en el botón (...) .

  4. En el cuadro de diálogo Entrada de tabla anidada, haga clic en Agregar.

  5. En la nueva fila, haga clic en el cuadro debajo de Model y seleccione neumático de turismo en la lista. Haz clic en Aceptar.

  6. Haga clic en el botón Resultado para ver las predicciones.

El modelo recomienda los siguientes elementos para todos los clientes que elijan el neumático Touring como primer elemento. Ya sabe al analizar el modelo que los clientes compran con frecuencia los productos Touring Tire y Touring Tire Tube juntos, por lo que estas recomendaciones son acertadas.

$SEQUENCE Número de línea Modelo
1 Tubo para neumático de touring
2 Sport-100
3 Logotipo de Long-Sleeve Jersey

Creación de una consulta de predicción masiva mediante entradas de tabla anidadas

Ahora que está satisfecho de que el modelo crea el tipo de predicciones que puede usar para realizar recomendaciones, creará una consulta de predicción asignada a un origen de datos externo. Ese origen de datos proporcionará valores que representan los productos actuales. Dado que está interesado en crear una consulta de predicción que proporcione el identificador de cliente y una lista de productos como entrada, agregará la tabla de clientes como tabla de casos y la tabla de compras como tabla anidada. A continuación, agregará funciones de predicción como hizo anteriormente para crear recomendaciones.

Este es el mismo procedimiento que se utiliza para crear predicciones para la canasta de mercado en la lección 3; sin embargo, en un modelo de agrupación en clústeres de secuencia, las predicciones también necesitan el orden como entrada.

Para crear una consulta de predicción mediante entradas de tabla anidada
  1. En el panel Modelo de minería de datos, seleccione el modelo de agrupación en clústeres de secuencia, si aún no está seleccionado.

  2. En el cuadro de diálogo Seleccionar tabla de entrada, haga clic en Seleccionar tabla de casos.

  3. En el cuadro de diálogo Seleccionar tabla , en Origen de datos, seleccione Pedidos. En la lista Nombre de tabla/vista , seleccione vAssocSeqOrders y, a continuación, haga clic en Aceptar.

  4. En el cuadro de diálogo Seleccionar tablas de entrada , haga clic en Seleccionar tabla anidada.

  5. En el cuadro de diálogo Seleccionar tabla , en Origen de datos, seleccione Pedidos. En la lista Nombre de tabla o vista , seleccione vAssocSeqLineItems y, a continuación, haga clic en Aceptar.

    Analysis Services intentará detectar relaciones y crearlas automáticamente si los tipos de datos coinciden y los nombres de columna son similares. Si las relaciones que crea son incorrectas, puede hacer clic con el botón derecho en la línea de combinación y seleccionar Modificar conexiones para editar la asignación de columnas, o bien puede hacer clic con el botón derecho en la línea de combinación y seleccionar Eliminar para quitar la relación por completo. En este caso, dado que las tablas ya estaban unidas en la vista del origen de datos, esas relaciones se agregan automáticamente al panel de diseño.

  6. Agregue una nueva fila a la cuadrícula. En Origen, seleccione vAssocSeqOrders y, en Campo, seleccione CustomerKey.

  7. Agregue una nueva fila a la cuadrícula. En Origen, seleccione Función de predicción y, en Campo, seleccione PredictSequence.

  8. Arrastre vAssocSeqLineItems al cuadro Criterios/Argumento . Haga clic al final del cuadro Criterios/Argumento y escriba los argumentos siguientes: 2.

    El texto completo del cuadro Criterios/Argumento debe ser: [Sequence Clustering].[v Assoc Seq Line Items],2

  9. Haga clic en el botón Resultado para ver las predicciones de cada cliente.

Ha completado el tutorial sobre los modelos de agrupación en clústeres de secuencia.

Pasos siguientes

Si ha terminado todas las secciones del Tutorial intermedio de minería de datos (Analysis Services - Minería de datos), es posible que el siguiente paso sea aprender a usar instrucciones de Extensiones de minería de datos (DMX) para compilar modelos y generar predicciones. Para obtener más información, consulte Creación y consulta de modelos de minería de datos con DMX: Tutoriales (Analysis Services - Minería de datos).

Si está familiarizado con los conceptos de programación, también puede usar Objetos de administración de análisis (AMO) para trabajar mediante programación con objetos de minería de datos. Para obtener más información, consulte Clases de minería de datos de AMO.

Véase también

Ejemplos de consultas del modelo de agrupación en clústeres de secuencia
Contenido del modelo de minería de datos para modelos de agrupación secuencial (Analysis Services - Minería de datos)