Compartir a través de


Personalización y procesamiento del modelo de previsión (Tutorial intermedio de minería de datos)

El algoritmo de serie temporal de Microsoft proporciona parámetros que afectan a cómo se crea un modelo y cómo se analizan los datos de tiempo. Cambiar estas propiedades puede afectar significativamente a la forma en que el modelo de minería de datos realiza predicciones.

Para esta tarea en el tutorial, realizará las siguientes tareas para modificar el modelo:

  1. Personalizará la forma en que el modelo controla los períodos de tiempo agregando un nuevo valor para el parámetro PERIODICITY_HINT .

  2. Obtendrá información sobre otros dos parámetros importantes para el algoritmo de serie temporal de Microsoft: FORECAST_METHOD, que le permite controlar el método usado para la previsión y PREDICTION_SMOOTHING, lo que le permite personalizar la combinación de predicciones a largo plazo y a corto plazo.

  3. Opcionalmente, indicará al algoritmo cómo desea que se impute los valores que faltan.

  4. Una vez realizados todos los cambios, implementará y procesará el modelo.

Establecer parámetros de serie temporal

Sugerencias de periodicidad

El parámetro PERIODICITY_HINT proporciona al algoritmo información sobre períodos de tiempo adicionales que espera ver en los datos. De forma predeterminada, los modelos de serie temporal intentarán detectar automáticamente un patrón en los datos. Sin embargo, si ya conoce el ciclo de tiempo esperado, proporcionar una sugerencia de periodicidad puede mejorar potencialmente la precisión del modelo. Sin embargo, si proporciona la sugerencia de periodicidad incorrecta, puede disminuir la precisión; Por lo tanto, si no está seguro de qué valor se debe usar, es mejor usar el valor predeterminado.

Por ejemplo, la vista utilizada para este modelo agrega mensualmente los datos de ventas de "Adventure Works DW Multidimensional 2012". Por lo tanto, cada segmento de tiempo usado por el modelo representa un mes y todas las predicciones también estarán en términos de meses. Puesto que hay 12 meses en un año y espera que los patrones de ventas se repitan más o menos anualmente, establecerá el parámetro 12PERIODICITY_HINT en , para indicar que 12 segmentos de tiempo (meses) constituyen un ciclo de ventas completo.

Método de previsión

El parámetro FORECAST_METHOD controla si el algoritmo de serie temporal está optimizado para predicciones a corto o largo plazo. De forma predeterminada, el parámetro FORECAST_METHOD se establece en MIXED, lo que significa que dos algoritmos diferentes se combinan y equilibran para proporcionar buenos resultados para la predicción a corto y largo plazo.

Sin embargo, si sabe que desea usar un algoritmo determinado, puede cambiar el valor a ARIMA o ARTXP.

Ponderación de predicciones Long-Term frente a Short-Term

También puede personalizar la forma en que las predicciones a largo plazo y a corto plazo se combinan mediante el parámetro PREDICTION_SMOOTHING. De forma predeterminada, este parámetro se establece en 0,5, que generalmente proporciona el mejor equilibrio para la precisión general.

Para cambiar los parámetros del algoritmo

  1. En la pestaña Modelos de minería de datos , haga clic con el botón derecho en Previsión y seleccione Establecer parámetros de algoritmo.

  2. En la PERIODICITY_HINT fila del cuadro de diálogo Parámetros de algoritmo, haga clic en la columna Valor y escriba {12}, incluidas las llaves.

    De forma predeterminada, el algoritmo también agregará el valor {1}.

  3. En la FORECAST_METHOD fila, compruebe que el cuadro de texto Valor está en blanco o establecido en MIXED. Si se ha escrito un valor diferente, escriba MIXED para volver a cambiar el parámetro al valor predeterminado.

  4. En la fila PREDICTION_SMOOTHING , compruebe que el cuadro de texto Valor está en blanco o establecido en 0,5. Si se ha escrito un valor diferente, haga clic en Valor y escriba 0.5 para volver a cambiar el parámetro al valor predeterminado.

    Nota:

    El parámetro PREDICTION_SMOOTHING solo está disponible en SQL Server Enterprise. Por lo tanto, no puede ver ni cambiar el valor del parámetro PREDICTION_SMOOTHING en SQL Server Standard. Sin embargo, el comportamiento predeterminado es usar ambos algoritmos y ponderarlos igualmente.

  5. Haz clic en Aceptar.

Control de datos que faltan (opcional)

En muchos casos, los datos de ventas pueden tener huecos que se rellenan con valores NULL o es posible que un almacén no haya cumplido la fecha límite de informes, dejando una celda vacía al final de la serie. En estos escenarios, Analysis Services genera el siguiente error y no procesará el modelo.

Error (minería de datos): las marcas de tiempo no se sincronizan empezando con la serie <nombre de la serie>, del modelo de minería de datos, <nombre del modelo>. Todas las series temporales deben terminar al mismo tiempo y no pueden tener puntos de datos que faltan arbitrariamente. Si se establece el parámetro MISSING_VALUE_SUBSTITUTION en Previous o en una constante numérica, se revisarán automáticamente los puntos de datos que faltan siempre que sea posible".

Para evitar este error, puede especificar que Analysis Services proporcione automáticamente nuevos valores para rellenar los huecos mediante cualquiera de los métodos siguientes:

  • Uso de un valor medio. La media se calcula mediante el uso de todos los valores válidos de la misma serie de datos.

  • Usando el valor anterior. Puede sustituir los valores anteriores por varias celdas que faltan, pero no puede rellenar los valores iniciales.

  • Usar un valor constante que usted suministre.

Para especificar que los espacios se rellenen mediante el promedio de valores

  1. En la pestaña Modelos de minería de datos , haga clic con el botón derecho en la columna Previsión y seleccione Establecer parámetros de algoritmo.

  2. En el cuadro de diálogo Parámetros de algoritmo , en la fila MISSING_VALUE_SUBSTITUTION , haga clic en la columna Valor y escriba Mean.

Compilación del modelo

Para usar el modelo, debe implementarlo en un servidor y procesar el modelo ejecutando los datos de entrenamiento a través del algoritmo.

Para procesar el modelo de previsión

  1. En el menú Modelo de minería de datos de SQL Server, seleccione Procesar estructura de minería de datos y Todos los modelos.

  2. En la advertencia que pregunta si desea compilar e implementar el proyecto, haga clic en .

  3. En el cuadro de diálogo Process Mining Structure - Forecasting (Estructura de minería de datos de procesos: previsión ), haga clic en Ejecutar.

    Se abre el cuadro de diálogo Progreso del proceso para mostrar información sobre el procesamiento del modelo. El procesamiento del modelo puede tardar algún tiempo.

  4. Una vez completado el procesamiento, haga clic en Cerrar para salir del cuadro de diálogo Progreso del proceso .

  5. Haga clic en Cerrar de nuevo para salir del cuadro de diálogo Process Mining Structure - Forecasting (Estructura de minería de datos de procesos: previsión ).

Siguiente tarea de la lección

Exploración del modelo de previsión (Tutorial intermedio de minería de datos)

Véase también

Referencia técnica del algoritmo de serie temporal de Microsoft
Algoritmo de serie temporal de Microsoft
Requisitos y consideraciones de procesamiento (minería de datos)