Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
El algoritmo de regresión lineal de Microsoft es una variación del algoritmo de árboles de decisión de Microsoft que le ayuda a calcular una relación lineal entre una variable dependiente e independiente y, a continuación, usar esa relación para la predicción.
La relación adopta la forma de una ecuación para una línea que representa mejor una serie de datos. Por ejemplo, la línea del diagrama siguiente es la mejor representación lineal posible de los datos.
Cada punto de datos del diagrama tiene un error asociado a su distancia desde la línea de regresión. Los coeficientes a y b en la ecuación de regresión ajustan el ángulo y la ubicación de la línea de regresión. Para obtener la ecuación de regresión, ajuste a y b hasta que la suma de los errores asociados a todos los puntos alcance su mínimo.
Hay otros tipos de regresión que usan varias variables y también métodos no lineales de regresión. Sin embargo, la regresión lineal es un método útil y conocido para modelar una respuesta a un cambio en algún factor subyacente.
Ejemplo
Puede usar la regresión lineal para determinar una relación entre dos columnas continuas. Por ejemplo, puede usar la regresión lineal para calcular una línea de tendencia a partir de datos de fabricación o ventas. También puede usar la regresión lineal como precursor del desarrollo de modelos de minería de datos más complejos para evaluar las relaciones entre las columnas de datos.
Aunque hay muchas maneras de calcular la regresión lineal que no requieren herramientas de minería de datos, la ventaja de usar el algoritmo de regresión lineal de Microsoft para esta tarea es que todas las posibles relaciones entre las variables se calculan y prueban automáticamente. No es necesario seleccionar un método de cálculo, como resolver por mínimos cuadrados. Sin embargo, la regresión lineal podría sobresmplificar las relaciones en escenarios en los que varios factores afectan al resultado.
Funcionamiento del algoritmo
El algoritmo de regresión lineal de Microsoft es una variación del algoritmo de árboles de decisión de Microsoft. Al seleccionar el algoritmo de regresión lineal de Microsoft, se invoca un caso especial del algoritmo de árboles de decisión de Microsoft, con parámetros que restringen el comportamiento del algoritmo y requieren determinados tipos de datos de entrada. Además, en un modelo de regresión lineal, todo el conjunto de datos se usa para calcular las relaciones en el paso inicial, mientras que un modelo de árboles de decisión estándar divide los datos repetidamente en subconjuntos o árboles más pequeños.
Datos necesarios para los modelos de regresión lineal
Al preparar los datos para su uso en un modelo de regresión lineal, debe comprender los requisitos del algoritmo determinado. Esto incluye la cantidad de datos que se necesitan y cómo se usan los datos. Los requisitos de este tipo de modelo son los siguientes:
Una sola columna de clave Cada modelo debe contener una columna numérica o de texto que identifique de forma única cada registro. No se permiten claves compuestas.
Una columna predecible Requiere al menos una columna de predicción. Puede incluir varios atributos de predicción en un modelo, pero los atributos de predicción deben ser tipos de datos numéricos continuos. No puede usar un tipo de datos datetime como un atributo de predicción aunque el almacenamiento nativo de los datos sea numérico.
Columnas de entrada Las columnas de entrada deben contener datos numéricos continuos y asignarse el tipo de datos adecuado.
Para obtener más información, consulte la sección Requisitos de referencia técnica del algoritmo de regresión lineal de Microsoft.
Visualización de un modelo de regresión lineal
Para explorar el modelo, use el Visor de árboles de Microsoft. La estructura de árbol de un modelo de regresión lineal es muy sencilla, con toda la información sobre la ecuación de regresión contenida en un solo nodo. Para obtener más información, vea Examinar un modelo mediante el Visor de árboles de Microsoft.
Si desea obtener más detalles sobre la ecuación, también puede ver los coeficientes y otros detalles mediante el Visor de árboles de contenido genérico de Microsoft.
Para un modelo de regresión lineal, el contenido del modelo incluye metadatos, la fórmula de regresión y estadísticas sobre la distribución de valores de entrada. Para obtener más información, consulte El contenido del modelo de regresión lineal para minería de datos (Servicios de análisis - minería de datos).
Creación de predicciones
Una vez procesado el modelo, los resultados se almacenan como un conjunto de estadísticas junto con la fórmula de regresión lineal, que puede usar para calcular tendencias futuras. Para obtener ejemplos de consultas que se usarán con un modelo de regresión lineal, consulte Ejemplos de consultas del modelo de regresión lineal.
Para obtener información general sobre cómo crear consultas en modelos de minería de datos, consulte Consultas de minería de datos.
Además de crear un modelo de regresión lineal seleccionando el algoritmo de regresión lineal de Microsoft, si el atributo de predicción es un tipo de datos numérico continuo, puede crear un modelo de árbol de decisión que contenga regresiones. En este caso, el algoritmo dividirá los datos cuando encuentre puntos de separación adecuados, pero para algunas regiones de datos, creará una fórmula de regresión en su lugar. Para obtener más información sobre los árboles de regresión dentro de un modelo de árboles de decisión, vea Contenido del modelo de minería de datos para modelos de árboles de decisión (Analysis Services - Minería de datos).
Observaciones
No admite el uso del lenguaje de marcado de modelos predictivos (PMML) para crear modelos de minería de datos.
No admite la creación de dimensiones de minería de datos.
Admite la obtención de detalles.
Admite el uso de modelos de minería de datos OLAP.
Véase también
Algoritmos de minería de datos (Analysis Services - Minería de datos)Referencia técnica del algoritmo de regresión lineal de MicrosoftEjemplos de consultas del modelo de regresión linealContenido del modelo de minería para modelos de regresión lineal (Analysis Services - Minería de datos)