Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Al crear una consulta en un modelo de minería de datos, puede crear una consulta de contenido, que proporciona detalles sobre los patrones detectados en el análisis, o bien puede crear una consulta de predicción, que usa los patrones del modelo para realizar predicciones para nuevos datos. Por ejemplo, una consulta de contenido podría proporcionar detalles adicionales sobre la fórmula de regresión, mientras que una consulta de predicción podría avisarle si un nuevo punto de datos se ajusta al modelo. También puede recuperar metadatos sobre el modelo mediante una consulta.
En esta sección se explica cómo crear consultas para modelos basados en el algoritmo de regresión lineal de Microsoft.
Nota:
Dado que la regresión lineal se basa en un caso especial del algoritmo de árboles de decisión de Microsoft, hay muchas similitudes y algunos modelos de árbol de decisión que usan atributos de predicción continuos pueden contener fórmulas de regresión. Para obtener más información, consulte Referencia técnica del algoritmo de árboles de decisión de Microsoft.
Consultas de contenido
Uso de DMX para devolver la fórmula de regresión del modelo
Devolver solo el coeficiente del modelo
Consultas de predicción
Predicción de ingresos mediante una consulta singleton
Uso de funciones de predicción con un modelo de regresión
Búsqueda de información sobre el modelo de regresión lineal
La estructura de un modelo de regresión lineal es extremadamente sencilla: el modelo de minería de datos representa los datos como un solo nodo, que define la fórmula de regresión. Para obtener más información, consulte Contenido de modelos de minería de datos para modelos de regresión logística (Analysis Services - minería de datos).
Consulta de ejemplo 1: Usar el conjunto de filas de esquema de minería de datos para determinar los parámetros usados para un modelo
Al consultar el conjunto de filas del esquema de minería de datos, puede encontrar metadatos sobre el modelo. Esto puede incluir cuándo se creó el modelo, cuando se procesó por última vez el modelo, el nombre de la estructura de minería de datos en la que se basa el modelo y el nombre de la columna designada como atributo de predicción. También puede devolver los parámetros que se usaron cuando se creó el modelo por primera vez.
SELECT MINING_PARAMETERS
FROM $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'TM_PredictIncome'
Resultados de ejemplo:
| PARÁMETROS_DE_MINERÍA |
|---|
| COMPLEXITY_PENALTY=0.9, MAXIMUM_INPUT_ATTRIBUTES=255, MAXIMUM_OUTPUT_ATTRIBUTES=255, MINIMUM_SUPPORT=10, SCORE_METHOD=4, SPLIT_METHOD=3, FORCE_REGRESSOR= |
Nota:
El valor del parámetro , " ",FORCE_REGRESSOR = indica que el valor actual del parámetro FORCE_REGRESSOR es NULL.
Consulta de ejemplo 2: Recuperación de la fórmula de regresión para el modelo
La consulta siguiente devuelve el contenido del modelo de minería de datos para un modelo de regresión lineal que se creó mediante el mismo origen de datos de correo dirigido que se usó en el Tutorial básico de minería de datos. Este modelo predice los ingresos de los clientes en función de la edad.
La consulta devuelve el contenido del nodo que contiene la fórmula de regresión. Cada variable y coeficiente se almacenan en una fila independiente de la tabla NODE_DISTRIBUTION anidada. Si desea ver la fórmula de regresión completa, use el Visor de árboles de Microsoft, haga clic en el nodo (Todos) y abra la leyenda de minería de datos.
SELECT FLATTENED NODE_DISTRIBUTION as t
FROM LR_PredictIncome.CONTENT
Nota:
Si hace referencia a columnas individuales de la tabla anidada mediante una consulta como SELECT <column name> from NODE_DISTRIBUTION, algunas columnas, como SUPPORT o PROBABILITY, deben incluirse entre corchetes para distinguirlas de palabras clave reservadas del mismo nombre.
Resultados esperados:
| t.ATTRIBUTE_NAME | t.ATTRIBUTE_VALUE | t.SOPORTE | t.PROBABILIDAD | t.VARIANZA | t.TIPODEVALOR |
|---|---|---|---|---|---|
| Ingresos anuales | Desaparecido | 0 | 0.000457142857142857 | 0 | 1 |
| Ingresos anuales | 57220.8876687257 | 17484 | 0.999542857142857 | 1041275619.52776 | 3 |
| Edad | 471.687717702463 | 0 | 0 | 126.969442359327 | 7 |
| Edad | 234,680904692439 | 0 | 0 | 0 | 8 |
| Edad | 45.4269617936399 | 0 | 0 | 126.969442359327 | 9 |
| 35793.5477381267 | 0 | 0 | 1012968919.28372 | 11 |
En comparación, en la Leyenda de Minería, la fórmula de regresión aparece de la siguiente manera:
Ingresos anuales = 57.220.919 + 471.688 * (Edad - 45.427)
Puede ver que en la Leyenda de minería de datos, algunos números se redondean; sin embargo, la tabla NODE_DISTRIBUTION y la leyenda de minería de datos contienen esencialmente los mismos valores.
Los valores de la columna VALUETYPE indican qué tipo de información se incluye en cada fila, lo que resulta útil si está procesando los resultados mediante programación. En la tabla siguiente se muestran los tipos de valor que se generan para una fórmula de regresión lineal.
| tipo de valor |
|---|
| 1 (Falta) |
| 3 (continuo) |
| 7 (coeficiente) |
| 8 (Ganancia de puntuación) |
| 9 (Estadísticas) |
| 7 (coeficiente) |
| 8 (Ganancia de puntuación) |
| 9 (Estadísticas) |
| 11 (Interceptación) |
Para obtener más información sobre el significado de cada tipo de valor para los modelos de regresión, vea Contenido del modelo de minería de datos para modelos de regresión lineal (Analysis Services - Minería de datos).
Consulta de ejemplo 3: Devolver solo el coeficiente del modelo
Mediante la enumeración VALUETYPE, solo puede devolver el coeficiente de la ecuación de regresión, como se muestra en la consulta siguiente:
SELECT FLATTENED MODEL_NAME,
(SELECT ATTRIBUTE_VALUE, VALUETYPE
FROM NODE_DISTRIBUTION
WHERE VALUETYPE = 11)
AS t
FROM LR_PredictIncome.CONTENT
Esta consulta devuelve dos filas, una del contenido del modelo de minería de datos y la fila de la tabla anidada que contiene el coeficiente. La columna ATTRIBUTE_NAME no se incluye aquí porque siempre está en blanco para el coeficiente.
| MODEL_NAME | t.ATTRIBUTE_VALUE | t.VALUETYPE |
|---|---|---|
| LR_PredecirIngresos | ||
| LR_PredicciónIngresos | 35793.5477381267 | 11 |
Realizar predicciones a partir de un modelo de regresión lineal
Puede crear consultas de predicción en modelos de regresión lineal mediante la pestaña Predicción del modelo de minería de datos en el Diseñador de minería de datos. El generador de consultas de predicción está disponible tanto en SQL Server Management Studio como en SQL Server Data Tools (SSDT).
Nota:
También puede crear consultas en modelos de regresión mediante los complementos de minería de datos de SQL Server 2005 para Excel o los complementos de minería de datos de SQL Server 2008 para Excel. Aunque los complementos de minería de datos para Excel no crean modelos de regresión, puede examinar y consultar cualquier modelo de minería de datos almacenado en una instancia de Analysis Services.
Consulta de ejemplo 4: Predicción de ingresos mediante una consulta singleton
La manera más fácil de crear una sola consulta en un modelo de regresión es mediante el cuadro de diálogo Entrada de consulta singleton . Por ejemplo, puede compilar la siguiente consulta DMX seleccionando el modelo de regresión adecuado, eligiendo Consulta única y escribiendo 20 como el valor para Edad.
SELECT [LR_PredictIncome].[Yearly Income]
From [LR_PredictIncome]
NATURAL PREDICTION JOIN
(SELECT 20 AS [Age]) AS t
Resultados de ejemplo:
| Ingresos anuales |
|---|
| 45227.302092176 |
Consulta de ejemplo 5: Uso de funciones de predicción con un modelo de regresión
Puede usar muchas de las funciones de predicción estándar con modelos de regresión lineal. En el ejemplo siguiente se muestra cómo agregar algunas estadísticas descriptivas a los resultados de la consulta de predicción. A partir de estos resultados, puede ver que hay una desviación considerable de la media para este modelo.
SELECT
([LR_PredictIncome].[Yearly Income]) as [PredIncome],
(PredictStdev([LR_PredictIncome].[Yearly Income])) as [StDev1]
From
[LR_PredictIncome]
NATURAL PREDICTION JOIN
(SELECT 20 AS [Age]) AS t
Resultados de ejemplo:
| Ingresos anuales | StDev1 |
|---|---|
| 45227.302092176 | 31827.1726561396 |
Lista de funciones de predicción
Todos los algoritmos de Microsoft admiten un conjunto común de funciones. Sin embargo, el algoritmo de regresión lineal de Microsoft admite las funciones adicionales enumeradas en la tabla siguiente.
| Función de predicción | Uso |
| IsDescendant (DMX) | Determina si un nodo es un elemento secundario de otro nodo del modelo. |
| IsInNode (DMX) | Indica si el nodo especificado contiene el caso actual. |
| PredictHistogram (DMX) | Devuelve un valor predicho, o un conjunto de valores, para una columna especificada. |
| PredictNodeId (DMX) | Devuelve el Node_ID para cada caso. |
| PredictStdev (DMX) | Devuelve la desviación estándar del valor previsto. |
| PredictSupport (DMX) | Devuelve el valor de compatibilidad para un estado especificado. |
| PredictVariance (DMX) | Devuelve la varianza de una columna especificada. |
Para obtener una lista de las funciones que son comunes a todos los algoritmos de Microsoft, consulte Algoritmos de minería de datos (Analysis Services - Minería de datos). Para obtener más información sobre cómo usar estas funciones, consulte la Referencia de funciones de extensiones de minería de datos (DMX).
Véase también
Algoritmo de regresión lineal de Microsoft
Consultas de minería de datos
Referencia técnica del algoritmo de regresión lineal de Microsoft
Contenido del modelo de minería para modelos de regresión lineal (Analysis Services - Minería de datos)