Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
La regresión logística es una técnica estadística conocida que se usa para modelar resultados binarios.
Hay varias implementaciones de regresión logística en la investigación de estadísticas, mediante diferentes técnicas de aprendizaje. El algoritmo de regresión logística de Microsoft se ha implementado mediante una variación del algoritmo de red neuronal de Microsoft. Este algoritmo comparte muchas de las cualidades de las redes neuronales, pero es más fácil de entrenar.
Una ventaja de la regresión logística es que el algoritmo es muy flexible, tomando cualquier tipo de entrada y admite varias tareas analíticas diferentes:
Use datos demográficos para realizar predicciones sobre los resultados, como el riesgo de una determinada enfermedad.
Explore y pondera los factores que contribuyen a un resultado. Por ejemplo, busque los factores que influyen en los clientes para realizar una visita repetida a una tienda.
Clasifique documentos, correo electrónico u otros objetos que tengan muchos atributos.
Ejemplo
Considere un grupo de personas que comparten información demográfica similar y que compran productos de la empresa Adventure Works. Al modelar los datos para relacionarse con un resultado específico, como la compra de un producto objetivo, puede ver cómo contribuye la información demográfica a la probabilidad de que alguien compre el producto objetivo.
Funcionamiento del algoritmo
La regresión logística es un método estadístico conocido para determinar la contribución de varios factores a un par de resultados. La implementación de Microsoft usa una red neuronal modificada para modelar las relaciones entre entradas y salidas. El efecto de cada entrada en la salida se mide y las distintas entradas se ponderan en el modelo terminado. El nombre de la regresión logística procede del hecho de que la curva de datos se comprime mediante una transformación logística para minimizar el efecto de los valores extremos. Para obtener más información sobre la implementación y cómo personalizar el algoritmo, consulte Referencia técnica del algoritmo de regresión logística de Microsoft.
Datos necesarios para los modelos de regresión logística
Al preparar los datos para su uso en el entrenamiento de un modelo de regresión logística, debe comprender los requisitos del algoritmo concreto, incluida la cantidad de datos que se necesitan y cómo se usan los datos.
Los requisitos de un modelo de regresión logística son los siguientes:
Una sola columna de clave Cada modelo debe contener una columna numérica o de texto que identifique de forma única cada registro. No se permiten claves compuestas.
Columnas de entrada Cada modelo debe contener al menos una columna de entrada que contenga los valores que se usan como factores en el análisis. Puede tener tantas columnas de entrada como desee, pero dependiendo del número de valores de cada columna, la adición de columnas adicionales puede aumentar el tiempo necesario para entrenar el modelo.
Al menos una columna predecible El modelo debe contener al menos una columna de predicción de cualquier tipo de datos, incluidos los datos numéricos continuos. Los valores de la columna de predicción también se pueden tratar como entradas para el modelo, o puede especificar que se use solo para la predicción. No se permiten tablas anidadas para columnas de predicción, pero se pueden usar como entradas.
Para obtener información más detallada sobre los tipos de contenido y los tipos de datos admitidos para los modelos de regresión logística, consulte la sección Requisitos de referencia técnica del algoritmo de regresión logística de Microsoft.
Visualización de un modelo de regresión logística
Para explorar el modelo, puede usar el Visor de red neuronal de Microsoft o el Visor de árbol de contenido genérico de Microsoft.
Al ver el modelo mediante el Visor de redes neuronales de Microsoft, Analysis Services muestra los factores que contribuyen a un resultado determinado, clasificados por su importancia. Puede elegir un atributo y valores que se van a comparar. Para obtener más información, vea Examinar un modelo mediante el Visor de redes neuronales de Microsoft.
Si desea obtener más información, puede examinar los detalles del modelo mediante el Visor de árboles de contenido genérico de Microsoft. El contenido del modelo de un modelo de regresión logística incluye un nodo marginal que muestra todas las entradas usadas para el modelo y subredes para los atributos de predicción. Para obtener más información, consulte Contenido de modelos de minería de datos para modelos de regresión logística (Analysis Services - minería de datos).
Creación de predicciones
Una vez entrenado el modelo, puede crear consultas en el contenido del modelo para obtener los coeficientes de regresión y otros detalles, o puede usar el modelo para realizar predicciones.
Para obtener información general sobre cómo crear consultas en un modelo de minería de datos, consulte Consultas de minería de datos.
Para obtener ejemplos de consultas en un modelo de regresión logística, consulte Ejemplos de consultas de modelos de agrupación en clústeres.
Observaciones
No admite la obtención de detalles. Esto se debe a que la estructura de los nodos del modelo de minería de datos no se corresponde necesariamente con los datos subyacentes.
No admite la creación de dimensiones de minería de datos.
Admite el uso de modelos de minería de datos OLAP.
No admite el uso del lenguaje de marcado de modelos predictivos (PMML) para crear modelos de minería de datos.
Véase también
Contenido del modelo de minería de datos para modelos de regresión logística (Analysis Services - Minería de datos)
Referencia técnica del algoritmo de regresión logística de Microsoft
Ejemplos de consultas del modelo de regresión logística