Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Un algoritmo de minería de datos es un conjunto de heurística y cálculos que crean un modelo de minería de datos a partir de datos. Para crear un modelo, el algoritmo analiza primero los datos que proporciona, buscando tipos específicos de patrones o tendencias. El algoritmo usa los resultados de este análisis para definir los parámetros óptimos para crear el modelo de minería de datos. A continuación, estos parámetros se aplican en todo el conjunto de datos para extraer patrones accionables y estadísticas detalladas.
El modelo de minería de datos que crea un algoritmo a partir de los datos puede tener varias formas, entre las que se incluyen:
Conjunto de clústeres que describen cómo están relacionados los casos de un conjunto de datos.
Árbol de decisión que predice un resultado y describe cómo afectan los distintos criterios a ese resultado.
Modelo matemático que prevé las ventas.
Conjunto de reglas que describen cómo se agrupan los productos en una transacción y las probabilidades de que los productos se compren juntos.
Microsoft SQL Server Analysis Services proporciona varios algoritmos para su uso en las soluciones de minería de datos. Estos algoritmos son implementaciones de algunas de las metodologías más populares que se usan en la minería de datos. Todos los algoritmos de minería de datos de Microsoft se pueden personalizar y son totalmente programables mediante las API proporcionadas o mediante los componentes de minería de datos de SQL Server Integration Services.
También puede usar algoritmos de terceros que cumplan con la especificación OLE DB para minería de datos o desarrollar algoritmos personalizados que se puedan registrar como servicios y, a continuación, usarse en el marco de minería de datos de SQL Server.
Elección del algoritmo correcto
Elegir el mejor algoritmo que se va a usar para una tarea analítica específica puede ser un desafío. Aunque puede usar algoritmos diferentes para realizar la misma tarea empresarial, cada algoritmo genera un resultado diferente y algunos algoritmos pueden generar más de un tipo de resultado. Por ejemplo, puede usar el algoritmo de árboles de decisión de Microsoft no solo para la predicción, sino también como una manera de reducir el número de columnas de un conjunto de datos, ya que el árbol de decisión puede identificar columnas que no afectan al modelo de minería de datos final.
Elección de un algoritmo por tipo
Analysis Services incluye los siguientes tipos de algoritmo:
Los algoritmos de clasificación predicen una o varias variables discretas, en función de los demás atributos del conjunto de datos.
Los algoritmos de regresión predicen una o varias variables continuas, como beneficios o pérdidas, en función de otros atributos del conjunto de datos.
Los algoritmos de segmentación dividen los datos en grupos o clústeres de elementos que tienen propiedades similares.
Los algoritmos de asociación buscan correlaciones entre distintos atributos de un conjunto de datos. La aplicación más común de este tipo de algoritmo es crear reglas de asociación, que se pueden usar en un análisis de cesta de mercado.
Los algoritmos de análisis de secuencia resumen secuencias frecuentes o episodios en datos, como un flujo de ruta de acceso web.
Sin embargo, no hay ninguna razón por la que deberías limitarte a un solo algoritmo en tus soluciones. A veces, los analistas experimentados usarán un algoritmo para determinar las entradas más eficaces (es decir, variables) y, a continuación, aplicar un algoritmo diferente para predecir un resultado específico basado en esos datos. La minería de datos de SQL Server permite crear varios modelos en una sola estructura de minería de datos, por lo que dentro de una única solución de minería de datos puede usar un algoritmo de agrupación en clústeres, un modelo de árboles de decisión y un modelo Bayes naïve para obtener vistas diferentes de los datos. También puede usar varios algoritmos dentro de una única solución para realizar tareas independientes: por ejemplo, puede usar la regresión para obtener previsiones financieras y usar un algoritmo de red neuronal para realizar un análisis de factores que influyen en las ventas.
Elección de un algoritmo por tarea
Para ayudarle a seleccionar un algoritmo para su uso con una tarea específica, en la tabla siguiente se proporcionan sugerencias para los tipos de tareas para los que se usa tradicionalmente cada algoritmo.
| Ejemplos de tareas | Algoritmos de Microsoft que se van a usar |
|---|---|
|
Predicción de un atributo discreto Marcar a los clientes en una lista de compradores potenciales como buenos o malos candidatos. Calcule la probabilidad de que un servidor produzca un error en los próximos 6 meses. Clasifique los resultados de los pacientes y explore los factores relacionados. |
Algoritmo de árboles de decisión de Microsoft Algoritmo bayes naive de Microsoft Algoritmo de agrupación en clústeres de Microsoft Algoritmo de red neuronal de Microsoft |
|
Predicción de un atributo continuo Previsión de las ventas del próximo año. Predicción de visitantes del sitio dadas tendencias históricas y estacionales pasadas. Generar una puntuación de riesgo dada la demografía. |
Algoritmo de árboles de decisión de Microsoft Algoritmo de serie temporal de Microsoft Algoritmo de regresión lineal de Microsoft |
|
Predicción de una secuencia Realice el análisis de la secuencia de clics del sitio web de una empresa. Analice los factores que conducen a errores del servidor. Capture y analice secuencias de actividades durante las visitas externas, para formular procedimientos recomendados en torno a actividades comunes. |
Algoritmo de agrupación en clústeres de secuencia de Microsoft |
|
Búsqueda de grupos de elementos comunes en transacciones Usa el análisis de cesta de la compra para determinar la colocación de productos. Sugerir productos adicionales a un cliente para su compra. Analice los datos de la encuesta de los visitantes a un evento, para encontrar qué actividades o cabinas se correlacionaron, para planear actividades futuras. |
Algoritmo de asociación de Microsoft Algoritmo de árboles de decisión de Microsoft |
|
Búsqueda de grupos de elementos similares Cree grupos de perfiles de riesgo de pacientes basados en atributos como datos demográficos y comportamientos. Analice a los usuarios por sus patrones de navegación y compra. Identifique los servidores que tienen características de uso similares. |
Algoritmo de agrupación en clústeres de Microsoft Algoritmo de agrupación en clústeres de secuencia de Microsoft |
Contenido relacionado
En la tabla siguiente se proporcionan vínculos a recursos de aprendizaje para cada uno de los algoritmos de minería de datos que se proporcionan en Analysis Services:
Tareas relacionadas
| tema | Descripción |
|---|---|
| Determinación del algoritmo usado por un modelo de minería de datos | Consultar los parámetros usados para crear un modelo de minería |
| Creación de un algoritmo de Plug-In personalizado | Algoritmos de complemento |
| Exploración de un modelo mediante un visor específico del algoritmo | Visores de modelos de minería de datos |
| Visualización del contenido de un modelo mediante un formato de tabla genérico | Examinar un modelo mediante el Visor de árbol de contenido genérico de Microsoft |
| Obtenga información sobre cómo configurar los datos y usar algoritmos para crear modelos |
Estructuras de minería (Servicios de Análisis - Minería de Datos) Modelos de minería de datos (Analysis Services - Data Mining) |