Compartir a través de


Modelos de minería (Analysis Services - Minería de datos)

Un modelo de minería de datos se crea aplicando un algoritmo a los datos, pero es más que un algoritmo o un contenedor de metadatos: es un conjunto de datos, estadísticas y patrones que se pueden aplicar a nuevos datos para generar predicciones y realizar inferencias sobre las relaciones.

En esta sección se explica qué es un modelo de minería de datos y para qué se puede usar: la arquitectura básica de modelos y estructuras, las propiedades de los modelos de minería de datos y las formas de crear y trabajar con modelos de minería de datos.

Arquitectura del modelo de minería

Definición de modelos de minería de datos

Propiedades del modelo de minería

Columnas del modelo de minería de datos

Procesamiento de modelos de minería de datos

Visualización y consulta de modelos de minería de datos

Arquitectura de modelos de minería de datos

Un modelo de minería de datos obtiene datos de una estructura de minería de datos y, a continuación, analiza esos datos mediante un algoritmo de minería de datos. La estructura de minería y el modelo de minería son objetos separados. La estructura de minería almacena información que define la fuente de datos. Un modelo de minería de datos almacena información derivada del procesamiento estadístico de los datos, como los patrones encontrados como resultado del análisis.

Un modelo de minería está vacío hasta que se hayan procesado y analizado los datos proporcionados por la estructura de minería. Una vez procesado un modelo de minería de datos, contiene metadatos, resultados y enlaces a la estructura de minería de datos.

el modelo contiene metadatos, patrones y enlaces

Los metadatos especifican el nombre del modelo y el servidor donde se almacena, así como una definición del modelo, incluidas las columnas de la estructura de minería de datos que se usaron en la creación del modelo, las definiciones de los filtros que se aplicaron al procesar el modelo y el algoritmo que se usó para analizar los datos. Todas estas opciones,las columnas de datos y sus tipos de datos, filtros y algoritmos, tienen una influencia eficaz en los resultados del análisis.

Por ejemplo, puede usar los mismos datos para crear varios modelos, usando quizás un algoritmo de agrupación en clústeres, un algoritmo de árbol de decisión y un algoritmo Bayes naïve. Cada tipo de modelo crea un conjunto diferente de patrones, conjuntos de elementos, reglas o fórmulas, que puede usar para realizar predicciones. Por lo general, cada algoritmo analiza los datos de una manera diferente, por lo que el contenido del modelo resultante también se organiza en estructuras diferentes. En un tipo de modelo, los datos y patrones se pueden agrupar en clústeres; en otro tipo de modelo, los datos se pueden organizar en árboles, ramas y las reglas que dividen y definen.

El modelo también se ve afectado por los datos utilizados para el entrenamiento: incluso los modelos entrenados en la misma estructura de minería de datos pueden producir resultados diferentes si se filtran los datos de forma distinta o se utilizan diferentes valores iniciales durante el análisis. Sin embargo, los datos reales no se almacenan en el modelo; solo se guardan estadísticas de resumen, mientras que los datos reales residen en la estructura de minería. Si ha creado filtros en los datos al entrenar el modelo, también se guardan las definiciones de filtro con el objeto de modelo.

El modelo contiene un conjunto de vinculaciones, que apuntan a los datos en caché almacenados en la estructura de minería. Si los datos se han almacenado en caché en la estructura y no se han borrado después del procesamiento, estos enlaces le permiten profundizar desde los resultados hasta los casos que admiten los resultados. Sin embargo, los datos reales se almacenan en la caché de estructuras, no en el modelo.

Arquitectura del modelo de minería

Definición de modelos de minería de datos

Para crear un modelo de minería de datos, siga estos pasos generales:

  • Cree la estructura de minería de datos subyacente e incluya las columnas de datos que podrían ser necesarias.

  • Seleccione el algoritmo más adecuado para la tarea analítica.

  • Elija las columnas de la estructura que se van a usar en el modelo y especifique cómo se deben usar,qué columna contiene el resultado que desea predecir, qué columnas son solo de entrada, etc.

  • Opcionalmente, establezca parámetros para ajustar el procesamiento por el algoritmo.

  • Rellene el modelo con datos mediante el procesamiento de la estructura y el modelo.

Analysis Services proporciona las siguientes herramientas para ayudarle a administrar los modelos de minería de datos:

  • El Asistente para minería de datos le ayuda a crear una estructura y un modelo de minería de datos relacionado. Este es el método más fácil de usar. El asistente crea automáticamente la estructura de minería de datos necesaria y le ayuda con la configuración de las opciones importantes.

  • Se puede usar una instrucción DMX CREATE MODEL para definir un modelo. La estructura necesaria se crea automáticamente como parte del proceso; por lo tanto, no se puede reutilizar una estructura existente con este método. Use este método si ya sabe exactamente qué modelo desea crear o si desea crear modelos.

  • La instrucción DMX ALTER STRUCTURE ADD MODEL se puede usar para agregar un nuevo modelo de minería de datos a una estructura existente. Use este método si desea experimentar con modelos diferentes basados en el mismo conjunto de datos.

También puede crear modelos de minería de datos mediante programación, mediante AMO o XML/A, o mediante otros clientes, como el cliente de minería de datos para Excel. Para obtener más información, consulte los temas siguientes:

Arquitectura del modelo de minería de datos

Propiedades del modelo de minería de datos

Cada modelo de minería de datos tiene propiedades que definen el modelo y sus metadatos. Estos incluyen el nombre, la descripción, la fecha en que se procesó por última vez el modelo, los permisos en el modelo y los filtros de los datos que se usan para el entrenamiento.

Cada modelo de minería también tiene propiedades derivadas de la estructura minera que describen las columnas de datos utilizadas por el modelo. Si alguna columna usada por el modelo es una tabla anidada, la columna también puede tener aplicado un filtro independiente.

Además, cada modelo de minería de datos contiene dos propiedades especiales: Algorithm y Usage.

  • Propiedad Algorithm Especifica el algoritmo que se usa para crear el modelo. Los algoritmos disponibles dependen del proveedor que use. Para obtener una lista de los algoritmos que se incluyen con SQL Server Analysis Services, vea Algoritmos de minería de datos (Analysis Services - Minería de datos). La Algorithm propiedad se aplica al modelo de minería de datos y solo se puede establecer una vez para cada modelo. Puede cambiar el algoritmo más adelante, pero algunas columnas del modelo de minería de datos podrían no ser válidas si no son compatibles con el algoritmo que elija. Siempre debe procesar nuevamente el modelo tras un cambio en esta propiedad.

  • Propiedad Usage Define cómo usa el modelo cada columna. Puede definir el uso de columnas como Input, Predict, Predict Onlyo Key. La Usage propiedad se aplica a columnas individuales del modelo de minería de datos y debe establecerse individualmente para cada columna que se incluye en un modelo. Si la estructura contiene una columna que no se usa en el modelo, el uso se establece en Ignore. Algunos ejemplos de datos que puede incluir en la estructura de minería de datos, pero que no se usan en el análisis, pueden ser nombres de cliente o direcciones de correo electrónico. De este modo, puede consultarlos más adelante sin tener que incluirlos durante la fase de análisis.

Puede cambiar el valor de las propiedades de un modelo de minería después de crearlo. Sin embargo, cualquier cambio, incluso al nombre del modelo de minería, requiere que se vuelva a procesar el modelo. Después de volver a procesar el modelo, es posible que vea resultados diferentes.

Arquitectura de modelos de minería

Columnas del modelo de minería

El modelo de minería de datos contiene columnas de datos que se obtienen de las columnas definidas en la estructura de minería de datos. Puede elegir qué columnas de la estructura de minería de datos se van a usar en el modelo, y puede crear copias de las columnas de la estructura de minería de datos y cambiar su nombre o cambiar su uso. Como parte del proceso de creación de modelos, también debe definir el uso de la columna por el modelo. Esto incluye información como si la columna es una clave, si se utiliza para predicciones, o si puede ser ignorada por el algoritmo.

Mientras crea un modelo, en lugar de agregar automáticamente cada columna de datos que está disponible, se recomienda revisar los datos de la estructura cuidadosamente e incluir en el modelo solo las columnas que tengan sentido para el análisis. Por ejemplo, debe evitar incluir varias columnas que repitan los mismos datos y debe evitar el uso de columnas que tengan principalmente valores únicos. Si cree que no se debe usar una columna, no es necesario eliminarla de la estructura de minería de datos ni del modelo de minería de datos; en su lugar, solo puede establecer una marca en la columna que especifica que se debe omitir al compilar el modelo. Esto significa que la columna permanecerá en la estructura de minería, pero no se utilizará en el modelo. Si ha habilitado el acceso detallado desde el modelo a la estructura de minería, puede recuperar la información de la columna más adelante.

En función del algoritmo que elija, algunas columnas de la estructura de minería de datos podrían ser incompatibles con determinados tipos de modelo o podrían dar resultados deficientes. Por ejemplo, si los datos contienen datos numéricos continuos, como una columna Income, y el modelo requiere valores discretos, es posible que tenga que convertir los datos en intervalos discretos o quitarlos del modelo. En algunos casos, el algoritmo convertirá o clasificará automáticamente los datos en categorías, pero es posible que los resultados no siempre sean lo que desee o espere. Considere la posibilidad de realizar copias adicionales de la columna y probar modelos diferentes. También puede establecer marcas en las columnas individuales para indicar dónde se requiere el procesamiento especial. Por ejemplo, si los datos contienen valores NULL, puede usar una marca de modelado para controlar el control. Si desea que una columna determinada se considere como un regresor en un modelo, puede hacerlo con una marca de modelado.

Después de crear el modelo, puede realizar cambios como agregar o quitar columnas, o cambiar el nombre del modelo. Sin embargo, cualquier cambio, incluso solo para los metadatos del modelo, requiere que se vuelva a procesar el modelo.

Arquitectura del modelo de minería

Procesamiento de modelos de minería de datos

Un modelo de minería de datos es un objeto vacío hasta que se procesa. Al procesar un modelo, los datos almacenados en caché por la estructura se pasan a través de un filtro, si se ha definido uno en el modelo y lo analiza el algoritmo. El algoritmo calcula un conjunto de estadísticas de resumen que describe los datos, identifica las reglas y patrones dentro de los datos y, a continuación, usa estas reglas y patrones para rellenar el modelo.

Una vez procesado, el modelo de minería de datos contiene una gran cantidad de información sobre los datos y los patrones encontrados a través del análisis, incluidas las estadísticas, las reglas y las fórmulas de regresión. Puede usar los visores personalizados para examinar esta información o puede crear consultas de minería de datos para recuperar esta información y usarla para el análisis y la presentación.

Arquitectura del modelo de minería de datos

Visualización y consulta de modelos de minería de datos

Después de procesar un modelo, puede explorarlo mediante los visores personalizados que se proporcionan en SQL Server Data Tools (SSDT) y SQL Server Management Studio. Para

También puede crear consultas en el modelo de minería de datos para realizar predicciones, o para recuperar metadatos del modelo o los patrones creados por el modelo. Las consultas se crean mediante extensiones de minería de datos (DMX).

Temas Enlaces
Obtenga información sobre cómo crear estructuras de minería de datos que puedan admitir varios modelos de minería de datos. Obtenga información sobre el uso de columnas en modelos. Columnas de la estructura de minería de datos

Columnas del modelo de minería de datos

Tipos de contenido (minería de datos)
Obtenga información sobre distintos algoritmos y cómo afecta la elección del algoritmo al contenido del modelo. Contenido del modelo de minería de datos (Servicios de Análisis - Minería de datos)

Algoritmos de minería de datos (Analysis Services - Minería de datos)
Aprenda ahora que puede establecer propiedades en el modelo que afecta a su composición y comportamiento. Propiedades del modelo de minería

Indicadores de Modelado (Minería de Datos)
Obtenga información sobre las interfaces programables para la minería de datos. Desarrollo con objetos de administración de análisis (AMO)

Referencia de extensiones de minería de datos (DMX)
Aprenda a usar los visores de minería de datos personalizados en Analysis Services. Visores de modelos de minería de datos
Vea ejemplos de los distintos tipos de consultas que puede usar en los modelos de minería de datos. Consultas de minería de datos

Use los vínculos siguientes para obtener información más específica sobre cómo trabajar con modelos de minería de datos

Tarea Vínculo
Agregar y eliminar modelos de minería de datos Agregar un modelo de minería de datos a una estructura de minería de datos existente

Eliminar un modelo de minería de datos de una estructura de minería de datos
Trabajar con columnas del modelo de minería de datos Excluir una columna de un modelo de minería de datos

Crear un alias para una columna de modelo

Cambiar la discretización de una columna en un modelo de minería de datos

Especificar una columna que se va a usar como regresor en un modelo
Modificar las propiedades del modelo Cambiar las propiedades de un modelo de minería de datos

Aplicar un filtro a un modelo de minería de datos

Eliminar un filtro de un modelo de minería de datos

Habilitar Drillthrough para un modelo de minería

Ver o cambiar parámetros de algoritmo
Copiar. mover o administrar modelos Crear una copia de un modelo de minería

Copiar una vista de un modelo de minería de datos

EXPORT (DMX)

IMPORT (DMX)
Rellenar modelos con datos o actualizar datos en un modelo Procesar un modelo de minería de datos
Trabajar con modelos OLAP Crear una dimensión de minería de datos

Véase también

Objetos de base de datos (Analysis Services - Datos multidimensionales)