Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
El Asistente para minería de datos de Microsoft SQL Server Analysis Services se inicia cada vez que se agrega una nueva estructura de minería de datos a un proyecto de minería de datos. El asistente le ayuda a elegir un origen de datos y a configurar una vista de origen de datos que define los datos que se van a usar para el análisis y, a continuación, le ayuda a crear un modelo inicial.
En la fase final del asistente, puede opcionalmente dividir sus datos en conjuntos de entrenamiento y pruebas, y habilitar características como el desglose.
Qué saber antes de empezar
Estas son las cosas que debe saber antes de iniciar el asistente.
¿Creará la estructura y los modelos de minería de datos a partir de una base de datos relacional o de un cubo existente en una base de datos OLAP?
¿Qué columnas contienen las claves que identifican de forma única un registro de casos?
¿Qué columnas o atributos desea usar para la predicción? ¿Qué columnas o atributos son adecuados para usar como entrada para el análisis?
¿Qué algoritmo debe usar? Los algoritmos proporcionados en SQL Server Analysis Services tienen características diferentes y generan resultados diferentes. Afortunadamente, no está limitado a un modelo para cada conjunto de datos, por lo que puede experimentar agregando diferentes modelos.
¿Necesita poder probar los modelos en un conjunto de datos unificado? Si es así, considere la posibilidad de usar la opción para reservar algunos datos para las pruebas. Puede elegir un porcentaje y limitarlo por un número especificado de filas si lo desea.
Iniciar el Asistente para minería de datos
Para usar el Asistente para minería de datos, debe haber abierto una solución en SQL Server Data Tools (SSDT) que contenga al menos un proyecto de minería de datos o OLAP.
Si la solución está lista para la minería de datos, simplemente puede hacer clic con el botón derecho en el nodo Estructuras de minería de datos en el Explorador de soluciones y seleccionar Nueva estructura de minería de datos para iniciar el asistente.
Si la solución no contiene ningún proyecto existente, puede agregar un nuevo proyecto de minería de datos. En el menú Archivo , seleccione Nuevo y, a continuación, seleccione Proyecto. Asegúrese de elegir la plantilla, Analysis Services Multidimensional and Data Mining Project.
También puede usar el Asistente para importación de Analysis Services para obtener metadatos de una solución de minería de datos existente. Sin embargo, no puede seleccionar los objetos individuales que se van a importar; se importa toda la base de datos, incluidos los cubos, las vistas del origen de datos, etc. Tenga en cuenta también que la nueva solución que se crea a través de la importación se configura automáticamente para usar la base de datos predeterminada local. Es posible que tenga que cambiar esto a otra instancia para poder procesar o examinar los objetos y, si va a importar desde una versión anterior de Analysis Services, es posible que tenga que actualizar las referencias a los proveedores.
A continuación, creará la estructura de minería de datos y un modelo de minería de datos asociado. También puede crear solo la estructura de minería de datos y agregar modelos más adelante, pero generalmente es más fácil crear primero un modelo de prueba.
Modelos de minería de datos relacionales frente a OLAP
La siguiente opción importante que tiene es si se debe usar un origen de datos relacional o basar el modelo en datos multidimensionales (OLAP).
El Asistente para minería de datos se bifurca en dos caminos en este momento, en función de si el origen de datos es relacional o en un cubo de datos. Todo lo demás, excepto el proceso de selección de datos, es lo mismo: la elección del algoritmo, la capacidad de agregar un conjunto de retención de datos, etc., pero seleccionar datos de cubo es un poco más complejo que usar datos relacionales. (También obtendrá algunas opciones adicionales al final si crea un modelo basado en un cubo).
Consulte los temas siguientes para ver un tutorial de cada opción con más detalle:
Crear una estructura de minería de datos relacional
Le guiará por las decisiones que tome al crear un modelo de minería de datos relacional.
Crear una estructura de minería de datos OLAP
Describe las opciones y selecciones adicionales que se deben realizar al elegir datos de un cubo OLAP.
Nota:
No es necesario tener un cubo o una base de datos OLAP para realizar la minería de datos. A menos que los datos ya estén almacenados en un cubo o desee extraer dimensiones OLAP o los resultados de agregaciones o cálculos OLAP, se recomienda usar una tabla relacional o un origen de datos para la minería de datos.
Elección de un algoritmo
A continuación, debe decidir qué algoritmo usar para procesar los datos. Esta decisión puede ser difícil de tomar. Cada algoritmo proporcionado en Analysis Services tiene características diferentes y genera resultados diferentes, por lo que puede experimentar e probar varios modelos diferentes antes de determinar cuál es más adecuado para los datos y el problema empresarial. Consulte el tema siguiente para obtener una explicación de las tareas a las que cada algoritmo es más adecuado:
Algoritmos de minería de datos (Analysis Services - Minería de datos)
De nuevo, puede crear varios modelos mediante algoritmos diferentes o cambiar parámetros para que los algoritmos creen modelos diferentes. No está bloqueado en su elección de algoritmo y se recomienda crear varios modelos diferentes en los mismos datos.
Definir los datos usados para el modelado
Además de elegir los datos de un origen, debe especificar cuál de la tabla de la vista del origen de datos contiene los datos de caso. La tabla de casos se usará para entrenar el modelo de minería de datos y, como tal, debe contener las entidades que desea analizar: por ejemplo, los clientes y la información demográfica. Cada caso debe ser único y debe ser identificable por una clave de caso.
Además de especificar la tabla de casos, puede incluir tablas anidadas en sus datos. Una tabla anidada normalmente contiene información adicional sobre las entidades en la tabla de casos, como las transacciones realizadas por el cliente o atributos que tienen una relación de varios a uno con la entidad. Por ejemplo, una tabla anidada unida a la tabla de casos Customers podría incluir una lista de productos adquiridos por cada cliente. En un modelo que analiza el tráfico a un sitio web, la tabla anidada puede incluir las secuencias de páginas que visitó el usuario. Para obtener más información, consulte Tablas anidadas (Analysis Services - Minería de datos)
Características adicionales
Para ayudarle a elegir los datos adecuados y configurar los orígenes de datos correctamente, el Asistente para minería de datos proporciona estas características adicionales:
Auto -detection de tipos de datos: el asistente examinará la unicidad y la distribución de los valores de las columnas y, a continuación, recomendará el mejor tipo de datos y sugerirá un tipo de uso adecuado para los datos. Puede invalidar estas sugerencias seleccionando valores de una lista.
Sugerencias para variables: puede hacer clic en un cuadro de diálogo e iniciar un analizador que calcule las correlaciones entre las columnas incluidas en el modelo, y determine si alguna columna puede ser un predictor del atributo de resultado, dada la configuración del modelo hasta ahora. Puede invalidar estas sugerencias escribiendo valores diferentes.
Selección de características: la mayoría de los algoritmos detectarán automáticamente las columnas que son buenos predictores y las usarán preferentemente. En las columnas que contienen demasiados valores, se aplicará la selección de características para reducir la cardinalidad de los datos y mejorar las posibilidades de encontrar un patrón significativo. Puede afectar al comportamiento de la selección de características mediante los parámetros del modelo.
Segmentación automática de cubos: si el modelo de minería de datos se basa en un origen de datos OLAP, se proporciona automáticamente la capacidad de segmentar el modelo mediante atributos de cubo. Esto resulta útil para crear modelos basados en subconjuntos de datos de cubos.
Completar el asistente
El último paso del asistente es asignar un nombre a la estructura de minería y al modelo de minería asociado. En función del tipo de modelo que haya creado, es posible que también tenga las siguientes opciones importantes:
Si selecciona Permitir obtención de detalles, la capacidad de obtención de detalles está habilitada en el modelo. Mediante el análisis detallado, los usuarios que tienen los permisos adecuados pueden explorar los datos de origen que se usan para construir el modelo.
Si va a crear un modelo OLAP, puede seleccionar las opciones, Crear un nuevo cubo de minería de datos o Crear una dimensión de minería de datos. Ambas opciones facilitan la exploración del modelo completado y la obtención de detalles de los datos subyacentes.
Después de completar el Asistente para minería de datos, use el Diseñador de minería de datos para modificar la estructura y los modelos de minería de datos para ver la precisión del modelo, ver las características de la estructura y los modelos, o bien realizar predicciones mediante los modelos.
Contenido relacionado
Para obtener más información sobre las decisiones que debe tomar al crear un modelo de minería de datos, consulte los vínculos siguientes:
Algoritmos de minería de datos (Analysis Services - Minería de datos)
Tipos de contenido (minería de datos)
Tipos de datos (minería de datos)
Selección de características (minería de datos)
Valores que faltan (Analysis Services - Minería de datos)
Exploración detallada en modelos de minería de datos
Véase también
Herramientas de minería de datos
Soluciones de minería de datos