Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En este tutorial aprenderá a crear, entrenar y explorar modelos de minería de datos utilizando el lenguaje de consulta Extensiones de minería de datos (DMX). A continuación, estos modelos de minería de datos se utilizarán para crear predicciones que describen los productos que tienden a adquirirse simultáneamente.
Los modelos de minería de datos se crearán a partir de los datos contenidos en la base de datos de ejemplo AdventureWorksDW2012 , que almacena los datos de la empresa ficticia Adventure Works Cycles. Adventure Works Cycles es una gran empresa multinacional de fabricación. La empresa fabrica y vende bicicletas de metal y de materiales compuestos en los mercados de Norteamérica, Europa y Asia. Su sede central de operaciones se encuentra en Bothell, Washington, con 290 empleados, y tiene distribuidos varios equipos regionales de ventas en toda su base de mercado internacional.
Escenario del tutorial
Adventure Works Cycles ha decidido crear una aplicación personalizada que emplea la funcionalidad de minería de datos para predecir qué tipos de productos tienden a comprar sus clientes al mismo tiempo. El objetivo de la aplicación personalizada es poder especificar un conjunto de productos y predecir los productos adicionales que se adquirirán con los productos especificados. Adventure Works Cycles usará esta información para agregar una característica de "sugerir" a su sitio web y también para organizar mejor la forma en que presentan información a sus clientes.
Microsoft SQL Server Analysis Services proporciona varias herramientas que se pueden usar para realizar esta tarea:
El lenguaje de consulta DMX
Algoritmo de asociación de Microsoft
Editor de Power Query en SQL Server Management Studio
Extensiones de minería de datos (DMX) es un lenguaje de consulta proporcionado por Analysis Services que puede usar para crear y trabajar con modelos de minería de datos. El algoritmo de asociación de Microsoft crea modelos que pueden predecir los productos que probablemente se compren juntos.
El objetivo de este tutorial es proporcionar las consultas DMX que se utilizarán en la aplicación personalizada.
Para obtener más información:Soluciones de minería de datos
Estructura de minería de datos y modelos de minería de datos
Antes de empezar a crear instrucciones DMX, es importante comprender los objetos principales que Analysis Services usa para crear modelos de minería de datos. La estructura de minería de datos es una estructura de datos que define el dominio de datos desde el que se compilan los modelos de minería de datos. Una única estructura de minería de datos puede contener varios modelos de minería de datos que comparten el mismo dominio. Un modelo de minería de datos aplica un algoritmo de modelo de minería a los datos, que se representan en una estructura de minería de datos.
Las unidades de creación de la estructura de minería de datos son las columnas de la estructura de minería de datos, que describen los datos que contiene el origen de datos. Estas columnas contienen información como el tipo de datos, el tipo de contenido y el modo en que se distribuyen los datos.
Las columnas de los modelos de minería de datos deben incluir la columna de clave descrita en la estructura de minería de datos, así como un subconjunto de las columnas restantes. El modelo de minería de datos define el uso de cada columna y el algoritmo utilizado para crearlo. Por ejemplo, en DMX puede especificar que una columna sea una columna de clave o una columna PREDICT. Si una columna no se especifica, se considera que es una columna de entrada.
En DMX, hay dos formas de crear modelos de minería de datos. Puede crear la estructura de minería de datos y el modelo de minería de datos asociado juntos usando la instrucción CREATE MINING MODEL o bien, puede crear primero una estructura de minería de datos usando la instrucción CREATE MINING STRUCTURE y, a continuación, agregar un modelo de minería de datos a la estructura usando la instrucción ALTER STRUCTURE. Estos métodos se describen a continuación.
CREATE MINING MODEL
Utilice esta instrucción para crear una estructura de minería de datos y el modelo de minería de datos asociado juntos, con el mismo nombre. Se anexa "Structure" al nombre del modelo de minería de datos para diferenciarlo de la estructura de minería de datos.
Esta instrucción resulta útil si crea una estructura de minería de datos que incluirá un único modelo de minería de datos.
Para obtener más información, vea CREATE MINING MODEL (DMX).
CREAR ESTRUCTURA DE MINERÍA
Utilice esta instrucción para crear una nueva estructura de minería de datos sin ningún modelo.
Cuando usa la instrucción CREATE MINING STRUCTURE, también puede crear un conjunto de datos de exclusiones que se puede utilizar para probar cualquier modelo que esté basado en la misma estructura de minería de datos.
Para obtener más información, vea CREATE MINING STRUCTURE (DMX).
ALTER MINING STRUCTURE
Utilice esta instrucción para agregar un modelo de minería de datos a una estructura de minería de datos que ya existe en el servidor.
Hay varios motivos por los que puede desear agregar más de un modelo de minería de datos en una única estructura de minería de datos. Por ejemplo, podría crear varios modelos de minería de datos utilizando algoritmos distintos para ver cuál funciona mejor. O bien, podría crear varios modelos de minería de datos usando el mismo algoritmo, pero con un parámetro establecido de forma distinta para cada uno de ellos, con el fin de encontrar el mejor valor para el parámetro.
Para obtener más información, vea ALTER MINING STRUCTURE (DMX).
Puesto que creará una estructura de minería de datos que contiene varios modelos de minería de datos, utilizará el segundo método en este tutorial.
Para obtener más información
Referencia de extensiones de minería de datos (DMX), descripción de la instrucción SELECT de DMX, estructura y uso de consultas de predicción DMX
Aprendizaje
El tutorial está compuesto por las lecciones siguientes:
Lección 1: Crear la estructura de minería de Market Basket
En esta lección aprenderá a usar la instrucción CREATE para crear estructuras de minería de datos.
Lección 2: Agregar modelos de minería a la estructura de minería de Market Basket
En esta lección aprenderá a usar la instrucción ALTER para agregar modelos de minería de datos a una estructura de minería de datos.
Lección 3: Procesar la estructura de minería de Market Basket
En esta lección aprenderá a usar la instrucción INSERT INTO para procesar estructuras de minería de datos y sus modelos de minería de datos asociados.
Lección 4: Ejecutar predicciones de Market Basket
En esta lección aprenderá a usar la instrucción PREDICTION JOIN para crear predicciones basadas en modelos de minería de datos.
Requisitos
Antes de hacer este tutorial, asegúrese de que los siguientes componentes estén instalados:
Microsoft SQL Server
Microsoft SQL Server Analysis Services
La base de datos AdventureWorksDW2012
Con el fin de mejorar la seguridad, las bases de datos de ejemplo no se instalan de forma predeterminada. Para instalar las bases de datos de ejemplo oficiales para Microsoft SQL Server, vaya a https://www.CodePlex.com/MSFTDBProdSamples o en la página principal ejemplos y proyectos de comunidad de Microsoft SQL Server en la sección Ejemplos de productos de Microsoft SQL Server. Haga clic en Databasesy, a continuación en la pestaña Releases y seleccione las bases de datos que desee.
Nota:
Para consultar los tutoriales, se recomienda agregar los botones Siguiente y Anterior a la barra de herramientas del visor de documentos.
Consulte también
Tutorial DMX de Bike Buyer
Tutorial básico de minería de datos
Lección 3: Crear un escenario de cesta de mercado (Tutorial intermedio de minería de datos)