Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Puede usar marcas de modelado en SQL Server Analysis Services para proporcionar información adicional a un algoritmo de minería de datos sobre los datos definidos en una tabla de casos. El algoritmo puede usar esta información para crear un modelo de minería de datos más preciso.
Algunas marcas de modelado se definen en el nivel de la estructura de minería de datos, mientras que otras se definen en el nivel de la columna del modelo de minería de datos. Por ejemplo, la NOT NULL marca de modelado se usa con columnas de estructura de minería de datos. Puede definir marcas de modelado adicionales en las columnas del modelo de minería de datos, en función del algoritmo que use para crear el modelo.
Nota:
Los complementos de terceros pueden tener otras marcas de modelado, además de las definidas previamente por Analysis Services.
Lista de marcas de modelado
En la lista siguiente se describen las marcas de modelado que se admiten en Analysis Services. Para obtener información sobre las marcas de modelado compatibles con algoritmos específicos, consulte el tema de referencia técnica del algoritmo que se usó para crear el modelo.
NOT NULL
Indica que los valores de la columna de atributo nunca deben contener un valor NULL. Se producirá un error si Analysis Services encuentra un valor NULL para esta columna de atributo durante el proceso de entrenamiento del modelo.
MODEL_EXISTENCE_ONLY
Indica que la columna se tratará como con dos estados: Missing y Existing. Si el valor es NULL, se trata como Falta. La bandera MODEL_EXISTENCE_ONLY se aplica al atributo predecible y es compatible con la mayoría de los algoritmos.
En efecto, establecer la marca MODEL_EXISTENCE_ONLY para True cambiar la representación de los valores de forma que solo haya dos estados: Missing y Existing. Todos los estados que no faltan se combinan en un único Existing valor.
Un uso típico de esta marca de modelado sería en atributos para los que el NULL estado tiene un significado implícito y el valor explícito del NOT NULL estado podría no ser tan importante como el hecho de que la columna tenga ningún valor. Por ejemplo, una columna [DateContractSigned] podría ser NULL si un contrato nunca se firmó y NOT NULL si el contrato se firmó. Por lo tanto, si el propósito del modelo es predecir si se firmará un contrato, puede usar la marca MODEL_EXISTENCE_ONLY para omitir el valor de fecha exacto en los NOT NULL casos y distinguir solo entre los casos en los que un contrato es Missing o Existing.
Nota:
Falta es un estado especial utilizado por el algoritmo y difiere del valor de texto "Missing" en una columna. Para obtener más información, consulte Valores que faltan (Analysis Services - Minería de datos).
REGRESSOR
Indica que la columna es candidata para usarse como un regresor durante el procesamiento. Esta marca se define en una columna de modelo de minería de datos y solo se puede aplicar a las columnas que tienen un tipo de datos numérico continuo. Para obtener más información sobre el uso de esta marca, vea la sección de este tema Usos de la marca de modelado REGRESSOR.
Visualización y cambio de marcas de modelado
Puede ver las marcas de modelado asociadas a una columna de estructura de minería de datos o columna de modelo en el Diseñador de minería de datos viendo las propiedades de la estructura o el modelo.
Para determinar qué marcas de modelado se han aplicado a la estructura de minería de datos actual, puede crear una consulta en el conjunto de filas del esquema de minería de datos que devuelve las marcas de modelado para solo las columnas de estructura mediante una consulta como la siguiente:
SELECT COLUMN_NAME, MODELING_FLAG
FROM $system.DMSCHEMA_MINING_STRUCTURE_COLUMNS
WHERE STRUCTURE_NAME = '<structure name>'
Puede agregar o cambiar las marcas de modelado usadas en un modelo mediante el Diseñador de minería de datos y la edición de las propiedades de las columnas asociadas. Estos cambios requieren que se vuelva a procesar la estructura o el modelo.
Puede especificar marcas de modelado en una nueva estructura de minería de datos o modelo de minería de datos mediante DMX o mediante scripts AMO o XMLA. Sin embargo, no puede cambiar las marcas de modelado usadas en un modelo de minería de datos y una estructura existentes mediante DMX. Debe crear un nuevo modelo de minería de datos mediante la sintaxis , ALTER MINING STRUCTURE....ADD MINING MODEL.
Usos de la marca de modelado REGRESSOR
Al establecer la marca de modelado REGRESSOR en una columna, se indica al algoritmo que la columna contiene posibles regresores. Los regresores reales que se usan en el modelo están determinados por el algoritmo. Se puede descartar un posible regresor si no modela el atributo de predicción.
Al compilar un modelo mediante el Asistente para minería de datos, todas las columnas de entrada continuas se marcan como posibles regresores. Por lo tanto, incluso si no establece explícitamente la marca REGRESSOR en una columna, es posible que la columna se use como un regresor en el modelo.
Puede determinar los regresores que se usaron realmente en el modelo procesado realizando una consulta en el conjunto de filas de esquema para el modelo de minería de datos, como se muestra en el ejemplo siguiente:
SELECT COLUMN_NAME, MODELING_FLAG
FROM $system.DMSCHEMA_MINING_COLUMNS
WHERE MODEL_NAME = '<model name>'
Nota Si modifica un modelo de minería de datos y cambia el tipo de contenido de una columna de continuo a discreto, debe cambiar manualmente la marca en la columna de minería de datos y, a continuación, volver a procesar el modelo.
Regresores en modelos de regresión lineal
Los modelos de regresión lineal se basan en el algoritmo de árboles de decisión de Microsoft. Incluso si no usa el algoritmo de regresión lineal de Microsoft, cualquier modelo de árbol de decisión puede contener un árbol o nodos que represente una regresión en un atributo continuo.
Por lo tanto, en estos modelos no es necesario especificar que una columna continua represente un regresor. El algoritmo de árboles de decisión de Microsoft dividirá el conjunto de datos en regiones con patrones significativos aunque no establezca la marca REGRESSOR en la columna. La diferencia es que, al establecer la marca de modelado, el algoritmo intentará buscar ecuaciones de regresión del siguiente formulario para ajustarse a los patrones de los nodos del árbol.
a*C1 + b*C2 + ...
A continuación, se calcula la suma de los valores residuales y, si la desviación es demasiado grande, se fuerza una división en el árbol.
Por ejemplo, si va a predecir el comportamiento de compra de los clientes mediante Income como atributo y establece la marca de modelado REGRESSOR en la columna, el algoritmo intentará primero ajustarse a los valores de Income mediante una fórmula de regresión estándar. Si la desviación es demasiado grande, la fórmula de regresión se abandona y el árbol se dividiría en algún otro atributo. A continuación, el algoritmo de árbol de decisión intentaría ajustar un regresor para el ingreso en cada una de las ramas después de la división.
Puede usar el parámetro FORCE_REGRESSOR para garantizar que el algoritmo usará un regresor determinado. Este parámetro se puede usar con el algoritmo árboles de decisión y el algoritmo de regresión lineal.
Tareas relacionadas
Use los vínculos siguientes para obtener más información sobre el uso de marcas de modelado.
| Tarea | Tema |
|---|---|
| Edición de marcas de modelado mediante el Diseñador de minería de datos | Ver o cambiar marcas de modelado (minería de datos) |
| Especificar una sugerencia al algoritmo para recomendar los regresores probables | Especificar una columna que se va a usar como regresor en un modelo |
| Consulte las marcas de modelado admitidas por algoritmos específicos (en la sección Marcas de modelado para cada tema de referencia de algoritmo) | Algoritmos de minería de datos (Analysis Services - Minería de datos) |
| Obtenga más información sobre las columnas de estructura de minería de datos y las propiedades que puede establecer en ellas. | Columnas de la estructura de minería de datos |
| Obtenga información sobre las columnas del modelo de minería de datos y las marcas de modelado que se pueden aplicar en el nivel de modelo. | Columnas del modelo de minería de datos |
| Consulte la sintaxis para trabajar con marcas de modelado en instrucciones DMX. | Marcas de modelado (DMX) |
| Comprender los valores que faltan y cómo trabajar con ellos | Valores que faltan (Analysis Services - Minería de datos) |
| Más información sobre la administración de modelos y estructuras y la configuración de propiedades de uso | Mover objetos de minería de datos |