Compartir a través de


Contenido del modelo de minería de datos para modelos de red neuronal (Analysis Services - Minería de datos)

En este tema se describe el contenido del modelo de minería de datos específico de los modelos que usan el algoritmo de red neuronal de Microsoft. Para obtener una explicación de cómo interpretar las estadísticas y la estructura compartidas por todos los tipos de modelo y las definiciones generales de términos relacionados con el contenido del modelo de minería de datos, vea Contenido del modelo de minería de datos (Analysis Services - Minería de datos).

Descripción de la estructura de un modelo de red neuronal

Cada modelo de red neuronal tiene un único nodo primario que representa el modelo y sus metadatos, y un nodo de estadísticas marginales (NODE_TYPE = 24) que proporciona estadísticas descriptivas sobre los atributos de entrada. El nodo de estadísticas marginales es útil porque resume información sobre las entradas, por lo que no es necesario consultar datos de los nodos individuales.

Debajo de estos dos nodos, hay al menos dos nodos más y puede ser muchos más, en función del número de atributos predecibles que tenga el modelo.

  • El primer nodo (NODE_TYPE = 18) siempre representa el nodo superior de la capa de entrada. Debajo de este nodo superior, puede encontrar nodos de entrada (NODE_TYPE = 21) que contienen los atributos de entrada reales y sus valores.

  • Cada uno de los nodos sucesivos contiene una subred diferente (NODE_TYPE = 17). Cada subred siempre contiene una capa oculta (NODE_TYPE = 19) y una capa de salida (NODE_TYPE = 20) para esa subred.

estructura del contenido del modelo para redes neuronales

La información de la capa de entrada es sencilla: el nodo superior de cada capa de entrada (NODE_TYPE = 18) sirve como organizador para una colección de nodos de entrada (NODE_TYPE = 21). El contenido de los nodos de entrada se describe en la tabla siguiente.

Cada subred (NODE_TYPE = 17) representa el análisis de la influencia de la capa de entrada en un atributo de predicción determinado. Si hay varias salidas predecibles, hay varias subredes. La capa oculta de cada subred contiene varios nodos ocultos (NODE_TYPE = 22) que contienen detalles sobre los pesos de cada transición que termina en ese nodo oculto concreto.

La capa de salida (NODE_TYPE = 20) contiene nodos de salida (NODE_TYPE = 23) que cada uno contiene valores distintos del atributo de predicción. Si el atributo de predicción es un tipo de datos numérico continuo, solo hay un nodo de salida para el atributo .

Nota:

El algoritmo de regresión logística usa un caso especial de una red neuronal que solo tiene un resultado predecible y potencialmente muchas entradas. La regresión logística no usa una capa oculta.

La manera más fácil de explorar la estructura de las entradas y subredes es usar el visor de árbol de contenido genérico de Microsoft. Puede hacer clic en cualquier nodo para expandirlo y ver los nodos secundarios, o ver los pesos y otras estadísticas que se encuentran en el nodo.

Para trabajar con los datos y ver cómo el modelo correlaciona las entradas con salidas, use el Visor de red neuronal de Microsoft. Con este visor personalizado, puede filtrar por atributos de entrada y sus valores, y ver gráficamente cómo afectan a las salidas. La información sobre herramientas del visor muestra la probabilidad y la elevación asociadas a cada par de entradas y valores de salida. Para obtener más información, vea Examinar un modelo mediante el Visor de redes neuronales de Microsoft.

Contenido del modelo para un modelo de red neuronal

En esta sección se proporcionan detalles y ejemplos solo para esas columnas del contenido del modelo de minería de datos que tienen especial relevancia para las redes neuronales. Para obtener información sobre las columnas de uso general del conjunto de filas de esquema, como MODEL_CATALOG y MODEL_NAME, que no se describen aquí o para obtener explicaciones de la terminología del modelo de minería de datos, vea Contenido del modelo de minería de datos (Analysis Services - Minería de datos).

CATÁLOGO_DE_MODELOS
Nombre de la base de datos donde se almacena el modelo.

MODEL_NAME
Nombre del modelo.

ATTRIBUTE_NAME
Nombres de los atributos que corresponden a este nodo.

Nodo Contenido
Raíz del modelo En blanco
Estadísticas marginales En blanco
Capa de entrada En blanco
Nodo de entrada Nombre del atributo de entrada
Capa oculta En blanco
Nodo oculto En blanco
Capa de salida En blanco
Nodo de salida Nombre del atributo de salida

NODE_NAME
El nombre del nodo. Esta columna contiene el mismo valor que NODE_UNIQUE_NAME.

NODO_NOMBRE_UNICO
Nombre único del nodo.

Para obtener más información sobre cómo los nombres e identificadores proporcionan información estructural sobre el modelo, consulte la sección Uso de nombres e identificadores de nodo.

TIPO_DE_NODO
Un modelo de red neuronal genera los siguientes tipos de nodo:

Id. de tipo de nodo Descripción
1 Modelo.
17 Nodo organizador de la subred.
18 Nodo organizador para la capa de entrada.
19 Nodo organizador de la capa oculta.
20 Nodo organizador para la capa de salida.
21 Nodo de atributo de entrada.
22 Nodo de capa oculta
23 Nodo de atributo de salida.
24 Nodo de estadísticas marginales.

NODE_CAPTION
Etiqueta o título asociado al nodo. En los modelos de red neuronal, siempre en blanco.

CARDINALIDAD_DE_HIJOS
Estimación del número de nodos hijos que tiene el nodo.

Nodo Contenido
Raíz del modelo Indica el recuento de nodos secundarios, que incluye al menos 1 red, 1 nodo marginal requerido y 1 capa de entrada necesaria. Por ejemplo, si el valor es 5, hay 3 subredes.
Estadísticas marginales Siempre es 0.
Capa de entrada Indica el número de pares de valores de atributo de entrada que usó el modelo.
Nodo de entrada Siempre es 0.
Capa oculta Indica el número de nodos ocultos creados por el modelo.
Nodo oculto Siempre es 0.
Capa de salida Indica el número de valores de salida.
Nodo de salida Siempre es 0.

NOMBRE_UNICO_PADRE
Nombre único del elemento primario del nodo. Se devuelve NULL para cualquier nodo en el nivel raíz.

Para obtener más información sobre cómo los nombres e identificadores proporcionan información estructural sobre el modelo, consulte la sección Uso de nombres e identificadores de nodo.

DESCRIPCIÓN_DEL_NODO
Descripción fácil de usar del nodo.

Nodo Contenido
Raíz del modelo En blanco
Estadísticas marginales En blanco
Capa de entrada En blanco
Nodo de entrada Nombre del atributo de entrada
Capa oculta En blanco
Nodo oculto Entero que indica la secuencia del nodo oculto en la lista de nodos ocultos.
Capa de salida En blanco
Nodo de salida Si el atributo de salida es continuo, contiene el nombre del atributo de salida.

Si el atributo de salida es discreto o discretizado, contiene el nombre del atributo y el valor.

REGLA_NODO
Descripción XML de la regla que está incrustada en el nodo.

Nodo Contenido
Raíz del modelo En blanco
Estadísticas marginales En blanco
Capa de entrada En blanco
Nodo de entrada Fragmento XML que contiene la misma información que la columna NODE_DESCRIPTION.
Capa oculta En blanco
Nodo oculto Entero que indica la secuencia del nodo oculto en la lista de nodos ocultos.
Capa de salida En blanco
Nodo de salida Fragmento XML que contiene la misma información que la columna NODE_DESCRIPTION.

REGLA MARGINAL
En el caso de los modelos de red neuronal, siempre en blanco.

Probabilidad de Nodo
Probabilidad asociada a este nodo. Para los modelos de red neuronal, siempre es 0.

PROBABILIDAD MARGINAL
Probabilidad de alcanzar el nodo desde el nodo primario. Para los modelos de red neuronal, siempre es 0.

DISTRIBUCIÓN_DE_NODOS
Tabla anidada que contiene información estadística para el nodo. Para obtener información detallada sobre el contenido de esta tabla para cada tipo de nodo, consulte la sección Descripción de la tabla de NODE_DISTRIBUTION.

SOPORTE_DE_NODO
Para los modelos de red neuronal, siempre es 0.

Nota:

Las probabilidades de compatibilidad siempre son 0 porque la salida de este tipo de modelo no es probabilística. Solo los pesos son significativos para el algoritmo; por lo tanto, el algoritmo no calcula la probabilidad, la compatibilidad ni la varianza.

Para obtener información sobre el apoyo en los casos de entrenamiento para valores específicos, consulte el nodo de estadísticas marginales.

MSOLAP_MODEL_COLUMN
|Nodo |Contenido|
|----------|-------------|
|Raíz del modelo |En blanco|
|Estadísticas marginales |En blanco|
|Capa de entrada |En blanco|
|Nodo de entrada |Nombre del atributo de entrada.|
|Capa oculta|En blanco|
|Nodo oculto|En blanco|
|Capa de salida |En blanco|
|Nodo de salida |Nombre del atributo de entrada.|

MSOLAP_NODE_SCORE
Para un modelo de red neuronal, siempre es 0.

MSOLAP_NODE_SHORT_CAPTION
En el caso de los modelos de red neuronal, siempre en blanco.

Observaciones

El propósito de entrenar un modelo de red neuronal es determinar los pesos asociados a cada transición de una entrada a un punto medio y de un punto medio a un punto final. Por lo tanto, la capa de entrada del modelo existe principalmente para almacenar los valores reales que se usaron para compilar el modelo. La capa oculta almacena los pesos calculados y proporciona referencias a los atributos de entrada. La capa de salida almacena los valores predecibles y también proporciona punteros a los puntos intermedios de la capa oculta.

Uso de nombres e identificadores de nodo

La nomenclatura de los nodos de un modelo de red neuronal proporciona información adicional sobre el tipo de nodo, para que sea más fácil relacionar la capa oculta con la capa de entrada y la capa de salida a la capa oculta. En la tabla siguiente se muestra la convención de los identificadores asignados a los nodos de cada capa.

Tipo de nodo Convención para el identificador de nodo
Raíz del modelo (1) 00000000000000000.
Nodo de estadísticas marginales (24) 10000000000000000
Capa de entrada (18) 30000000000000000
Nodo de entrada (21) Comienza en 60000000000000000
Subred (17) 20000000000000000
Capa oculta (19) 40000000000000000
Nodo oculto (22) Comienza en 70000000000000000
Capa de salida (20) 50000000000000000
Nodo de salida (23) Comienza en 80000000000000000

Puede determinar qué atributos de entrada están relacionados con un nodo de capa oculta específico viendo la tabla NODE_DISTRIBUTION en el nodo oculto (NODE_TYPE = 22). Cada fila de la tabla NODE_DISTRIBUTION contiene el identificador de un nodo de atributo de entrada.

Del mismo modo, puede determinar qué capas ocultas están relacionadas con un atributo de salida viendo la tabla NODE_DISTRIBUTION en el nodo de salida (NODE_TYPE = 23). Cada fila de la tabla NODE_DISTRIBUTION contiene el identificador de un nodo de capa oculta, junto con el coeficiente relacionado.

Interpretación de la información en la tabla de NODE_DISTRIBUTION

La tabla NODE_DISTRIBUTION puede estar vacía en algunos nodos. Sin embargo, para los nodos de entrada, los nodos de capa ocultos y los nodos de salida, la tabla NODE_DISTRIBUTION almacena información importante e interesante sobre el modelo. Para ayudarle a interpretar esta información, la tabla NODE_DISTRIBUTION contiene una columna VALUETYPE para cada fila que indica si el valor de la columna ATTRIBUTE_VALUE es Discreto (4), Discretized (5) o Continuous (3).

Nodos de entrada

La capa de entrada contiene un nodo para cada valor del atributo que se usó en el modelo.

Atributo discreto: El nodo de entrada almacena solo el nombre del atributo y su valor en las columnas ATTRIBUTE_NAME y ATTRIBUTE_VALUE. Por ejemplo, si [Work Shift] es la columna , se crea un nodo independiente para cada valor de esa columna que se usó en el modelo, como AM y PM. La tabla NODE_DISTRIBUTION para cada nodo muestra solo el valor actual del atributo.

Atributo numérico discretizado: El nodo de entrada almacena el nombre del atributo y el valor, que puede ser un intervalo o un valor específico. Todos los valores se representan mediante expresiones, como '77.4 - 87.4' o ' < 64.0' para el valor de [Time Per Issue]. La tabla NODE_DISTRIBUTION para cada nodo muestra solo el valor actual del atributo.

Atributo continuo: El nodo de entrada almacena el valor medio del atributo. La tabla NODE_DISTRIBUTION para cada nodo muestra solo el valor actual del atributo.

Nodos de capa oculta

La capa oculta contiene un número variable de nodos. En cada nodo, la tabla NODE_DISTRIBUTION contiene asignaciones de la capa oculta a los nodos de la capa de entrada. La columna ATTRIBUTE_NAME contiene un identificador de nodo que corresponde a un nodo de la capa de entrada. La columna ATTRIBUTE_VALUE contiene el peso asociado a esa combinación de nodo de entrada y nodo de capa oculta. La última fila de la tabla contiene un coeficiente que representa el peso de ese nodo oculto en la capa oculta.

Nodos de salida

La capa de salida contiene un nodo de salida para cada valor de salida que se usó en el modelo. En cada nodo, la tabla NODE_DISTRIBUTION contiene asignaciones de la capa de salida a los nodos de la capa oculta. La columna ATTRIBUTE_NAME contiene un identificador de nodo que corresponde a un nodo de la capa oculta. La columna ATTRIBUTE_VALUE contiene el peso asociado a esa combinación de nodo de salida y nodo de capa oculta.

La tabla NODE_DISTRIBUTION tiene la siguiente información adicional, dependiendo de si el tipo del atributo:

Atributo discreto: Las dos filas finales de la tabla NODE_DISTRIBUTION contienen un coeficiente para el nodo en su conjunto y el valor actual del atributo.

Atributo numérico discretizado: Idéntico a los atributos discretos, excepto que el valor del atributo es un intervalo de valores.

Atributo continuo: Las dos filas finales de la tabla NODE_DISTRIBUTION contienen la media del atributo, el coeficiente del nodo en su conjunto y la varianza del coeficiente.

Véase también

Algoritmo de red neuronal de Microsoft
Referencia técnica del algoritmo de red neuronal de Microsoft
Ejemplos de consultas del modelo de red neuronal