Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Ahora que ha creado el modelo exploratorio, puede usarlo para obtener más información sobre los datos mediante las siguientes herramientas proporcionadas en SQL Server Data Tools (SSDT).
Visorde red neuronal de Microsoft: este visor está disponible en la pestaña Visor de modelos de minería de datos del Diseñador de minería de datos y está diseñado para ayudarle a experimentar con interacciones en los datos.
Visorde árbol de contenido genérico de Microsoft: este visor estándar proporciona detalles detallados sobre los patrones y estadísticas detectados por el algoritmo cuando generó el modelo.
Visor de redes neuronales de Microsoft
El visor tiene tres paneles: entrada, salida y variables.
Mediante el panel Salida , puede seleccionar valores diferentes para el atributo de predicción o la variable dependiente. Si el modelo contiene varios atributos de predicción, puede seleccionar el atributo en la lista Atributo de salida.
El panel Variables compara los dos resultados que eligió en términos de atributos de contribución o variables. Las barras coloreadas representan visualmente en qué grado afecta la variable a los resultados buscados. También puede ver las puntuaciones de mejora respecto al modelo predictivo para las variables. Una puntuación de mejora respecto al modelo predictivo se calcula de forma diferente en función de qué tipo de modelo de minería de datos se usa, pero en general indica la mejora en el modelo cuando se usa este atributo para la predicción.
El panel Entrada permite agregar influenciadores al modelo para probar varios escenarios hipotéticos.
Usar el panel Salida
En este modelo inicial, le interesa ver cómo afectan varios factores al grado de servicio. Para ello, puede seleccionar Nivel de servicio en la lista de atributos de salida y, a continuación, comparar distintos niveles de servicio seleccionando intervalos en las listas desplegables de Valor 1 y Valor 2.
Para comparar los grados de servicio inferior y superior
En Valor 1, seleccione el intervalo con los valores más bajos. Por ejemplo, el intervalo 0-0-0.7 representa las tasas menores de abandono y, por lo tanto, el mejor grado de servicio.
Nota:
Los valores exactos de este intervalo pueden variar según la configuración del modelo.
En Valor 2, seleccione el intervalo con los valores más altos. Por ejemplo, el intervalo con el valor >=0,12 representa las tasas de abandono más altas y, por tanto, el peor grado de servicio. En otras palabras, el 12% de los clientes que llamaron durante este turno colgaron antes de hablar con un agente.
El contenido del panel Variables se actualiza para comparar atributos que contribuyen a los valores de resultado. Por lo tanto, la columna de la izquierda muestra los atributos asociados al mejor grado de servicio y la columna de la derecha los atributos asociados al peor grado de servicio.
Usar el panel Variables
En este modelo, parece que Average Time Per Issue es un factor importante. Esta variable indica el tiempo promedio que se tarda en responder una llamada, con independencia de su tipo.
Para ver y copiar las puntuaciones de mejora respecto al modelo predictivo y la probabilidad de un atributo
En el panel Variables , pause el mouse sobre la barra de colores de la primera fila.
Esta barra coloreado muestra lo fuertemente
Average Time Per Issueque contribuye al nivel de servicio. La información sobre herramientas muestra una puntuación general, las probabilidades y las puntuaciones de mejora con respecto al modelo predictivo para cada combinación de variable y resultado de destino.En el panel Variables, haga clic con el botón derecho en cualquier barra de colores y seleccione Copiar.
En una hoja de cálculo de Excel, haga clic con el botón derecho en cualquier celda y seleccione Pegar.
El informe se pega como una tabla HTML y solo muestra las puntuaciones de cada barra.
En otra hoja de cálculo de Excel, haga clic con el botón derecho en cualquier celda y seleccione Pegar especial.
El informe se pega en formato de texto e incluye las estadísticas relacionadas descritas en la sección siguiente.
Usar el panel Entrada
Suponga que le interesa observar el efecto de un factor determinado, como el turno o el número de operadores. Puede seleccionar una variable determinada mediante el panel Entrada y el panel Variables se actualiza automáticamente para comparar los dos grupos seleccionados previamente según la variable especificada.
Para revisar el efecto en el grado de servicio cambiando los atributos de entrada
En el panel Entrada , para el atributo, seleccione Mayús.
En Valor, seleccione AM.
El panel Variables se actualiza para mostrar el impacto en el modelo cuando el cambio es AM. Todas las demás selecciones siguen siendo las mismas: sigue comparando las calificaciones de servicio más bajas y más altas.
En Valor, seleccione PM1.
El panel Variables se actualiza para mostrar el impacto en el modelo cuando cambia el desplazamiento.
En el panel Entrada , haga clic en la siguiente fila en blanco en Atributo y seleccione Llamadas. En Valor, seleccione el intervalo que indica el mayor número de llamadas.
Se agrega una condición de entrada nueva a la lista. El panel Variables se actualiza para mostrar el impacto en el modelo para un desplazamiento determinado cuando el volumen de llamadas es mayor.
Continúe cambiando los valores de Shift y Calls para encontrar correlaciones interesantes entre el turno, el volumen de llamadas y el grado de servicio.
Nota:
Para borrar el panel Entrada para que pueda usar atributos diferentes, haga clic en Actualizar contenido del visor.
Interpretar las estadísticas que se proporcionan en el visor
Los tiempos de espera más prolongados son un factor de predicción muy eficaz de una tasa de abandono elevada, lo que significa que el grado de servicio es deficiente. Esto puede parecer una conclusión obvia; sin embargo, el modelo de minería de datos proporciona datos estadísticos adicionales para ayudarle a interpretar estas tendencias.
Puntuación: valor que indica la importancia general de esta variable para discriminar entre los resultados. Cuanto más alta es la puntuación, más intenso es el efecto que la variable tiene en el resultado.
Probabilidad del valor 1: porcentaje que representa la probabilidad de este valor para este resultado.
Probabilidad del valor 2: porcentaje que representa la probabilidad de este valor para este resultado.
Lift for Value 1 and Lift for Value 2: Scores that represents the impact of using this particular variable for predicting the Value 1 and Value 2 outcomes. Cuanto más alta es la puntuación, mejor es la variable prediciendo los resultados.
La tabla siguiente contiene algunos valores de ejemplo para los influenciadores más importantes. Por ejemplo, la probabilidad del valor 1 es del 60,6 % y la probabilidad del valor 2 es del 8,30 %, lo que significa que cuando el tiempo medio por problema estaba en el intervalo de 44-70 minutos, el 60,6 % de los casos se encontraba en el turno con las calificaciones de servicio más altas (valor 1) y el 8,30 % de los casos estaban en el cambio con las calificaciones de servicio peores (valor 2).
A partir de esta información puede sacar algunas conclusiones. Un menor tiempo de respuesta de las llamadas (el intervalo 44-70) influye en gran medida en un mejor grado de servicio (el intervalo 0.00-0.07). La puntuación (92,35) le indica que esta variable es muy importante.
Sin embargo, según se sigue mirando la lista de factores que influyen, se ven algunos otros factores con efectos que son más sutiles y más difíciles de interpretar. Por ejemplo, el turno parece influir en el servicio, pero las puntuaciones de mejora con respecto al modelo predictivo y las probabilidades relativas indican que no es un factor importante.
| Atributo | Valor | Favores < 0.07 | Favores >= 0,12 |
|---|---|---|---|
| Promedio de tiempo por problema | 89.087 - 120.000 | Puntuación: 100 Probabilidad de valor1: 4,45 % Probabilidad de valor2: 51,94 % Lift for Value1: 0,19 Incremento para Valor2: 1.94 |
|
| Promedio de tiempo por problema | 44.000 - 70.597 | Puntuación: 92,35 Probabilidad de valor 1: 60,06 % Probabilidad de valor 2: 8,30 % Elevación de valor 1: 2,61 Elevación de valor 2: 0,31 |
Visor de árbol de contenido genérico de Microsoft
Este visor se puede usar para ver información incluso más detallada creada por el algoritmo cuando se procesa el modelo. El Visor de árboles de contenido de MicrosoftGeneric representa el modelo de minería de datos como una serie de nodos, donde cada nodo representa conocimientos aprendidos sobre los datos de entrenamiento. Este visor se puede utilizar con todos los modelos, pero el contenido de los nodos es diferente según el tipo de modelo.
En los modelos de red neuronal o de regresión logística, podría encontrar que el marginal statistics node es particularmente útil. Este nodo contiene estadísticas derivadas acerca de la distribución de los valores de los datos. Esta información puede ser de utilidad si desea obtener un resumen de los datos sin tener que escribir muchas consultas de T-SQL. El gráfico de los valores del tema anterior se derivó del nodo de estadísticas marginal.
Para obtener un resumen de los valores de datos del modelo de minería de datos
En el Diseñador de minería de datos, en la pestaña Visor de modelos de minería de datos, seleccione <Nombre> del modelo de minería de datos.
En la lista Visor , seleccione Visor de árbol de contenido genérico de Microsoft.
La vista del modelo de minería de datos se actualiza para mostrar una jerarquía de nodos en el panel izquierdo y una tabla HTML en el panel derecho.
En el panel Título del nodo, haga clic en el nodo que tiene el nombre 100000000000000000.
El nodo superior de cualquier modelo siempre es el nodo raíz. En un modelo de red neuronal o de regresión logística, el nodo que está inmediatamente por debajo es el nodo de estadísticas marginal.
En el panel Detalles del nodo, desplácese hacia abajo hasta que encuentre la fila, NODE_DISTRIBUTION.
Desplácese hacia abajo por la tabla NODE_DISTRIBUTION para ver la distribución de valores calculados por el algoritmo de red neuronal.
Para usar estos datos en un informe, podría seleccionar información de filas específicas y copiarla después, o puede usar la siguiente consulta de Extensiones de minería de datos (DMX) para extraer el contenido completo del nodo.
SELECT *
FROM [Call Center EQ4].CONTENT
WHERE NODE_NAME = '10000000000000000'
También puede usar la jerarquía de nodos y los detalles de la tabla NODE_DISTRIBUTION para recorrer rutas individuales de la red neuronal y ver estadísticas del nivel oculto. Para obtener más información, consulte Ejemplos de consultas del modelo de red neuronal.
Siguiente tarea de la lección
Consulte también
Contenido del modelo de minería de datos para modelos de red neuronal (Analysis Services - Minería de datos)
Ejemplos de consultas de modelos de red neuronal
Referencia técnica del algoritmo de red neuronal de Microsoft
Cambiar la discretización de una columna en un modelo de minería de datos