Compartir a través de


Adición de una vista del origen de datos para los datos del centro de llamadas (tutorial intermedio de minería de datos)

En esta tarea, agregas una vista del origen de datos que se usará para acceder a los datos del centro de llamadas. Los mismos datos se usarán para crear el modelo de red neuronal inicial para la exploración y el modelo de regresión logística que usará para realizar recomendaciones.

También utilizarás el Diseñador de vistas del origen de datos para agregar una columna para el día de la semana. Esto se debe a que, aunque los datos de origen realizan un seguimiento de los datos del centro de llamadas por fechas, su experiencia le indica que hay patrones periódicos tanto en términos de volumen de llamadas como de calidad del servicio, dependiendo de si el día es un fin de semana o un día de semana.

Procedimientos

Para agregar una vista del origen de datos

  1. En el Explorador de soluciones, haga clic con el botón derecho en Vistas del origen de datos y seleccione Nueva vista del origen de datos.

    Se abre el Asistente para la vista del origen de datos.

  2. En la página Asistente para la vista del origen de datos , haga clic en Siguiente.

  3. En la página Seleccionar un origen de datos, en Orígenes de datos relacionales, seleccione el origen de datos multidimensional 2012 de Adventure Works DW. Si no tiene este origen de datos, consulte Tutorial básico de minería de datos. Haga clic en Next.

  4. En la página Seleccionar tablas y vistas , seleccione la tabla siguiente y, a continuación, haga clic en la flecha derecha para agregarla a la vista del origen de datos:

    • FactCallCenter (dbo)

    • DimDate

  5. Haga clic en Next.

  6. En la página Finalización del Asistente, de forma predeterminada, la vista del origen de datos se denomina Adventure Works DW Multidimensional 2012. Cambie el nombre a CallCenter y, a continuación, haga clic en Finalizar.

    El Diseñador de vistas de origen de datos se abre para mostrar la vista de origen de datos CallCenter.

  7. Haga clic con el botón derecho en el panel Vista del origen de datos y seleccione Agregar o quitar tablas. Seleccione la tabla DimDate y haga clic en Aceptar.

    Se debe agregar automáticamente una relación entre las DateKey columnas de cada tabla. Usará esta relación para obtener la columna EnglishDayNameOfWeek de la tabla DimDate y usarla en el modelo.

  8. En el diseñador de vistas del origen de datos, haga clic con el botón derecho en la tabla FactCallCenter y seleccione Nuevo cálculo con nombre.

    En el cuadro de diálogo Crear cálculo con nombre , escriba los valores siguientes:

    Nombre de columna DíaDeLaSemana
    Descripción Obtención del día de la semana de la tabla DimDate
    Expresión (SELECT EnglishDayNameOfWeek AS DayOfWeek FROM DimDate where FactCallCenter.DateKey = DimDate.DateKey)

    Para comprobar que la expresión crea los datos que necesita, haga clic con el botón derecho en la tabla FactCallCenter y, a continuación, seleccione Explorar datos.

  9. Dedique un minuto a revisar los datos disponibles para que pueda comprender cómo se usa en la minería de datos:

Nombre de la columna Contiene
FactCallCenterID Clave arbitraria creada cuando los datos se importaron al almacenamiento de datos.

Esta columna identifica registros únicos y se debe usar como clave de caso para el modelo de minería de datos.
DateKey Fecha de la operación del centro de llamadas, expresada como un entero. Las claves de fecha entera se suelen usar en almacenes de datos, pero es posible que desee obtener la fecha en formato de fecha y hora si va a agrupar por valores de fecha.

Tenga en cuenta que las fechas no son únicas porque el proveedor proporciona un informe independiente para cada turno en cada día de operación.
Tipo de Salario Indica si el día era un día laborable, un fin de semana o un día festivo.

Es posible que haya una diferencia en la calidad del servicio al cliente los fines de semana frente a los días laborables, por lo que usará esta columna como entrada.
Turno Indica el turno para el que se registran las llamadas. Este centro de llamadas divide el día laborable en cuatro turnos: AM, PM1, PM2 y Medianoche.

Es posible que el cambio influya en la calidad del servicio al cliente, por lo que lo utilizarás como dato de entrada.
LevelOneOperators Indica el número de operadores de nivel 1 en servicio.

Los empleados del centro de llamadas comienzan en el nivel 1, por lo que estos empleados tienen menos experiencia.
LevelTwoOperators Indica el número de operadores de nivel 2 en servicio.

Un empleado debe registrar un número determinado de horas de servicio para calificar como operador de nivel 2.
TotalOperators Número total de operadores presentes durante el turno.
Llamadas Número de llamadas recibidas durante el turno.
AutomaticResponses Número de llamadas que se controlaron completamente mediante el procesamiento automatizado de llamadas (respuesta interactiva de voz o IVR).
Órdenes Número de pedidos resultantes de las llamadas.
ProblemasPlanteados Número de problemas generados por llamadas que requieren seguimiento.
TiempoPromedioPorProblema Tiempo medio necesario para responder a una llamada entrante.
ServiceGrade Métrica que indica la calidad general del servicio, medida como la tasa de abandono para todo el turno. Cuanto mayor sea la tasa de abandono, más probable es que los clientes no estén satisfechos y que se pierdan pedidos potenciales.

Tenga en cuenta que los datos incluyen cuatro columnas diferentes basadas en una sola columna de fecha: WageType, DayOfWeek, Shifty DateKey. Normalmente, en la minería de datos no es una buena idea usar varias columnas derivadas de los mismos datos, ya que los valores se correlacionan entre sí demasiado fuertemente y pueden ocultar otros patrones.

Sin embargo, no usaremos DateKey en el modelo porque contiene demasiados valores únicos. No hay ninguna relación directa entre Shift y DayOfWeek y WageTypeDayOfWeek solo están relacionadas parcialmente. Si te preocupaba la colinealidad, podrías crear la estructura con todas las columnas disponibles y, a continuación, omitir columnas diferentes en cada modelo para evaluar el efecto.

Siguiente tarea de la lección

Creación de una estructura y modelo de red neuronal (Tutorial intermedio de minería de datos)

Véase también

Vistas del origen de datos en modelos multidimensionales