Compartir a través de


Resaltar excepciones (Table Analysis Tools para Excel)

Botón Resaltar excepciones en la cinta de opciones

A veces, los datos pueden contener valores peculiares. Por ejemplo, la edad de un propietario de vivienda puede aparecer como de cinco años. Estos valores, a menudo denominados valores atípicos, podrían ser incorrectos debido a un error de entrada de datos o podrían indicar tendencias inusuales. En cualquier caso, las excepciones pueden afectar a la calidad del análisis. La herramienta Resaltar excepciones le ayuda a encontrar estos valores y a revisarlos para obtener más acciones.

La herramienta Resaltar excepciones puede funcionar con todo el intervalo de datos de una tabla de datos de Excel, o puede seleccionar solo algunas columnas. También puede ajustar un umbral que controla la variabilidad de los datos para encontrar más o menos excepciones.

Cuando la herramienta completa su análisis, crea una nueva hoja de cálculo que contiene un informe de resumen de cuántos valores atípicos se encontraron en cada una de las columnas que ha analizado. La herramienta también resalta las excepciones de la tabla de datos original. Dado que la herramienta analiza las tendencias generales, podría encontrar que la mayoría de los valores de una fila son normales y resaltar solo una celda de esa fila. En el ejemplo de propietario anterior, solo se puede resaltar la columna Edad .

También puede cambiar el valor del umbral de excepción en el informe de resumen. Este valor indica la probabilidad de que una celda determinada contenga un valor anómalo. Por lo tanto, si aumenta el valor, se resaltarán menos valores como valores atípicos. Por el contrario, al reducir el valor, verá celdas más resaltadas.

Uso de la herramienta Resaltar excepciones

  1. Abra una tabla de Excel y haga clic en Resaltar excepciones.

  2. Especifique las columnas que se van a analizar.

  3. Haga clic en Ejecutar.

  4. Abra la hoja de cálculo denominada <Nombre> de tabla Valores atípicos para ver un resumen de los valores atípicos que se encontraron.

  5. Para cambiar el número de resaltados, haga clic en las flechas arriba y abajo de la fila Umbral de excepción del Informe resaltar excepciones.

Requisitos

Puede incluir columnas que no contengan valores incorrectos si estos valores contienen información que puede resultar útil para predecir otras filas. Sin embargo, debe anular la selección de columnas que tengan muchos valores faltantes o valores cero.

Dado que todas las columnas seleccionadas se usan para crear un patrón general, debe evitar el uso de columnas de entrada que sabe tener información deficiente, como la siguiente:

  • Columnas que contienen valores únicos, como identificadores.

  • Columnas que contienen un alto porcentaje de valores incorrectos.

  • Columnas con muchos valores que faltan.

    Tenga en cuenta que hay algunos casos en los que resulta útil incluir columnas de entrada que tienen muchos valores que faltan. Por ejemplo, si el valor del campo de dirección siempre falta cuando el cliente compra a través de un distribuidor, el algoritmo de minería de datos puede usar esta información para identificar a otros clientes similares. Debe determinar por caso si faltan datos por omisión o porque el estado Falta es significativo.

  • Columnas que probablemente no sean útiles para crear un patrón. Por ejemplo, una columna que tiene el mismo valor en todas las filas no proporciona información que sea útil en la construcción de patrones.

Comprensión del informe de excepciones destacadas

Al hacer clic en Ejecutar, la herramienta realiza tres cosas:

  • Crea una estructura de minería de datos basada en los datos actuales de la tabla.

  • Crea un nuevo modelo de minería de datos mediante el algoritmo de agrupación en clústeres de Microsoft.

  • Crea una consulta de predicción basada en los patrones para determinar si los valores de la hoja de cálculo son improbables.

El valor inicial del umbral de excepción es siempre 75, lo que significa que el algoritmo calculado hay un 75% probabilidad de que los datos resaltados no sean correctos. La herramienta establece automáticamente este umbral para el paso de análisis inicial, pero puede cambiar el valor del informe.

La herramienta Resaltar excepciones resalta las celdas de la tabla de datos original sospechosas. El resaltado oscuro significa que la fila necesita atención. El resaltado brillante significa que el valor de esa celda en particular se identificó como sospechoso. Si cambia el umbral de las excepciones, los valores resaltados cambiarán según corresponda.

El gráfico de resumen muestra el número de celdas de cada columna que estaban por encima del umbral de excepción.

Al limpiar o revisar los datos en preparación para la minería de datos, también puede probar las características de exploración de datos en el cliente de minería de datos para Excel. Este complemento proporciona herramientas más avanzadas para ayudarle a averiguar valores atípicos, volver a etiquetar datos o ver la distribución de datos. Para obtener más información sobre las herramientas de exploración de datos en el cliente de minería de datos para Excel, consulte Exploración y limpieza de datos.

La herramienta Resaltar excepciones usa el algoritmo de agrupación en clústeres de Microsoft. Un modelo de agrupación en clústeres detecta grupos de filas que comparten características similares. El cliente de minería de datos para Excel proporciona una ventana Examinar que usa gráficos y perfiles de características para permitirle explorar los modelos de minería de datos creados por la agrupación en clústeres. Para obtener información sobre cómo examinar el modelo de agrupación en clústeres creado por la herramienta Resaltar excepciones, vea Examinar modelos (cliente de minería de datos para Excel).

Para obtener más información sobre el algoritmo de clúster de Microsoft, vea el tema "Algoritmo de clústeres de Microsoft" en la Documentación en línea de SQL Server.

Véase también

Herramientas de análisis de tablas para Excel