Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En este tema se describe cómo crear una directiva de coincidencia en una base de conocimiento en Data Quality Services (DQS). Para preparar el proceso de coincidencia en DQS, ejecute la actividad de política de coincidencia en los datos de ejemplo. En esta actividad, creará y probará una o varias reglas de coincidencia en la directiva y, a continuación, publicará la base de conocimiento para que las reglas de coincidencia estén disponibles públicamente para su uso. Solo puede haber una directiva de coincidencia en una base de conocimiento, pero esa directiva puede contener varias reglas de coincidencia.
La creación de directivas de coincidencia se realiza en tres fases: un proceso de asignación en el que se identifican el origen de datos y se asignan dominios a columnas, un proceso de directiva coincidente en el que se crean una o varias reglas de coincidencia y se prueba cada regla de coincidencia por separado, y un proceso de resultados coincidente en el que se ejecutan todas las reglas coincidentes, y si está satisfecho con ellas, agregue la directiva a la base de conocimiento. Cada uno de estos procesos se realiza en una página independiente del Asistente para la actividad de la política de coincidencia, lo que le permite navegar hacia adelante y atrás por distintas páginas, volver a ejecutar el proceso, y cerrar un proceso específico de política de coincidencia para luego regresar a la misma fase del proceso. Después de probar todas las reglas juntas, si lo desea, puede volver a la página Directiva de coincidencia , ajustar una regla individual, probarla de nuevo por separado y volver a la página Resultados de coincidencia para ejecutar todas las reglas juntas una vez más. DQS proporciona estadísticas sobre los datos de origen, las reglas de coincidencia y los resultados de coincidencia que le permiten tomar decisiones informadas sobre la directiva de coincidencia, para que pueda refinarla.
Antes de empezar
Prerrequisitos
Microsoft Excel debe instalarse en el equipo data Quality Client si los datos de origen están en un archivo de Excel. De lo contrario, no podrá seleccionar el archivo de Excel en la etapa de asignación. Los archivos creados por Microsoft Excel pueden tener una extensión de .xlsx, .xlso .csv. Si se usa la versión de 64 bits de Excel, solo se admiten los archivos de Excel 2003 (.xls); No se admiten archivos de Excel 2007 o 2010 (.xlsx). Si usa una versión de 64 bits de Excel 2007 o 2010, guarde el archivo como un archivo de .xls o un archivo de .csv, o instale una versión de 32 bits de Excel en su lugar.
Seguridad
Permisos
Debe tener el rol de dqs_kb_editor o de dqs_administrator en la base de datos DQS_MAIN para crear una política de concordancia.
Cómo establecer parámetros de regla de coincidencia
La creación de una regla de coincidencia es un proceso iterativo en el que se especifican los factores utilizados para determinar si un registro es una coincidencia para otro. Puede especificar condiciones para cualquier dominio de una tabla. Cuando DQS realiza la coincidencia en dos registros, comparará los valores de los campos asignados a los dominios que se incluyen en la regla de coincidencia. DQS analiza los valores de cada campo de la regla y, a continuación, usa los factores especificados en la regla para cada dominio para calcular una puntuación de coincidencia final. Si la puntuación de coincidencia de los dos registros comparados es mayor que la puntuación de coincidencia mínima, los dos campos se consideran coincidencias.
Los factores que indiques en una regla de coincidencia incluyen los siguientes:
Peso: para cada dominio de la regla, escriba un peso numérico que determine cómo se comparará el análisis coincidente del dominio con el de cada otro dominio de la regla. El peso indica la contribución de la puntuación del campo a la puntuación de coincidencia global entre dos registros. Las puntuaciones calculadas asignadas a cada campo de origen se sumarán para una puntuación de coincidencia compuesta para los dos registros. Para cada campo que no es un requisito previo (con una similitud exacta o similar), establezca el peso entre 10 y 100. La suma de los pesos de los dominios que no son requisitos necesarios tiene que ser igual a 100. Si el valor es un requisito previo, el peso se establece en 0 y no se puede cambiar.
Similitud exacta: seleccione Exacto si los valores del mismo campo de dos registros diferentes deben ser idénticos para que los valores se consideren una coincidencia. Si es idéntica, la puntuación de coincidencia de ese dominio se establecerá en "100" y DQS usará esa puntuación y las puntuaciones de los demás dominios de la regla para determinar la puntuación de coincidencia agregada. Si no es idéntico, la puntuación de coincidencia de ese dominio se establecerá en "0" y el procesamiento de la regla continuará con la siguiente condición. Si configura una regla de coincidencia para un dominio numérico y selecciona Similar, puede escribir una tolerancia como un porcentaje o un entero. Para un dominio de tipo date, puede escribir una tolerancia como día, mes o año (entero) si selecciona Similar; no hay tolerancia porcentual para un dominio de fecha. Si selecciona Exacto, no tiene esta opción.
Similitud de Similar: seleccione Similar si dos valores en el mismo campo de dos registros diferentes se pueden considerar una coincidencia aunque los valores no sean idénticos. Cuando DQS ejecuta la regla, calculará una puntuación coincidente para ese dominio y usará esa puntuación y las puntuaciones de los demás dominios de la regla para determinar la puntuación de coincidencia agregada. La similitud mínima entre los valores de un campo es 60%. Si la puntuación de coincidencia calculada para un campo de dos registros es inferior a 60, la puntuación de similitud se establece automáticamente en 0. Si va a configurar una regla de coincidencia para un campo numérico y selecciona Similar, puede escribir una tolerancia como un porcentaje o un entero. Si va a configurar una regla de coincidencia para un campo de fecha y selecciona Similar, puede escribir una tolerancia numérica.
Requisito previo: seleccione Requisito previo para especificar que los valores del mismo campo en dos registros diferentes deben devolver una coincidencia de 100% o que los registros no se consideran una coincidencia y se omitan las demás cláusulas de la regla. Cuando se selecciona Requisito previo , se quita el campo de peso del dominio para que no pueda definir un peso para el dominio. Debe restablecer uno o más pesos de dominio para que la suma de pesos sea igual a 100. Los dominios de requisitos previos no contribuyen a la puntuación de coincidencia de registros. La puntuación de coincidencia de registros se determina comparando los valores de los campos para los que la similitud se establece en Similar o Exacto. Cuando haces que un campo sea un requisito previo, la similitud para ese dominio se establece automáticamente en exacto.
La puntuación de coincidencia mínima es el umbral en el que se consideran que dos registros son una coincidencia (y el estado de los registros se establece en "Coincidente"). Escriba un valor entero en incrementos de "1" o haga clic en la flecha arriba o abajo para aumentar o disminuir el valor en incrementos de "10". El valor mínimo es 80. Si la puntuación de coincidencia es inferior a 80, los dos registros no se consideran una coincidencia. No se puede cambiar el intervalo de la puntuación de coincidencia mínima en esta página. La puntuación de coincidencia mínima es 80. Sin embargo, puede cambiar la puntuación de coincidencia mínima más baja dentro de la página Administración (si es administrador de DQS).
La creación de una regla de coincidencia es un proceso iterativo porque es posible que tenga que cambiar los pesos relativos de los dominios de la regla, o la similitud o la propiedad de requisito previo de un dominio o la puntuación de coincidencia mínima para la regla, con el fin de lograr los resultados que necesita. También puede encontrar que necesita crear varias reglas, cada una de las cuales se ejecutará para crear la puntuación de coincidencia. Puede ser difícil lograr el resultado que necesita con una sola regla. Varias reglas proporcionarán diferentes vistas de una coincidencia necesaria. Con varias reglas, puede incluir menos dominios en cada regla, usar pesos más altos para cada dominio y lograr mejores resultados. Si los datos son menos precisos y menos completos, es posible que necesite más reglas para buscar coincidencias necesarias. Si los datos son más precisos y completos, necesita menos reglas.
La generación de perfiles proporciona información sobre la integridad y la exclusividad. Considere la integralidad y la unicidad en conjunto. Utiliza datos de integridad y unicidad para determinar el peso que se debe atribuir a un campo en el proceso de emparejamiento. Si hay un alto nivel de unicidad en un campo, el uso del campo en una directiva de coincidencia puede reducir los resultados coincidentes, por lo que es posible que desee establecer el peso de ese campo en un valor relativamente pequeño. Si tiene un nivel bajo de unicidad para una columna, pero baja completitud, es posible que no quiera incluir un dominio para esa columna. Con un bajo nivel de unicidad, pero un alto nivel de integridad, puede que desee incluir el dominio. Algunas columnas, como el género, pueden tener naturalmente un bajo nivel de unicidad. Para obtener más información, vea Pestañas de perfiles y resultados.
Primer paso: Iniciar una política de coincidencia
Usted realiza la actividad de política de emparejamiento en el área de administración de la base de conocimiento de la aplicación Data Quality Client.
Inicie el cliente de calidad de datos. Para obtener información sobre cómo hacerlo, consulte Ejecución de la aplicación Data Quality Client.
En la pantalla principal de Data Quality Client, haga clic en Nueva base de conocimiento para crear una directiva coincidente en una nueva base de conocimiento. Escriba un nombre para la base de conocimiento, escriba una descripción y establezca Crear base de conocimiento a partir de lo deseado. Haga clic en Directiva de coincidencia correspondiente a la actividad. Haga clic en Siguiente para continuar.
Haga clic en Abrir base de conocimiento para crear o modificar la directiva de coincidencia en una base de conocimiento existente. Seleccione la base de conocimiento, seleccione Directiva de coincidencia y, a continuación, haga clic en Siguiente. También puede hacer clic en una base de conocimiento en Base de conocimiento reciente. Si abre una base de conocimiento que se cerró mientras se estaba trabajando una directiva de coincidencia, continuará con la fase en la que se cerró la actividad de directiva de coincidencia (como se indica en la columna Estado de la base de conocimiento de la tabla de la base de conocimiento o en el nombre de la base de conocimiento en Base de conocimiento reciente). Si abre una base de conocimiento que incluye una directiva de coincidencia y ha finalizado, irá a la página Directiva de coincidencia . Si abre una base de conocimiento que no incluye una directiva de coincidencia y ha finalizado, irá a la página Asignación .
Fase de mapeo
En la fase de asignación, identifique el origen de los datos para los que va a crear la política de coincidencia y asigne las columnas de origen a los dominios. Esto permitirá que los dominios estén disponibles para la actividad de la política de coincidencia.
En la página Mapa, para crear una directiva para una base de datos, deje Origen de datos como SQL Server, seleccione la base de datos para la que desea crear la directiva en Base de datos y, a continuación, seleccione la tabla o vista en Tabla/Vista. La base de datos de origen debe estar presente en la misma instancia de SQL Server que Data Quality Server. De lo contrario, no aparecerá en la lista desplegable.
Para crear una directiva para los datos de una hoja de cálculo de Excel, seleccione Archivo de Excel para origen de datos, haga clic en Examinar y seleccione el archivo de Excel y deje Usar la primera fila como encabezado seleccionado si procede. En Hoja de cálculo, seleccione la hoja de cálculo en el archivo de Excel que será el origen de los datos. Microsoft Excel debe instalarse en el equipo data Quality Client para seleccionar un archivo de Excel. De lo contrario, el botón Examinar no estará disponible y se le notificará debajo de este cuadro de texto que Microsoft Excel no está instalado.
En Asignaciones, seleccione un campo para Columna de origen y luego haga clic en el icono Crear dominio.
En Asignaciones, seleccione un campo del origen de datos para Columna de origen, y luego seleccione el dominio correspondiente. Repita la operación para todos los dominios que use en el proceso de coincidencia. Cree dominios según sea necesario haciendo clic en Crear un dominio o Crear un dominio compuesto.
Nota:
Puede asignar los datos de origen a un dominio DQS al crear una directiva coincidente solo si el tipo de datos de origen se admite en DQS y coincide con el tipo de datos de dominio DQS. Para obtener información sobre los tipos de datos admitidos en DQS, vea Tipos de datos de SQL Server y SSIS compatibles para dominios DQS.
Haga clic en el control más (+) para agregar una fila a la tabla Asignaciones o al control menos (-) para quitar una fila.
Haga clic en Vista previa del origen de datos para ver los datos de la tabla o vista de SQL Server que seleccionó o la hoja de cálculo de Excel que seleccionó.
Haga clic en Ver o seleccionar dominios compuestos para ver una lista de los dominios compuestos disponibles en la base de conocimiento y seleccione según corresponda para la asignación.
Haga clic en Siguiente para continuar con la fase de política de correspondencia.
Nota:
Haga clic en Cerrar para guardar la fase del proyecto coincidente y vuelva a la página principal de DQS. La próxima vez que abra este proyecto, comenzará desde la misma fase. Haga clic en Cancelar para finalizar la actividad coincidente, perder el trabajo y volver a la página principal de DQS.
Fase de política de coincidencia
Puede crear reglas de coincidencia y probarlas individualmente en la página Directiva de coincidencia. Al probar una regla de coincidencia en la página Directiva de coincidencia, verá una tabla de resultados coincidente que muestra los clústeres que DQS ha identificado para la regla seleccionada. En la tabla se muestra cada registro del clúster con los valores del dominio de mapeo, la puntuación de coincidencia y el registro pivote inicial del clúster. También puede mostrar los datos de generación de perfiles para el proceso de coincidencia en su conjunto, las condiciones de cada regla de coincidencia y las estadísticas de los resultados de cada regla de coincidencia por separado. Puede filtrar los datos de la regla maestra que desee.
Para obtener más información sobre cómo funcionan las reglas de coincidencia, vea Cómo establecer parámetros de regla de coincidencia.
En la página Directiva de coincidencia , haga clic en el icono Crear una regla coincidente .
Escriba un nombre y una descripción para la regla.
Aumente el valor de la puntuación de coincidencia mínima si desea que los requisitos de coincidencia sean más estrictos. Para obtener más información sobre la puntuación de coincidencia mínima, vea Cómo establecer parámetros de regla de coincidencia.
Haga clic en el icono Agregar un nuevo elemento de dominio .
Seleccione un dominio o dominio compuesto para el que escribir los valores de regla.
Nota:
Solo puede seleccionar un dominio compuesto si cada dominio del dominio compuesto se ha asignado a una columna de origen.
En Similitud, seleccione Similar si dos valores en el mismo campo de dos registros diferentes se pueden considerar coincidencias aunque no sean idénticas. Seleccione Exacto si dos valores en el mismo campo de dos registros diferentes deben ser idénticos para considerarse una coincidencia. (Para obtener más información, vea Cómo establecer parámetros de regla de coincidencia).
En Peso, escriba un valor que determine la contribución de la puntuación de coincidencia de un dominio a la puntuación de coincidencia global para dos registros.
Nota:
Al definir un peso para un dominio compuesto, puede especificar un peso diferente para cada dominio único en el dominio compuesto, en cuyo caso el dominio compuesto no tiene un peso independiente, o puede especificar un único peso para el dominio compuesto, en el que los dominios únicos del dominio compuesto no reciben pesos independientes.
Seleccione Requisito previo para especificar que los valores del campo de los dos registros deben devolver una coincidencia de 100%, de lo contrario, los registros no se consideran una coincidencia y se omitan las demás cláusulas de la regla. Si la similitud es Similar, cambiará a Exacto y el peso se quitará porque la coincidencia debe ser 100%.
Repita los pasos del 4 al 8 para todos los demás dominios que formen parte de la regla de coincidencia. Asegúrese de que la suma de los pesos de todos los dominios de la regla sea igual a 100.
Seleccione Clústeres superpuestos en la lista desplegable para mostrar los registros de pivote y los registros siguientes para todos los clústeres, mostrando estos cuando se ejecuta el emparejamiento, incluso si grupos de clústeres tienen registros en común. Seleccione Clústeres no superpuestos para mostrar clústeres que tienen registros en común como un único clúster cuando se ejecuta la coincidencia.
Haga clic en Volver a cargar datos del origen para copiar datos del origen de datos en la tabla de almacenamiento provisional y volver a indexarlos al ejecutar la directiva coincidente. Haga clic en Ejecutar en datos anteriores para ejecutar una directiva coincidente sin copiar los datos en la tabla de almacenamiento provisional y volver a indexar los datos. La ejecución en los datos anteriores está deshabilitada para la primera ejecución de la directiva coincidente, o si cambia la asignación en la página Mapa y, a continuación, presione Sí en el siguiente elemento emergente. En ambos de esos casos, debe volver a indexar. No es necesario volver a indexar si la directiva de coincidencia no ha cambiado. La ejecución de datos anteriores puede ayudar al rendimiento.
Haga clic en Iniciar para ejecutar el proceso de coincidencia de la regla seleccionada. Una vez completado el proceso, la tabla muestra las columnas Id. de registro, Número de clúster y datos (incluidas las que no están en la regla de coincidencia) para cada registro de un clúster. La fila pivote del clúster se considera el candidato principal para sobrevivir al proceso de desduplicación. Cada fila adicional de un clúster se considera un duplicado; su puntuación coincidente (en comparación con el registro pivote) se proporciona en la tabla de resultados. El número de clúster es el mismo que el identificador de registro del registro pivote del clúster.
Puede trabajar con los datos de la tabla Resultados coincidentes de la siguiente manera:
En Filtro, seleccione Coincidir para mostrar todas las filas coincidentes y su puntuación. Las filas que no se consideran coincidencias (que tienen una puntuación coincidente inferior a la puntuación de coincidencia mínima) no se muestran en la tabla de resultados coincidentes. Seleccione No coincidentes para mostrar todas las filas no coincidentes, no filas emparejadas.
En el cuadro desplegable Porcentaje, seleccione un porcentaje en la lista desplegable, en incrementos de "5". Todas las filas con una puntuación coincidente mayor o igual que ese porcentaje se mostrarán en la tabla de resultados coincidentes.
Si hace doble clic en un registro en la tabla de resultados coincidentes, DQS muestra un menú emergente Detalles de puntuación de coincidencia que muestra el registro dinámico y el registro de origen (y los valores de todos sus campos), la puntuación entre ellos y un detalle de la coincidencia de registros. La exploración en profundidad muestra los valores de cada campo del registro dinámico y el registro de origen para poder compararlos y muestra la puntuación coincidente que cada campo contribuye a la puntuación de coincidencia general de los dos registros.
Vea las estadísticas en las pestañas Generador de perfiles y Resultados de coincidencia para asegurarse de que está logrando los resultados que necesita. Para obtener más información, vea Pestañas de perfiles y resultados.
Si es necesario cambiar la regla, cámbiela en el Editor de reglas y haga clic en Reiniciar.
Nota:
Una vez completado el primer análisis, el botón Iniciar se convierte en un botón Reiniciar . Si los resultados del análisis anterior aún no se han guardado, al hacer clic en Reiniciar , se perderán los datos anteriores. A medida que se ejecuta el análisis, no deje la página o se finalizará el proceso de análisis.
La pestaña Resultados coincidentes muestra las estadísticas de las dos últimas ejecuciones de la regla. Si ha ejecutado la regla de coincidencia más de una vez con una configuración diferente, compare las estadísticas de la regla actual y la regla anterior. Si encuentra que los resultados de la regla anterior eran mejores, haga clic en Restaurar regla anterior para restaurar las condiciones de la regla anterior, devolviendo la regla a su estado anterior antes de editarla. Se perderán las condiciones de regla actuales. Esto le permite ajustar la directiva en función de las dos últimas ejecuciones coincidentes, lo que reduce el tiempo que dedica a ajustar la directiva de coincidencia.
Si desea que se agregue otra regla a la directiva de coincidencia, repita el paso 1.
Haga clic en Siguiente para continuar con la fase de resultados coincidentes.
Fase de resultados coincidentes
Las reglas de coincidencia se prueban todas a la vez en la página Resultados de coincidencia. Antes de hacerlo, puede especificar que la ejecución de la prueba de regla identifique clústeres superpuestos o no superpuestos. Si ejecuta las reglas varias veces, puede ejecutar la regla en los datos que se vuelven a cargar desde el origen o en los datos anteriores.
Al probar las reglas de coincidencia en la página Resultados de coincidencia, verá una tabla de resultados coincidente que muestra los clústeres que DQS ha identificado para todas las reglas. En la tabla se muestra cada registro del clúster con los valores del dominio de mapeo, la puntuación de coincidencia y el registro pivote inicial del clúster. También puede mostrar los datos de generación de perfiles de las reglas de coincidencia en su conjunto, las condiciones de cada regla de coincidencia y las estadísticas de los resultados de todas las reglas de coincidencia.
En la página Resultados de coincidencias, seleccione Clústeres solapados en la lista desplegable para mostrar los registros pivot y los registros siguientes para todos los clústeres al ejecutar la coincidencia, incluso si los grupos de clústeres tienen registros en común. Seleccione Clústeres no superpuestos para mostrar clústeres que tienen registros en común como un único clúster cuando se ejecuta la coincidencia.
Haga clic en Volver a cargar datos del origen para copiar datos del origen de datos en la tabla de almacenamiento provisional y volver a indexarlos al ejecutar la directiva coincidente. Haga clic en Ejecutar en datos anteriores para ejecutar una directiva coincidente sin copiar los datos en la tabla de almacenamiento provisional y volver a indexar los datos. La ejecución en los datos anteriores está deshabilitada para la primera ejecución de la directiva coincidente, o si cambia la asignación en la página Mapa y, a continuación, presione Sí en el siguiente elemento emergente. En ambos de esos casos, debe volver a indexar. No es necesario volver a indexar si la directiva de coincidencia no ha cambiado. La ejecución de datos anteriores puede ayudar al rendimiento.
Haga clic en Iniciar para ejecutar el proceso de coincidencia para todas las reglas que haya definido. En la tabla Resultados coincidentes se muestran las columnas id. de registro, número de clúster y datos (incluidas las que no están en la regla de coincidencia) para cada registro de un clúster. El registro inicial del clúster se selecciona aleatoriamente. (Se determina el registro de supervivencia seleccionando la regla de supervivencia en la página Exportar al ejecutar el proyecto de coincidencia). Cada fila adicional en un clúster se considera un duplicado; su puntuación coincidente (en comparación con el registro pivote) se proporciona en la tabla de resultados.
Puede trabajar con los datos de la tabla Resultados coincidentes de la siguiente manera:
En Filtro, seleccione Coincidir para mostrar todas las filas coincidentes y su puntuación. Las filas que no se consideran coincidencias (que tienen una puntuación coincidente inferior a la puntuación de coincidencia mínima) no se muestran en la tabla de resultados coincidentes. Seleccione No coincidentes para mostrar todas las filas no coincidentes, no filas emparejadas.
En el cuadro desplegable Porcentaje, seleccione un porcentaje en la lista desplegable, en incrementos de "5". Todas las filas con una puntuación coincidente mayor o igual que ese porcentaje se mostrarán en la tabla de resultados coincidentes.
Si hace doble clic en un registro en la tabla de resultados coincidentes, DQS muestra un menú emergente Detalles de la puntuación de coincidencia que muestra el registro pivote y el registro de origen (y los valores de todos sus campos), la puntuación entre ellos y examinando detalladamente la coincidencia de los registros. El desglose muestra los valores de cada campo tanto del registro dinámico como del registro de origen para poder compararlos, y muestra la puntuación de coincidencia que aporta cada campo a la puntuación global de coincidencia de los dos registros.
Vea las estadísticas en las pestañas Generador de perfiles y Resultados de coincidencia para asegurarse de que está logrando los resultados que necesita. Haga clic en la pestaña Reglas de coincidencia para ver cuál es la configuración de dominio de cada regla. Para obtener más información, vea Pestañas de perfiles y resultados.
Si no está satisfecho con los resultados de todas las reglas, haga clic en Atrás para volver a la página Directiva de coincidencia , modificar una o varias reglas según sea necesario, volver a la página Resultados de coincidencia y, a continuación, haga clic en Reiniciar.
Nota:
Una vez completado el análisis, el botón Iniciar se convierte en un botón Reiniciar . Si los resultados del análisis anterior aún no se han guardado, al hacer clic en Reiniciar , se perderán los datos anteriores.
Si está satisfecho con los resultados de todas las reglas, haga clic en Finalizar para completar el proceso de directiva de coincidencia y, a continuación, haga clic en uno de los siguientes:
Sí: publicar la base de conocimiento y salir: la base de conocimiento se publicará para que el usuario actual o otros usuarios la utilicen. La base de conocimiento no se bloqueará, el estado de la base de conocimiento (en la tabla de la base de conocimiento) se establecerá en vacío y estarán disponibles las actividades Administración de dominios y Detección de conocimiento. Volverá a la pantalla de Base de Conocimiento Abierta.
No: guardar el trabajo en la base de conocimiento y salir: se guardará el trabajo, la base de conocimiento permanecerá bloqueada y el estado de la base de conocimiento se establecerá en En trabajo. Las actividades administración de dominios y detección de conocimiento estarán disponibles. Se le devolverá a la página principal.
Cancelar: permanezca en la pantalla actual: el elemento emergente se cerrará y se le devolverá a la pantalla Administración de dominios.
Haga clic en Cerrar para guardar el trabajo y vuelva a la página principal de DQS. El estado de la base de conocimiento mostrará la cadena "Política de coincidencia-" y el estado actual. Si haces clic en Cerrar mientras estás en la pantalla Resultado de emparejamiento, el estado mostrará: "Política de emparejamiento - Resultados". Si hace clic en cerrar mientras se encuentra en la pantalla Directiva de coincidencia, el estado mostrará: "Directiva de coincidencia - Directiva de coincidencia". Después de hacer clic en Cerrar, para realizar la actividad de Descubrimiento de Conocimiento, tendría que volver a la actividad de Política de Correspondencia y hacer clic en Finalizar, luego elija entre hacer clic en Sí para publicar la base de conocimiento o No para guardar el trabajo en la base de conocimiento y salir.
Nota:
Si hace clic en Cerrar mientras se está ejecutando un proceso coincidente, el proceso de coincidencia no finalizará al hacer clic en Cerrar. Puede volver a abrir la base de conocimiento y ver que el proceso todavía se está ejecutando o, si se ha completado, que se muestran los resultados. Si el proceso no se ha completado, la pantalla mostrará el progreso.
Haga clic en Cancelar para terminar la actividad de la política de coincidencia, perdiendo el trabajo y volver a la página principal de DQS.
Seguimiento: después de crear una directiva de coincidencia
Después de crear una directiva de coincidencia, puede ejecutar un proyecto coincidente basado en la base de conocimiento que contiene la directiva de coincidencia. Para obtener más información, vea Ejecutar un proyecto coincidente.
Las pestañas de perfilador y resultados
La pestaña Perfilador y Resultados contiene estadísticas para las páginas Política de coincidencia y Resultados de coincidencia.
Pestaña Generador de perfiles
Haga clic en la pestaña Generador de perfiles para mostrar las estadísticas de la base de datos de origen y para cada campo incluido en la regla de directiva. Las estadísticas se actualizarán a medida que se ejecute la regla de directiva.
Para obtener más información sobre cómo interpretar las estadísticas siguientes, vea Cómo establecer parámetros de regla de coincidencia.
Las estadísticas de la base de datos de origen incluyen lo siguiente:
Registros: el número total de registros de la base de datos de origen
Valores totales: el número total de valores en los campos del origen de datos
Nuevos valores: el número total de valores que son nuevos desde la ejecución anterior y su porcentaje de todo
Valores únicos: el número total de valores únicos en los campos y su porcentaje de todo
Nuevos valores únicos: el número total de valores únicos que son nuevos en los campos y su porcentaje de todo el
Las estadísticas de campo incluyen lo siguiente:
Nombre del campo
Nombre de dominio
Nuevo: el número de valores nuevos y el porcentaje de valores nuevos en comparación con los valores existentes en el dominio
Único: número de registros únicos en el campo y su porcentaje del total
Completitud: La completitud de cada campo de origen que se asigna para el ejercicio de coincidencia
Notificaciones de política de coincidencia
Para la actividad de directiva coincidente, las siguientes condiciones dan lugar a notificaciones:
El campo está vacío en todos los registros; se recomienda eliminarlo del mapeo.
La puntuación de completitud del campo es muy baja; puede que desee eliminarlo del mapeo.
Todos los valores de un campo son inválidos; debe comprobar la asignación y la relevancia de las reglas de dominio para el contenido del campo.
Hay un bajo nivel de valores válidos en el campo; debe comprobar el mapeo y la pertinencia o relevancia de las reglas de dominio para el contenido del campo.
Hay un alto nivel de unicidad en este campo. El uso de este campo en la política de coincidencia puede reducir los resultados de coincidencia.
Pestaña Resultados coincidentes
Haga clic en la pestaña Resultados de coincidencia para mostrar las estadísticas de la ejecución de la regla de directiva de coincidencia y la ejecución de la regla anterior. Si ha ejecutado la misma regla más de una vez con parámetros diferentes, la tabla de resultados coincidentes mostrará las estadísticas de ambas ejecuciones, lo que le permite compararlas. También puede restaurar la regla anterior si lo desea.
Las estadísticas incluyen lo siguiente:
Número total de registros de la base de datos
Número total de registros coincidentes en la base de datos
Número de registros de la base de datos que no se consideran duplicados
Número de clústeres detectados
Tamaño medio del clúster (número de registros duplicados divididos por el número de clústeres)
El menor número de duplicados de un clúster
El mayor número de duplicados en un clúster