Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Aplica-se a:SQL Server
Importante
Os Serviços de Qualidade de Dados (DQS) foram removidos no SQL Server 2025 (17.x). Continuamos a oferecer suporte ao DQS no SQL Server 2022 (16.x) e em versões anteriores.
Este tópico fornece informações sobre limpeza de domínios compostos no Data Quality Services (DQS). Um domínio composto consiste em dois ou mais domínios únicos e mapeia para um campo de dados que consiste em vários termos relacionados. Os domínios individuais num domínio composto devem ter uma área de conhecimento comum. Para obter informações detalhadas sobre domínios compostos, consulte Gerenciando um domínio composto.
Mapeando um domínio composto para os dados de origem
Há duas maneiras de mapear seus dados de origem para um domínio composto:
Os dados de origem são um único campo (digamos Nome Completo), que é mapeado para um domínio composto.
Se o domínio composto for mapeado para um serviço de dados de referência, os dados de origem serão enviados como estão para o serviço de dados de referência para correção e análise.
Se o domínio composto não for mapeado para um serviço de dados de referência, será analisado com base no método de análise definido para o domínio composto. Para obter mais informações sobre como especificar um método de análise para domínios compostos, consulte Criar um domínio composto
Os dados de origem consistem em vários campos (digamos Nome, Nome do Meio e Sobrenome), que são mapeados para domínios individuais dentro de um domínio composto.
Para obter um exemplo de como mapear domínios compostos para dados de origem, consulte Anexar domínio ou domínio composto a dados de referência.
Correção de dados usando regras definitivas entre domínios
As regras entre domínios no domínio composto permitem criar regras que indicam a relação entre domínios individuais em um domínio composto. As regras entre domínios são levadas em conta quando você executa a atividade de limpeza em seus dados de origem envolvendo domínios compostos. Além de informar sobre a validade de uma regra entre domínios, a regra definitiva Then entre domínios, Value is equal to, também corrige os dados durante a atividade de limpeza de dados.
Considere o seguinte exemplo: há um domínio composto, Product, com três domínios individuais: ProductName, CompanyName e ProductVersion. Crie a seguinte regra definitiva entre domínios:
SE o valor do domínio 'CompanyName' contiver Microsoft e o valor do domínio 'ProductName' for igual a Office e o valor do domínio 'ProductVersion' for igual a 2010, ENTÃO o valor do domínio 'ProductName' será igual a Microsoft Office 2010.
Quando essa regra entre domínios é executada, os dados de origem (ProductName) são corrigidos para o seguinte após a atividade de limpeza:
Dados de origem
| Nome do Produto | Nome da Empresa | Versão do produto |
|---|---|---|
| Office | Microsoft Inc. | 2010 |
Dados de saída
| Nome do Produto | Nome da Empresa | Versão do produto |
|---|---|---|
| Microsoft Office 2010 | Microsoft Inc. | 2010 |
Quando testa a regra cruzada de domínio definitiva Then, Valor é igual a, a caixa de diálogo Testar Regra de Domínio Composto contém uma nova coluna, Corrigir para, que exibe os dados corrigidos. Em um projeto de qualidade de dados de limpeza, essa regra definitiva entre domínios altera os dados com 100% de confiança, e a coluna Razão exibe a seguinte mensagem: Corrigido pela regra 'Nome< da regra entre> domínios'. Para obter mais informações sobre regras entre domínios, consulte Criar uma regra entre domínios.
Observação
A regra definitiva entre domínios não funcionará para domínios compostos anexados ao serviço de dados de referência.
Perfil de dados para domínios compostos
A criação de perfil DQS fornece duas dimensões de qualidade de dados: completude (a extensão em que os dados estão presentes) e precisão (a extensão em que os dados podem ser usados para o uso pretendido) durante a atividade de limpeza. A criação de perfis pode não fornecer estatísticas confiáveis de completude para domínios compostos. Se você precisar de estatísticas de completude, use domínios únicos em vez de domínios compostos. Se quiser usar domínios compostos, convém criar uma base de dados de conhecimento com domínios únicos para criação de perfil, determinar a integridade e criar outro domínio com um domínio composto para a atividade de limpeza. Por exemplo, a criação de perfil pode mostrar 95% completude para registros de endereço usando um domínio composto, mas pode haver um nível muito maior de incompletude para uma das colunas, por exemplo, uma coluna de código postal (CEP). Neste exemplo, talvez você queira medir a integridade da coluna de CEP com um único domínio.
A criação de perfil provavelmente fornecerá estatísticas de precisão confiáveis para domínios compostos, pois você pode medir a precisão de várias colunas juntas. O valor desses dados está na agregação composta, portanto, convém medir a precisão com um domínio composto.
Para obter informações detalhadas sobre a perfilagem de dados durante a atividade de limpeza, consulte Estatísticas de perfil em Limpar Dados Usando o Conhecimento Interno do DQS.