Partilhar via


Conceitos do Data Quality Services

Este tópico fornece um breve resumo dos conceitos do DQS (Data Quality Services) no gerenciamento de conhecimento, projetos de qualidade de dados e administração de qualidade de dados.

Conceitos de Gerenciamento de Conhecimento

A base de dados de conhecimento do DQS é um repositório de metadados criado pelo administrador de dados ou profissional de TI para uso na melhoria da qualidade dos dados por meio da limpeza de dados e da correspondência de dados. O gerenciamento de conhecimento do DQS inclui os processos usados para criar e gerenciar a base de dados de conhecimento, tanto de maneira assistida por computador quanto interativamente.

Descoberta de conhecimento

A descoberta de conhecimento é um processo assistido por computador que analisa exemplos de dados da sua organização para criar conhecimento sobre os dados. Depois de ter os resultados da análise, você pode validar e aperfeiçoar o conhecimento e aplicá-lo para executar a limpeza de dados, a correspondência e a criação de perfil. Para obter mais informações, consulte Bases de Dados de Conhecimento e Domínios do DQS.

Gerenciamento de Domínio

O processo de gerenciamento de domínio permite que você altere ou aumente o conhecimento gerado pelo processo de descoberta de conhecimento. Você pode editar, atualizar e revisar interativamente o conhecimento em uma base de dados de conhecimento. Uma base de dados de conhecimento consiste em domínios de dados que contêm valores de domínio e seu status, regras de domínio, relações baseadas em termos e dados de referência. No gerenciamento de domínio, você pode alterar propriedades de domínio, anexar dados de referência a um domínio, gerenciar regras de domínio, gerenciar valores de domínio e inserir relações de dados e criar, excluir, importar ou exportar domínios. Você também pode usar domínios compostos que agregam mais de um único domínio. Para obter mais informações, consulte Bases de Dados de Conhecimento e Domínios do DQS.

Política de correspondência

Uma política de correspondência contém as regras de correspondência usadas para executar a eliminação de dados duplicados. O processo de política correspondente permite que você crie regras correspondentes, ajuste-as com base em resultados correspondentes e dados de criação de perfil e adicione a política à base de dados de conhecimento. Para obter mais informações, consulte Comparação de Dados.

Serviços de Dados de Referência

Você pode usar dados de referência para validar, corrigir e enriquecer seus dados, aproveitando os serviços de empresas que garantem a qualidade de seus dados de referência. Você pode usar os serviços do Azure Marketplace para se conectar a provedores de dados de referência ou pode usar uma conexão direta com um provedor. Para obter mais informações, consulte Reference Data Services in DQS.

Para obter mais informações sobre o gerenciamento de conhecimento no DQS, consulte Bases de Dados de Conhecimento e Domínios do DQS.

Conceitos do Projeto de Qualidade de Dados

O administrador de dados executa operações de qualidade de dados (limpeza e correspondência) usando um projeto de qualidade de dados no aplicativo Cliente de Qualidade de Dados.

Limpeza de dados

A limpeza de dados no DQS é realizada com base no conhecimento em uma base de conhecimento do DQS. A limpeza de dados no DQS é um processo de duas etapas:

  • Limpeza assistida por computador: o DQS usa o conhecimento na base de dados de conhecimento selecionada para o projeto de limpeza para propor correções/sugestões aos valores em uma fonte de dados.

  • Limpeza Interativa: o administrador de dados pode executar o processo de limpeza interativa para alterar ou aumentar as correções de dados que foram propostas pelo processo de limpeza de dados assistidos por computador. O administrador de dados faz isso usando níveis de confiança e estatísticas identificados pelo processo de limpeza de dados ou inserindo manualmente suas próprias alterações no projeto.

Depois de limpar dados, o administrador de dados pode exportar os dados processados para um banco de dados do SQL Server, .csvou um arquivo do Excel. Para obter mais informações, consulte Limpeza de Dados.

Correspondência de dados

O processo de correspondência permite que o administrador de dados compare dados para que dados semelhantes, mas ligeiramente diferentes, possam ser alinhados por meio de um processo de eliminação de duplicação. O DQS executa a desduplicação com base nas regras de correspondência contidas na base de conhecimento; o administrador de dados especifica parâmetros para o processo de correspondência dentro de um projeto de qualidade de dados. Para obter mais informações, consulte Conciliação de Dados.

Criação de perfil e notificações

A criação de perfil de dados fornece aos administradores de dados estatísticas e informações em tempo real sobre os dados que estão sendo processados pelo DQS para as atividades de limpeza ou correspondência durante a execução de um projeto de qualidade de dados. A criação de perfil de dados ajuda você a avaliar a eficácia das atividades de limpeza e correspondência em um projeto de qualidade de dados e as notificações ajudam o usuário com ações que podem ser executadas para aprimorar as atividades de limpeza de dados e correspondência de dados. Para obter mais informações, consulte Perfil de Dados e Notificações no DQS.

Para obter mais informações sobre projetos de qualidade de dados no DQS, consulte DQS (Projetos de Qualidade de Dados).

Conceitos de Administração de Qualidade de Dados

Um administrador do DQS pode executar várias tarefas administrativas usando o aplicativo Cliente de Qualidade de Dados.

Monitoramento de atividades

O monitoramento de atividades exibe o status e o estado de cada atividade executada em um intervalo de dados, fornece dados para cada atividade e permite que os administradores do DQS controlem uma atividade. Para obter mais informações, consulte Monitorar atividades do DQS.

Configuração

A opção Configuração permite que você:

Segurança do DQS

Você usa funções dentro do mecanismo de segurança do SQL Server para tornar o DQS seguro. Há três funções DQS que determinam o nível de acesso de um usuário no aplicativo Cliente de Qualidade de Dados: dqs_administrator, dqs_kb_editor e dqs_kb_operator. Você não pode conceder funções aos usuários usando o aplicativo Cliente de Qualidade de Dados; é feito usando o SQL Server Management Studio. Para obter mais informações, consulte Segurança do DQS.

Para obter mais informações sobre a administração do DQS, consulte Administração do DQS.

Consulte Também

Serviços de Qualidade de Dados