Partilhar via


Tarefa 1: Definindo uma política de correspondência

Nesta tarefa, você criará uma política de correspondência com uma regra nela. A regra terá um pré-requisito: Supplier ID, o que significa que as IDs de Fornecedor deverão corresponder antes do uso de outros domínios na regra. A regra usa os outros dois domínios: Supplier Name com o valor Similaridade definido como 70% e Contact Email com o valor Similaridade definido como 30%.

  1. Na página principal do Cliente DQS, clique na seta para a direita ao lado da base de conhecimento Fornecedores e selecione Política de Correspondência.

    Menu Política de Correspondência na página principal

  2. Na página Mapear, selecione Arquivo do Excel em Fonte de Dados.

  3. Clique em Procurar, verifique se o filtro está definido como Pasta de Trabalho do Excel e selecione o arquivo Cleansed Supplier List.xls que você exportou depois de executar a atividade de limpeza.

    ObservaçãoObservação

    No final dessa atividade, você não poderá exportar os resultados, pois ela é centralizada basicamente na definição de uma política de correspondência. Você criará um Projeto de Qualidade de Dados para a atividade de correspondência e o executará para remover as duplicatas da lista de fornecedores usando essa política de correspondência na próxima lição.

  4. Mapeie a coluna SupplierID para o domínio Supplier ID, a coluna Supplier Name para o domínio Supplier Name, a coluna ContactEmailAddress para o domínio Contact Email. Você só precisa mapear as colunas de origem para domínios que queira usar na definição da política de correspondência. Nesse caso, você está tornando os domínios Supplier ID, Supplier Name e Contact Email disponíveis para a atividade de política de correspondência.

    Página Mapa do Processo de Definição da Política de Correspondência

  5. Clique em Avançar para mover a página Política de Correspondência para o local onde você definirá uma política de correspondência com uma regra nela.

  6. Clique no botão de Criar uma regra de correspondência na barra de ferramentas para criar uma regra na política.

    Botão de barra de ferramentas Criar uma Regra Correspondente

  7. No painel Detalhes da Regra à direita, digite Remover Fornecedores Duplicados em Nome da regra.

  8. Clique em Adicionar um novo elemento de domínio na barra de ferramentas no painel direito.

    Detalhes de regra - Botão Adicionar um Novo Elemento de Domínio

  9. Selecione Supplier ID como domínio e marque a caixa de seleção Pré-requisito. Observe que a Similaridade será definida automaticamente como Exata. Ao definir Supplier ID como o Pré-requisito, você especifica que os valores deste campo em dois registros diferentes devem retornar uma correspondência de 100% ou os registros não serão considerados uma correspondência e as outras cláusulas na regra serão desconsideradas.

    Definição da regra Remover Fornecedores Duplicados

  10. Clique em Adicionar um novo elemento de domínio na barra de ferramentas novamente.

  11. Selecione o domínio Supplier Name, selecione Similar em Similaridade e digite 70 como Peso. Aqui, você está especificando que os nomes de fornecedor não precisam ser idênticos, mas podem ser semelhantes para que os registros sejam considerados uma correspondência. O peso indica a contribuição da pontuação desse campo para a pontuação de correspondência geral.

  12. Repita as duas etapas anteriores para adicionar o domínio Contact Email com 30 como Peso.

  13. Observe que a pontuação de correspondência mínima está definida como 80%, que é o valor exibido na guia Geral da página de Configuração da Administração do DQS. Você só poderá aumentar essa pontuação acima desse valor de limite aqui.

  14. Observe que a opção Clusters Sobrepostos está selecionada. Com essa opção, um registro pode aparecer em vários clusters. Se você alterar a configuração para Clusters Não Sobrepostos, os clusters que tiverem registros comuns serão combinados em um único cluster.

  15. O botão Iniciar nesta página permite testar cada regra na política separadamente, enquanto o botão Iniciar na próxima página permite a você testar toda a política (todas as regras na política).

  16. Clique em Avançar para alternar para a página Resultados Correspondentes.

Próxima etapa

Tarefa 2: Testando e publicando a política de correspondência