Compartilhar via


Criar projetos personalizados do Estúdio da Informação de Documentos

Esse conteúdo se aplica a:marca de seleçãov4.0 (GA) | Versões anteriores:marca de seleção azulv3.1 (GA)marca de seleção azulv3.0 (GA)

O Azure Document Intelligence no Foundry Tools Studio é uma ferramenta online que você pode usar para explorar, entender e integrar visualmente os recursos do Document Intelligence em seus aplicativos. Esse início rápido tem como objetivo mostrar como configurar um projeto personalizado no Estúdio da Informação de Documentos.

Pré-requisitos

Para obter informações sobre assinatura, recurso e configuração de autenticação, confira Introdução ao Estúdio da Informação de Documentos.

Pré-requisitos para novos usuários

Além de uma conta do Azure e do recurso Informação de Documentos ou Microsoft Foundry, você precisa de um contêiner do Armazenamento de Blobs do Azure e de atribuições de função do Azure.

Contêiner do Armazenamento de Blob do Azure

Você precisa de uma conta de Armazenamento de Blobs do Azure com desempenho padrão. Crie contêineres para armazenar e organizar seus documentos de treinamento em sua conta de armazenamento. Se você não souber como criar uma conta de armazenamento do Azure com um contêiner, siga este início rápido:

  • Criar uma conta de armazenamento: ao criar sua conta de armazenamento, no campo Detalhes da instância>Desempenho, selecione Desempenho padrão.
  • Criar um contêiner: ao criar seu contêiner, no painel Novo Contêiner, defina o campo Nível de acesso público como Contêiner (acesso de leitura anônimo para contêineres e blobs).

Atribuições de função do Azure

Para projetos personalizados, as atribuições de função a seguir são necessárias para cenários diferentes:

  • Básico

    • Usuário dos Serviços Cognitivos: você precisa dessa função para que o recurso de Inteligência de Documento ou Microsoft Foundry treine o modelo personalizado ou faça análises com modelos treinados.
    • Colaborador de dados de blob de armazenamento: você precisa dessa função para que a conta de armazenamento crie um projeto e rotule dados.
  • Avançado

    • Colaborador de Conta de Armazenamento: é necessário ter essa função para que a conta de armazenamento defina as configurações de CORS (compartilhamento de recursos entre origens). (Essa ação é um esforço único se a mesma conta de armazenamento for reutilizada.)
    • Colaborador: você precisa dessa função para criar recursos e um grupo de recursos.

    Note

    Se a autenticação local (baseada em chave) estiver desabilitada para sua conta de armazenamento e recurso de serviço da Informação de Documentos, certifique-se de obter funções de Usuário dos Serviços Cognitivos e Colaborador de Dados de Blob de Armazenamento, respectivamente, para que você tenha permissões suficientes para usar o Estúdio da Informação de Documentos. As funções Colaborador da Conta de Armazenamento e Colaborador só permitem que você liste chaves, mas não dá permissão para usar os recursos quando o acesso à chave estiver desabilitado.

Configurar o CORS

O compartilhamento de recursos entre origens deve ser configurado na sua conta de armazenamento do Azure para que ela seja acessível a partir do Estúdio da Informação de Documentos. Para configurar o CORS no portal do Azure, você precisará de acesso à guia CORS da sua conta de armazenamento.

  1. Selecione a guia CORS da conta de armazenamento.

    Captura de tela que mostra o menu de configuração do CORS no portal do Azure.

  2. Comece criando uma nova entrada do CORS na guia Serviço Blob.

  3. Defina Origens permitidas como https://documentintelligence.ai.azure.com.

    Captura de tela que mostra a configuração do CORS para uma conta de armazenamento.

    Você pode usar o caractere curinga * em vez de um domínio especificado para permitir que todos os domínios de origem façam solicitações por CORS.

  4. Selecione todas as oito opções disponíveis para Métodos permitidos.

  5. Aprove todos os Cabeçalhos permitidos e Cabeçalhos expostos inserindo um (*) em cada campo.

  6. Defina Idade Máxima como 120 segundos ou qualquer valor aceitável.

  7. Para salvar as alterações, selecione Salvar na parte superior da página.

O CORS já estará configurado para usar a conta de armazenamento no Estúdio da Informação de Documentos.

Conjunto de documentos de exemplo

  1. Entre no portal do Azure. Vá para sua conta de armazenamento e selecioneArmazenamento de dados>Contêineres.

    Captura de tela que mostra o menu de Armazenamento de dados no portal do Microsoft Azure.

  2. Selecione um contêiner na lista.

  3. No menu na parte superior da página, selecione Carregar.

    Captura de tela que mostra o botão Carregar contêiner na portal do Microsoft Azure.

  4. No painel Carregar blob, selecione os arquivos a serem carregados.

    Captura de tela que mostra o painel Carregar blob no portal do Azure.

Note

Por padrão, o Estúdio da Informação de Documentos usa documentos localizados na raiz do contêiner. Você pode usar dados organizados em pastas ao especificar o caminho da pasta nas etapas de criação de projeto do formulário personalizado. Para obter mais informações, consulteOrganizar os dados em subpastas.

Usar recursos do Document Intelligence Studio

Rotular automaticamente documentos com modelos predefinidos ou com um de seus próprios modelos

Na página de rotulagem do modelo de extração personalizado, agora você pode rotular automaticamente seus documentos usando um dos modelos predefinidos do Serviço de Informação de Documentos ou seus modelos treinados.

Captura de tela animada que mostra a rotulagem automática.

Para alguns documentos, rótulos duplicados após a execução do rótulo automático são possíveis. Modifique os rótulos para que não haja rótulos duplicados na página de rotulagem posteriormente.

Captura de tela que mostra o aviso de rótulo duplicado após a rotulagem automática.

Tabelas de rótulo automático

Na página de rotulagem do modelo de extração personalizado, você já pode rotular automaticamente as tabelas no documento sem precisar rotular as tabelas manualmente.

Captura de tela animada que mostra a rotulagem de tabela automática.

Adicione arquivos de teste diretamente ao seu conjunto de dados de treinamento

Depois de treinar um modelo de extração personalizado, use a página de teste para melhorar a qualidade do modelo, carregando documentos de teste no conjunto de dados de treinamento, se necessário.

Se uma pontuação de confiança baixa for retornada para alguns rótulos, certifique-se de rotular corretamente seu conteúdo. Caso contrário, adicione-os ao conjunto de dados de treinamento e recrie os rótulos para aprimorar a qualidade do modelo.

Captura de tela animada que mostra como adicionar arquivos de teste a um conjunto de dados de treinamento.

Use as opções e os filtros da lista de documentos em projetos personalizados

Use a página de rotulagem do modelo de extração personalizado para navegar por seus documentos de treinamento com facilidade fazendo uso da pesquisa, filtro e classificação por recurso.

Use a exibição de grade para visualizar documentos ou use a exibição de lista para percorrer os documentos com mais facilidade.

Captura de tela que mostra as opções de exibição de lista de documentos e os filtros.

Compartilhamento de projetos

Compartilhe projetos de extração personalizados com facilidade. Para obter mais informações, veja Compartilhamento de projetos com modelos personalizados.