Partilhar via


Criar projetos personalizados do Document Intelligence Studio

Este conteúdo aplica-se a:checkmarkmarca de verificação | blue-checkmark v3.1 (GA)Marca de verificação azulv3.0 (GA)

O Azure Document Intelligence no Foundry Tools Studio é uma ferramenta online que pode usar para explorar visualmente, compreender e integrar funcionalidades do Document Intelligence nas suas aplicações. Este guia de início rápido tem como objetivo mostrar como configurar um projeto personalizado no Document Intelligence Studio.

Pré-requisitos

Para obter informações sobre a configuração de assinatura, recursos e autenticação, consulte Introdução ao Document Intelligence Studio.

Pré-requisitos para novos usuários

Para além de uma conta Azure e do recurso Document Intelligence ou Microsoft Foundry, precisa de um contentor Azure Blob Storage e atribuições de funções Azure.

Contêiner de Armazenamento de Blob do Azure

Você precisa de uma conta de Armazenamento de Blob do Azure de desempenho padrão. Você pode criar contêineres para armazenar e organizar seus documentos de treinamento em sua conta de armazenamento. Se você não souber como criar uma conta de armazenamento do Azure com um contêiner, siga estes inícios rápidos:

  • Criar uma conta de armazenamento: ao criar sua conta de armazenamento, no campo Detalhes> da instânciaDesempenho, selecione Desempenho padrão.
  • Criar um contêiner: ao criar seu contêiner, no painel Novo contêiner , defina o campo Nível de acesso público como Contêiner (acesso de leitura anônimo para contêineres e blobs).

Atribuições de funções do Azure

Para projetos personalizados, as seguintes atribuições de função são necessárias para diferentes cenários:

  • Básico

    • Utilizador de Serviços Cognitivos: Precisa deste papel para o recurso de Inteligência de Documentos ou Microsoft Foundry para treinar o modelo personalizado ou fazer análises com modelos treinados.
    • Contribuidor de dados de Blob de armazenamento: você precisa dessa função para a conta de armazenamento criar um projeto e rotular dados.
  • Avançado

    • Colaborador da conta de armazenamento: você precisa dessa função para que a conta de armazenamento configure as configurações de compartilhamento de recursos entre origens (CORS). (Esta ação é um esforço único se a mesma conta de armazenamento for reutilizada.)
    • Colaborador: você precisa dessa função para criar um grupo de recursos e recursos.

    Note

    Se a autenticação local (baseada em chave) estiver desabilitada para seu recurso de serviço de Inteligência Documental e conta de armazenamento, certifique-se de obter as funções de Usuário de Serviços Cognitivos e Colaborador de Dados de Blob de Armazenamento, respectivamente, para que você tenha permissões suficientes para usar o Document Intelligence Studio. As funções Colaborador da Conta de Armazenamento e Colaborador permitem listar chaves, mas não lhe dão permissão para usar os recursos quando o acesso à chave está desativado.

Configurar CORS

O compartilhamento de recursos entre origens deve ser configurado em sua conta de armazenamento do Azure para que seja acessível a partir do Document Intelligence Studio. Para configurar o CORS no portal do Azure, você precisa acessar a guia CORS da sua conta de armazenamento.

  1. Selecione a guia CORS para a conta de armazenamento.

    Captura de tela que mostra o menu de configuração CORS no portal do Azure.

  2. Comece criando uma nova entrada CORS na guia Serviço Blob .

  3. Defina Origens permitidas como https://documentintelligence.ai.azure.com.

    Captura de tela que mostra a configuração do CORS para uma conta de armazenamento.

    Você pode usar o caractere * curinga em vez de um domínio especificado para permitir que todos os domínios de origem façam solicitações via CORS.

  4. Selecione todas as oito opções disponíveis para métodos permitidos.

  5. Aprove todos os cabeçalhos Permitidos e Expostos inserindo um asterisco (*) em cada campo.

  6. Defina Max Age para 120 segundos ou qualquer valor aceitável.

  7. Para salvar as alterações, selecione Salvar na parte superior da página.

O CORS agora deve ser configurado para usar a conta de armazenamento do Document Intelligence Studio.

Conjunto de documentos de exemplo

  1. Inicie sessão no portal Azure. Vá para sua conta de armazenamento e selecione Contêineres de armazenamento de> dados.

    Captura de ecrã que mostra o menu Armazenamento de dados no portal do Azure.

  2. Selecione um contêiner na lista.

  3. No menu na parte superior da página, selecione Carregar.

    Captura de ecrã que mostra o botão Carregar contentor no portal do Azure.

  4. No painel Carregar blob , selecione os arquivos a serem carregados.

    Captura de ecrã que mostra o painel Carregar blob no portal do Azure.

Note

Por padrão, o Document Intelligence Studio usa documentos localizados na raiz do contêiner. Você pode usar dados organizados em pastas especificando o caminho da pasta nas etapas para criar um projeto de formulário personalizado. Para obter mais informações, consulte Organizar seus dados em subpastas.

Usar os recursos do Document Intelligence Studio

Documentos de etiquetagem automática com modelos pré-construídos ou um dos seus próprios modelos

Na página de rotulagem do modelo de extração personalizado, agora você pode rotular automaticamente seus documentos usando um dos modelos pré-criados do Document Intelligent Service ou seus modelos treinados.

Captura de tela animada que mostra a rotulagem automática.

Para alguns documentos, é possível duplicar etiquetas depois de executar a etiqueta automática. Certifique-se de modificar as etiquetas para que não haja etiquetas duplicadas na página de etiquetagem posteriormente.

Captura de tela que mostra o aviso de rótulo duplicado após a rotulagem automática.

Tabelas de etiquetagem automática

Na página de rotulagem do modelo de extração personalizado, agora você pode rotular automaticamente as tabelas no documento sem precisar rotular as tabelas manualmente.

Captura de tela animada que mostra a etiquetagem automática.

Adicionar arquivos de teste diretamente ao seu conjunto de dados de treinamento

Depois de treinar um modelo de extração personalizado, use a página de teste para melhorar a qualidade do modelo carregando documentos de teste para o conjunto de dados de treinamento, se necessário.

Se uma pontuação de confiança baixa for retornada para alguns rótulos, certifique-se de rotular corretamente seu conteúdo. Caso contrário, adicione-os ao conjunto de dados de treinamento e rerotule para melhorar a qualidade do modelo.

Captura de tela animada que mostra como adicionar arquivos de teste a um conjunto de dados de treinamento.

Faça uso das opções e filtros da lista de documentos em projetos personalizados

Use a página de rotulagem para o modelo de extração personalizado para examinar seus documentos de treinamento com facilidade, fazendo uso dos recursos de pesquisa, filtro e classificação por.

Utilize a vista de grelha para pré-visualizar documentos ou utilize a vista de lista para percorrer documentos mais facilmente.

Captura de ecrã que mostra as opções e filtros da vista de lista de documentos.

Partilha de projetos

Compartilhe projetos de extração personalizados com facilidade. Para obter mais informações, consulte Compartilhamento de projetos com modelos personalizados.