Nutriente - Extrato de PDF (Pré-visualização)

Desbloqueie texto PDF poderoso e extração de dados com ações Nutrient Document Converter Extract. Recupere facilmente texto, dados, extraia pares chave-valor e aproveite a tecnologia OCR para processar documentos digitalizados. Ideal para indexação, pesquisa, análise de conteúdo e fluxos de trabalho de dados estruturados.

Este conector está disponível nos seguintes produtos e regiões:

Serviço	Class	Regiões
Estúdio Copiloto	Premium	Todas as regiões do Power Automatic , exceto as seguintes: - Governo dos EUA (CCG) - Governo dos EUA (GCC High) - China Cloud operado pela 21Vianet - Departamento de Defesa dos EUA (DoD)
Aplicações Lógicas	Standard	Todas as regiões do Logic Apps , exceto as seguintes: - Regiões do Azure Government - Regiões do Azure China - Departamento de Defesa dos EUA (DoD)
Aplicações Power	Premium	Todas as regiões do Power Apps , exceto as seguintes: - Governo dos EUA (CCG) - Governo dos EUA (GCC High) - China Cloud operado pela 21Vianet - Departamento de Defesa dos EUA (DoD)
Automatize o poder	Premium	Todas as regiões do Power Automatic , exceto as seguintes: - Governo dos EUA (CCG) - Governo dos EUA (GCC High) - China Cloud operado pela 21Vianet - Departamento de Defesa dos EUA (DoD)

Contato
Nome	Suporte de nutrientes (anteriormente Muhimbi)
URL	https://support.nutrient.io/hc/en-us/requests/new
Email	support+low-code@nutrient.io

Metadados do conector
Editora	Muhimbi negociando como Nutriente
Sítio Web	https://www.nutrient.io/low-code/
Política de privacidade	https://www.nutrient.io/legal/privacy/
Categorias	Colaboração; Conteúdo e Ficheiros

Extrair texto e dados de PDFs

O Nutrient Document Converter permite-lhe extrair texto, dados ou páginas específicas de ficheiros PDF como parte de fluxos de trabalho automatizados no Power Automate. Você também pode extrair texto de imagens usando OCR.

Ações disponíveis

Consulte os guias vinculados para obter instruções passo a passo sobre como implementar essas ações em seus fluxos de trabalho.

Pré-requisitos

Para usar o Nutrient Document Converter, você precisa de uma conta gratuita ou de avaliação . Consulte o guia de comparação para entender as diferenças entre esses tipos de conta.

Como Começar

Siga os passos abaixo para começar a usar o conector Nutrient Document Converter:

Inscreva-se para uma avaliação de 30 dias preenchendo este formulário.
Depois de enviar o formulário, você receberá um e-mail com os detalhes da ativação da versão experimental.
Consulte o vídeo de introdução para obter um passo a passo do processo.
Leia o guia Document Converter for Power Automate para obter instruções detalhadas.
Explore os tutoriais Power Automate e Logic Apps para obter exemplos práticos.

Problemas conhecidos e limitações

Os documentos protegidos com soluções IRM, DRM, RMS ou AIP não podem ser processados devido a restrições de segurança.

Em caso de dúvidas ou assistência, entre em contato com nossa equipe de suporte.

Limites de Limitação

Name	Chamadas	Período de Renovação
Chamadas de API por conexão	100	60 segundos

Ações

Extrair pares de valores de chave de um documento PDF	Identifique e extraia pares chave-valor de documentos para processar formulários ou fluxos de trabalho de dados estruturados.
Extrair texto de um arquivo PDF usando OCR	Extraia texto de documentos ou imagens digitalizadas usando a tecnologia OCR, tornando-os pesquisáveis e editáveis.
Extrair texto de um documento PDF	Recupere conteúdo de texto de documentos PDF para facilitar a indexação, pesquisa ou análise de conteúdo.

Extrair pares de valores de chave de um documento PDF

ID da Operação:: extract_key_value_pairs

Identifique e extraia pares chave-valor de documentos para processar formulários ou fluxos de trabalho de dados estruturados.

Parâmetros

Name	Chave	Necessário	Tipo	Description
Nome do arquivo de origem	source_file_name	True	string	Nome do ficheiro de origem, incluindo a extensão
Conteúdo do ficheiro de origem	source_file_content	True	byte	Conteúdo do ficheiro a converter
Linguagem OCR	ocr_language		string	Os códigos de idioma para extração de OCR e KVP, separados por '+'. Por exemplo, 'eng+deu+fra' adicionaria inglês, alemão e francês.
DPI	dpi		enum	Remover as páginas em branco no PDF
Formato de saída KVP	kvp_format		enum	Os formatos de saída separados por vírgulas. Os dados KVP podem ser enviados em JSON, CSV e XML. e.g. json,csv,xml
Intervalo de páginas	page_range		string	As páginas a serem processadas pelo KVP. Use a cadeia de caracteres de '1 - 5' para as páginas 1 a 5, ou use a cadeia de caracteres de '1, 5, 6' para especificar as páginas 1 e 5 e 6.
Rotação automática	autorotate		enum	Definir isso como 'Sim' girará automaticamente as páginas se o texto não tiver a orientação correta.
Símbolos de corte	trim_symbols		enum	Definir isso como 'Sim' removerá todos os símbolos do início/fim dos valores, com exceção dos símbolos hash '#' ou ponto '.
Incluir caixa delimitadora de chave	include_key_bounding_box		enum	Incluir os valores da caixa delimitadora para a chave na saída
Incluir caixa delimitadora de valor	include_value_bounding_box		enum	Incluir os valores da caixa delimitadora para o valor na saída
Incluir número de página	include_page_number		enum	Inclua o número da página para o par de valores de chave na saída
Incluir Confiança	include_confidence		enum	Inclua a pontuação de confiança para o par de valores-chave na saída. A confiança é medida entre 0 (sem confiança) e 100 (confiança total).
Limiar de Confiança	confidence_threshold		integer	O limiar de confiança que um par de valores-chave deve atingir para ser incluído na saída. Os resultados abaixo do limite são descartados.
Incluir tipo	include_type		enum	Incluir o tipo de dados para o par de valores de chave na saída
Chaves esperadas	expected_keys		string	A cadeia de caracteres JSON que contém as chaves esperadas e sinônimos
Falha no erro	fail_on_error		boolean	Falha no erro

Devoluções

Dados de resposta para todas as operações

Body: operation_response

Extrair texto de um arquivo PDF usando OCR

ID da Operação:: ocr_text

Extraia texto de documentos ou imagens digitalizadas usando a tecnologia OCR, tornando-os pesquisáveis e editáveis.

Parâmetros

Name	Chave	Necessário	Tipo	Description
Nome do arquivo de origem	source_file_name	True	string	Nome do ficheiro de origem, incluindo a extensão
Conteúdo do ficheiro de origem	source_file_content	True	byte	Conteúdo do ficheiro para OCR
Linguagem	language		enum	Linguagem
Coordenada X	x		string	Coordenada X (em Pts, 1/72 de polegada)
Coordenada Y	y		string	Coordenada Y (em Pts, 1/72 de polegada)
Largura	width		string	Largura da área OCR (em Pts, 1/72 de polegada)
Altura	height		string	Altura da área OCR (em Pts, 1/72 de polegada)
Número da página	page_number		string	Número da página (deixar em branco para OCR todas as páginas)
Performance	performance		enum	Desempenho ()
Lista negra / lista branca	characters_option		enum	Opção de caracteres
Personagens	characters		string	Caracteres para a lista negra ou lista branca
Usar paginação	paginate		boolean	Paginato
Falha no erro	fail_on_error		boolean	Falha no erro

Devoluções

Dados de resposta para operação OCRText

Body: ocr_operation_response

Extrair texto de um documento PDF

ID da Operação:: extract_text

Recupere conteúdo de texto de documentos PDF para facilitar a indexação, pesquisa ou análise de conteúdo.

Parâmetros

Name	Chave	Necessário	Tipo	Description
Nome do arquivo de origem	source_file_name	True	string	Nome do ficheiro de origem, incluindo a extensão
Conteúdo do ficheiro de origem	source_file_content	True	byte	Conteúdo do ficheiro a converter
Intervalo de páginas	page_range		string	O intervalo de páginas para extrair texto, por exemplo, 1,5,8-12
Falha no erro	fail_on_error		boolean	Falha no erro

Devoluções

Dados de resposta para todas as operações

Body: operation_response

Definições

ocr_operation_response

Dados de resposta para operação OCRText

Name	Caminho	Tipo	Description
Texto de saída	out_text	string	Texto OCRed extraído em texto simples.
Nome do ficheiro base	base_file_name	string	Nome do arquivo de entrada sem a extensão.
Código do resultado	result_code	enum	Código do resultado da operação.
Detalhes do resultado	result_details	string	Detalhes do resultado da operação.

operation_response

Dados de resposta para todas as operações

Name	Caminho	Tipo	Description
Conteúdo do arquivo processado	processed_file_content	byte	Arquivo gerado pelo conversor Muhimbi.
Nome do ficheiro base	base_file_name	string	Nome do arquivo de entrada sem a extensão.
Código do resultado	result_code	enum	Código do resultado da operação.
Detalhes do resultado	result_details	string	Detalhes do resultado da operação.

Partilhar via

Nutriente - Extrato de PDF (Pré-visualização)

Extrair texto e dados de PDFs

Ações disponíveis

Pré-requisitos

Como Começar

Problemas conhecidos e limitações

Limites de Limitação

Ações

Extrair pares de valores de chave de um documento PDF

Parâmetros

Devoluções

Extrair texto de um arquivo PDF usando OCR

Parâmetros

Devoluções

Extrair texto de um documento PDF

Parâmetros

Devoluções

Definições

ocr_operation_response

operation_response