Partilhar via


Nutriente - PDF OCR

Transforme documentos e imagens digitalizados em PDFs pesquisáveis e editáveis com ações OCR do Nutrient Document Converter. Extraia facilmente texto de PDFs usando a tecnologia avançada de reconhecimento ótico de caracteres (OCR) para indexação, automação e análise de conteúdo.

Este conector está disponível nos seguintes produtos e regiões:

Serviço Class Regiões
Estúdio Copiloto Premium Todas as regiões do Power Automatic , exceto as seguintes:
     - Governo dos EUA (CCG)
     - Governo dos EUA (GCC High)
     - China Cloud operado pela 21Vianet
     - Departamento de Defesa dos EUA (DoD)
Aplicações Lógicas Standard Todas as regiões do Logic Apps , exceto as seguintes:
     - Regiões do Azure Government
     - Regiões do Azure China
     - Departamento de Defesa dos EUA (DoD)
Aplicações Power Premium Todas as regiões do Power Apps , exceto as seguintes:
     - Governo dos EUA (CCG)
     - Governo dos EUA (GCC High)
     - China Cloud operado pela 21Vianet
     - Departamento de Defesa dos EUA (DoD)
Automatize o poder Premium Todas as regiões do Power Automatic , exceto as seguintes:
     - Governo dos EUA (CCG)
     - Governo dos EUA (GCC High)
     - China Cloud operado pela 21Vianet
     - Departamento de Defesa dos EUA (DoD)
Contato
Nome Suporte de nutrientes (anteriormente Muhimbi)
URL https://support.nutrient.io/hc/en-us/requests/new
Email support+low-code@nutrient.io
Metadados do conector
Editora Muhimbi negociando como Nutriente
Sítio Web https://www.nutrient.io/low-code/
Política de privacidade https://www.nutrient.io/legal/privacy/
Categorias Colaboração; Conteúdo e Ficheiros

Execute OCR em imagens e documentos digitalizados

Use o Nutrient Document Converter para executar o Reconhecimento Ótico de Caracteres (OCR) em imagens e arquivos digitalizados por meio de uma API REST ou de uma biblioteca de servidor auto-hospedada.

Capacidades de OCR

  • Converta imagens, digitalizações e faxes em PDFs pesquisáveis.
  • Crie fluxos de trabalho automatizados de documentos para extração de texto e capacidade de pesquisa de PDF.

Opções de integração

Integre a funcionalidade OCR com exemplos de código no seu idioma preferido:

Pré-requisitos

Para usar o Nutrient Document Converter, você precisa de uma conta gratuita ou de avaliação . Consulte o guia de comparação para entender as diferenças entre esses tipos de conta.

Como Começar

Siga os passos abaixo para começar a usar o conector Nutrient Document Converter:

Problemas conhecidos e limitações

Os documentos protegidos com soluções IRM, DRM, RMS ou AIP não podem ser processados devido a restrições de segurança.

Em caso de dúvidas ou assistência, entre em contato com nossa equipe de suporte.

Limites de Limitação

Name Chamadas Período de Renovação
Chamadas de API por conexão 100 60 segundos

Ações

Converter para PDF OCRed

Execute OCR em um documento PDF existente ou em uma imagem para criar um PDF pesquisável

Extrair texto usando OCR

Extrair texto de um arquivo PDF usando OCR

Converter para PDF OCRed

Execute OCR em um documento PDF existente ou em uma imagem para criar um PDF pesquisável

Parâmetros

Name Chave Necessário Tipo Description
Nome do arquivo de origem
source_file_name True string

Nome do ficheiro de origem, incluindo a extensão

Conteúdo do ficheiro de origem
source_file_content True byte

Conteúdo do ficheiro para OCR

Linguagem
language enum

Linguagem

Performance
performance enum

Performance

Lista negra / lista branca
characters_option enum

Opção de caracteres

Personagens
characters string

Caracteres para a lista negra ou lista branca

Usar paginação
paginate boolean

Paginato

Regiões
regions string

Limitar a área a OCR a uma ou mais áreas específicas

Falha no erro
fail_on_error boolean

Falha no erro

Devoluções

Dados de resposta para todas as operações

Extrair texto usando OCR

Extrair texto de um arquivo PDF usando OCR

Parâmetros

Name Chave Necessário Tipo Description
Nome do arquivo de origem
source_file_name True string

Nome do ficheiro de origem, incluindo a extensão

Conteúdo do ficheiro de origem
source_file_content True byte

Conteúdo do ficheiro para OCR

Linguagem
language enum

Linguagem

Coordenada X
x string

Coordenada X (em Pts, 1/72 de polegada)

Coordenada Y
y string

Coordenada Y (em Pts, 1/72 de polegada)

Largura
width string

Largura da área OCR (em Pts, 1/72 de polegada)

Altura
height string

Altura da área OCR (em Pts, 1/72 de polegada)

Número da página
page_number string

Número da página (deixar em branco para OCR todas as páginas)

Performance
performance enum

Desempenho ()

Lista negra / lista branca
characters_option enum

Opção de caracteres

Personagens
characters string

Caracteres para a lista negra ou lista branca

Usar paginação
paginate boolean

Paginato

Falha no erro
fail_on_error boolean

Falha no erro

Devoluções

Dados de resposta para operação OCRText

Definições

ocr_operation_response

Dados de resposta para operação OCRText

Name Caminho Tipo Description
Texto de saída
out_text string

Texto OCRed extraído em texto simples.

Nome do ficheiro base
base_file_name string

Nome do arquivo de entrada sem a extensão.

Código do resultado
result_code enum

Código do resultado da operação.

Detalhes do resultado
result_details string

Detalhes do resultado da operação.

operation_response

Dados de resposta para todas as operações

Name Caminho Tipo Description
Conteúdo do arquivo processado
processed_file_content byte

Arquivo gerado pelo conversor Muhimbi.

Nome do ficheiro base
base_file_name string

Nome do arquivo de entrada sem a extensão.

Código do resultado
result_code enum

Código do resultado da operação.

Detalhes do resultado
result_details string

Detalhes do resultado da operação.