Partilhar via


Aquafloresta PDF

O conector PDF Aquaforest contém um grupo de ações que executa diferentes operações de PDF, como divisão, extração de texto, extração de código de barras e operações OCR para Office 365 e Power Automate.

Este conector está disponível nos seguintes produtos e regiões:

Serviço Class Regiões
Estúdio Copiloto Premium Todas as regiões do Power Automatic , exceto as seguintes:
     - Governo dos EUA (CCG)
     - Governo dos EUA (GCC High)
     - China Cloud operado pela 21Vianet
     - Departamento de Defesa dos EUA (DoD)
Aplicações Lógicas Standard Todas as regiões do Logic Apps , exceto as seguintes:
     - Regiões do Azure Government
     - Regiões do Azure China
     - Departamento de Defesa dos EUA (DoD)
Aplicações Power Premium Todas as regiões do Power Apps , exceto as seguintes:
     - Governo dos EUA (CCG)
     - Governo dos EUA (GCC High)
     - China Cloud operado pela 21Vianet
     - Departamento de Defesa dos EUA (DoD)
Automatize o poder Premium Todas as regiões do Power Automatic , exceto as seguintes:
     - Governo dos EUA (CCG)
     - Governo dos EUA (GCC High)
     - China Cloud operado pela 21Vianet
     - Departamento de Defesa dos EUA (DoD)
Contato
Nome Suporte Aquaforest
URL https://www.aquaforest.com/en/aquaforest-flow-doc.asp
Email support@aquaforest.com
Metadados do conector
Editora Aquaforest Limitada
Sítio Web https://www.aquaforest.com/en/aquaforest-connector.asp
Política de privacidade https://www.aquaforest.com/en/privacy policy.pdf
Categorias Conteúdos e Ficheiros; Dados

O conector PDF Aquaforest contém um grupo de ações que executa diferentes operações de PDF, como divisão, extração de texto, extração de código de barras e operações de OCR para Office 365 e Flow.

Pré-requisitos

Primeiro de tudo, você precisa criar uma conta de API PDF Aquaforest. Esta conta é usada para gerenciar ações PDF do Aquaforest e API PDF do Aquaforest. Use seu endereço de e-mail ativo, porque a assinatura será vinculada a esse endereço. Se já tem uma conta, basta iniciar sessão aqui.

Como obter credenciais

  1. Faça login no portal do desenvolvedor, vá para a página Produtos e selecione o produto que deseja assinar.

  2. Clique no botão Subscrever

  3. Clique no botão Confirmar para confirmar o seu pedido de subscrição

  4. Você pode acessar suas chaves de API em sua página de perfil

A criar uma ligação

O conector suporta os seguintes tipos de autenticação:

Predefinição Parâmetros para criar conexão. Todas as regiões Não compartilhável

Padrão

Aplicável: Todas as regiões

Parâmetros para criar conexão.

Esta conexão não é compartilhável. Se o aplicativo avançado for compartilhado com outro usuário, outro usuário será solicitado a criar uma nova conexão explicitamente.

Nome Tipo Description Obrigatório
Chave de API securestring A chave de API para esta api Verdade

Limites de Limitação

Name Chamadas Período de Renovação
Chamadas de API por conexão 100 60 segundos

Ações

Dividir PDF por correspondência de texto

Divide arquivos PDF com base em correspondências de texto definidas pelo usuário. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter documentação. Além disso, a Aquaforest Zonal Extraction Tool está disponível em [https://www.aquaforest.com/en/zone/get-pdf-zone.html].

Dividir PDF por código de barras

Divide arquivos PDF com base em correspondências de código de barras definidas pelo usuário. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter documentação. Além disso, a Aquaforest Zonal Extraction Tool está disponível em [https://www.aquaforest.com/en/zone/get-pdf-zone.html].

Dividir PDF por página

Divide arquivos PDF com base em opções de divisão definidas pelo usuário. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter documentação.

Extrair páginas PDF por código de barras

Extraia arquivos PDF com base em correspondências de código de barras definidas pelo usuário. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter mais informações.

Extrair páginas PDF por texto

Extraia arquivos PDF com base em correspondências de texto definidas pelo usuário. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter mais informações.

Obter dados de PDF

Esta ação extrairá dados importantes de arquivos PDF na forma de pares Chave/Valor.

Obter propriedades de PDF

Obtém as informações sobre um arquivo PDF

Obter texto a partir de PDF

Obter texto de arquivos PDF com base no local do texto e expressões regulares. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter mais informações.

Obter valor do código de barras

Obtenha o código de barras do PDF. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter mais informações.

OCR PDF ou imagens

Gere PDF pesquisável a partir de um PDF de imagem ou imagens digitalizadas. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter mais informações.

Dividir PDF por correspondência de texto

Divide arquivos PDF com base em correspondências de texto definidas pelo usuário. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter documentação. Além disso, a Aquaforest Zonal Extraction Tool está disponível em [https://www.aquaforest.com/en/zone/get-pdf-zone.html].

Parâmetros

Name Chave Necessário Tipo Description
Conteúdo do Ficheiro
fileContent True byte

O conteúdo do ficheiro de origem

Modelo de nome de arquivo
fileNameTemplate True string

Modelo para o arquivo de saída se as correspondências de texto forem encontradas

Páginas sem correspondência
noMatch string

Dependendo da opção de divisão escolhida acima, algumas páginas não terão nenhum valor de texto extraído. Escolha o que fazer nestas páginas.

Sem modelo de arquivo
noTextFileName True string

Modelo para o arquivo de saída se nenhuma correspondência de texto for encontrada

Nome do arquivo
sourceFileName True string

O nome do arquivo de origem

Opções de arquivo de saída
splitOption string

Escolha o local da página com o código de barras nos arquivos de saída da operação de divisão.

Valor
expression array of string

Forneça um ou mais valores aqui para serem usados com a propriedade acima, retornaremos o primeiro valor de texto que corresponde à regra mencionada acima.

Localização
location True string

Área da página - use a ferramenta Zonal para obter coordenadas: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Selecionar
position string

Use isso para refinar o texto que você extrai mais, selecione uma opção que corresponda às suas necessidades

Padrão
regex string

Se uma expressão regular for fornecida aqui, faremos a correspondência entre qualquer texto extraído e retornaremos a correspondência.

Devoluções

Dividir PDF por código de barras

Divide arquivos PDF com base em correspondências de código de barras definidas pelo usuário. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter documentação. Além disso, a Aquaforest Zonal Extraction Tool está disponível em [https://www.aquaforest.com/en/zone/get-pdf-zone.html].

Parâmetros

Name Chave Necessário Tipo Description
Conteúdo do Ficheiro
fileContent True byte

O conteúdo do ficheiro de origem

Modelo de nome de arquivo
fileNameTemplate True string

Modelo para o arquivo de saída se o código de barras for encontrado

Páginas sem correspondência
noMatch string

Dependendo da opção de divisão escolhida acima, algumas páginas não terão valor de código de barras. Escolha o que fazer nestas páginas.

Nenhum modelo de correspondência de código de barras
noTextFileName True string

Modelo para o arquivo de saída se nenhum código de barras for encontrado

Nome do arquivo
sourceFileName True string

O nome do arquivo de origem

Opções de arquivo de saída
splitOption string

Use isso para refinar o texto que você extrai mais, selecione uma opção que corresponda às suas necessidades

Tipo
barcodeFormats array of string

Especifique os tipos de código de barras que deseja identificar

Localização
location True string

Área da página - use a ferramenta Zonal para obter coordenadas: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Padrão
regex string

Se uma expressão regular for fornecida aqui, faremos a correspondência com qualquer código de barras extraído e retornaremos a correspondência.

Devoluções

Dividir PDF por página

Divide arquivos PDF com base em opções de divisão definidas pelo usuário. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter documentação.

Parâmetros

Name Chave Necessário Tipo Description
Conteúdo do Ficheiro
fileContent True byte

O conteúdo do arquivo de origem.

Nome do arquivo de saída
fileNameTemplate True string

Modelo de arquivo de destino que pode incluir %UNIQUEn (número exclusivo a partir de 1, zero acolchoado a n dígitos) e %FILENAME (nome de arquivo original sem a extensão).

Nome do arquivo
sourceFileName True string

O nome do arquivo de origem.

Tipo de divisão
splitOption True string

Escolha a operação de divisão a ser usada para cada arquivo.

Intervalo de páginas
pageRange string

Conjunto de intervalos de páginas separados por vírgulas que define quais páginas do original devem ser extraídas.

Repita cada
repeatEvery integer

Aplique o intervalo de páginas a cada conjunto de páginas de Intervalos de Páginas dentro do documento. Por exemplo, se 2-4 for especificado para intervalos de páginas e 4 for especificado como o intervalo de repetição, o intervalo será reaplicado a cada 4 páginas.

Manter marcadores
retainBookmarks boolean

Os arquivos gerados incluirão marcadores do arquivo original.

Reter metadados
retainMetadata boolean

Os arquivos gerados incluirão metadados (como Autor e Título) do arquivo original.

Devoluções

Extrair páginas PDF por código de barras

Extraia arquivos PDF com base em correspondências de código de barras definidas pelo usuário. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter mais informações.

Parâmetros

Name Chave Necessário Tipo Description
Conteúdo do Ficheiro
fileContent True byte

O conteúdo do ficheiro de origem

Modelo de nome de arquivo
fileNameTemplate True string

Modelo para o arquivo de saída se o código de barras for encontrado

Sem modelo de arquivo
noTextFileName True string

Modelo para o arquivo de saída se nenhum código de barras for encontrado

Nome do arquivo
sourceFileName True string

O nome do arquivo de origem

Tipo
barcodeFormats array of string

Especifique os tipos de código de barras que deseja identificar

Localização
location True string

Área da página - use a ferramenta Zonal para obter coordenadas: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Padrão
regex string

Se uma expressão regular for fornecida aqui, faremos a correspondência com qualquer código de barras extraído e retornaremos a correspondência.

Devoluções

Extrair páginas PDF por texto

Extraia arquivos PDF com base em correspondências de texto definidas pelo usuário. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter mais informações.

Parâmetros

Name Chave Necessário Tipo Description
Conteúdo do Ficheiro
fileContent True byte

O conteúdo do ficheiro de origem

Modelo de nome de arquivo
fileNameTemplate True string

Modelo para o arquivo de saída se as correspondências de texto forem encontradas

Sem modelo de arquivo
noTextFileName True string

Modelo para o arquivo de saída se nenhuma correspondência de texto for encontrada

Nome do arquivo
sourceFileName True string

O nome do arquivo de origem

Valor
expression array of string

Forneça um ou mais valores aqui para serem usados com a propriedade acima, retornaremos o primeiro valor de texto que corresponde à regra mencionada acima.

Localização
location True string

Área da página - use a ferramenta Zonal para obter coordenadas: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Selecionar
position string

Use isso para refinar o texto que você extrai mais, selecione uma opção que corresponda às suas necessidades

Padrão
regex string

Se uma expressão regular for fornecida aqui, faremos a correspondência entre qualquer texto extraído e retornaremos a correspondência.

Devoluções

Obter dados de PDF

Esta ação extrairá dados importantes de arquivos PDF na forma de pares Chave/Valor.

Parâmetros

Name Chave Necessário Tipo Description
Nome
settingName True string

Digite o nome da configuração aqui

Valor
settingValue True string

Insira o valor da configuração aqui.

Pontuação de Confiança
confidenceScore number

Defina uma pontuação de confiança mais alta para filtrar valores com menor confiança. Você pode definir qualquer valor entre 0 e 1. Recomendamos começar a partir de 0,5

Conversão de data
dateAsISO string

Selecione qual formato retornar o valor de data como

Chaves esperadas
expectedKeys string

Forneça um nome de chave por linha para disponibilizar valores para ações posteriores sem analisar JSON.

Conteúdo do Ficheiro
fileContent True byte

O conteúdo do ficheiro de origem

Limite de páginas
pageLimit integer

Número máximo de páginas a processar

Intervalo de páginas
pageRange string

Uma representação de cadeia de caracteres dos números de página que você deseja processar. Por exemplo, 1,3-4

Símbolo de moeda de tira
stripCurrencySymbol boolean

Defina isso como true se quiser que os símbolos e cadeias de caracteres sejam removidos antes de retornarmos valores de moeda

Sinónimo de correspondência
synonym boolean

Defina isso como true se quiser que devolvamos todas as chaves que são sinônimos da chave esperada.

Dicionário de Sinónimos
synonymDictionary string

Você pode fornecer uma matriz JSON de objetos "entry", onde cada objeto contém uma lista de sinônimos em uma matriz. Por exemplo, se pretender que "N.º da fatura" e "Número da fatura" (sem distinção entre maiúsculas e minúsculas) sejam interpretados como a mesma chave, utilize o seguinte JSON: [{'entry': [ 'Invoice No', 'invoice number' ]}]

Símbolos de corte
trimSymbols boolean

Defina isso como true se quiser que removamos todos os símbolos à esquerda e à direita das chaves encontradas antes de combiná-los com uma chave esperada.

Devoluções

As saídas desta operação são dinâmicas.

Obter propriedades de PDF

Obtém as informações sobre um arquivo PDF

Parâmetros

Name Chave Necessário Tipo Description
Conteúdo do Ficheiro
fileContent True byte

O conteúdo do ficheiro de origem

Limite de páginas
pageLimit integer

Número máximo de páginas a serem processadas, isso é usado apenas para verificar se as páginas contêm texto oculto ou para verificar se o PDF é pesquisável

Devoluções

Obter texto a partir de PDF

Obter texto de arquivos PDF com base no local do texto e expressões regulares. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter mais informações.

Parâmetros

Name Chave Necessário Tipo Description
Conteúdo do Ficheiro
fileContent True byte

O conteúdo do ficheiro de origem

Nenhum modelo de correspondência de texto
noTextTemplate True string

Modelo para o texto a ser retornado se uma correspondência não for encontrada

Separador de página
pageSeparator string

Forneça um separador de página para que você possa saber onde estão as quebras de página.

Páginas
pagerange string

Forneça um intervalo de páginas do qual você deseja extrair texto, que pode ser um único número de página (1), vários números de página separados por vírgulas (1,2,3), um intervalo de páginas (1-4) ou uma mistura de todos (1,2,4-7).

Nome do arquivo
sourceFileName True string

O nome do arquivo de origem

Modelo de resultado de texto
textResultTemplate True string

Modelo para o texto a ser retornado se uma correspondência for encontrada

Valor
expression array of string

Forneça um ou mais valores aqui para serem usados com a propriedade acima, retornaremos o primeiro valor de texto que corresponde à regra mencionada acima.

Localização
location True string

Área da página - use a ferramenta Zonal para obter coordenadas: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Página (preterida)
pagenumber integer

Esta propriedade foi preterida, aconselhamos que você use a propriedade Pages. A propriedade Pages aplica-se a todas as zonas e permite-lhe selecionar as páginas que pretende processar.

Selecionar
position string

Use isso para refinar o texto que você extrai mais, selecione uma opção que corresponda às suas necessidades

Padrão
regex string

Se uma expressão regular for fornecida aqui, faremos a correspondência entre qualquer texto extraído e retornaremos a correspondência.

Devoluções

Obter valor do código de barras

Obtenha o código de barras do PDF. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter mais informações.

Parâmetros

Name Chave Necessário Tipo Description
Modelo de resultado de código de barras
barcodeResultTemplate True string

Modelo para o resultado do texto de saída se um código de barras for encontrado

Conteúdo do Ficheiro
fileContent True byte

O conteúdo do ficheiro de origem

Sem modelo de código de barras
noBarcodeTemplate True string

Modelo para o resultado do texto de saída se nenhum código de barras for encontrado

Separador de página
pageSeparator string

Forneça um separador de página para que você possa saber onde estão as quebras de página.

Páginas
pagerange string

Forneça um intervalo de páginas do qual você deseja extrair texto, que pode ser um único número de página (1), vários números de página separados por vírgulas (1,2,3), um intervalo de páginas (1-4) ou uma mistura de todos (1,2,4-7).

Nome do arquivo
sourceFileName True string

O nome do arquivo de origem

Tipo
barcodeFormats array of string

Especifique os tipos de código de barras que deseja identificar

Localização
location True string

Área da página - use a ferramenta Zonal para obter coordenadas: [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Página (preterida)
pagenumber integer

Esta propriedade foi preterida, aconselhamos que você use a propriedade Pages. A propriedade Pages aplica-se a todas as zonas e permite-lhe selecionar as páginas que pretende processar.

Padrão
regex string

Se uma expressão regular for fornecida aqui, faremos a correspondência entre qualquer texto extraído e retornaremos a correspondência.

Devoluções

OCR PDF ou imagens

Gere PDF pesquisável a partir de um PDF de imagem ou imagens digitalizadas. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter mais informações.

Parâmetros

Name Chave Necessário Tipo Description
AquaforestImageTimeout
aquaforestImageTimeout integer

Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade.

Author
author string

Defina um Autor personalizado nas propriedades do documento PDF de saída.

Rotação automática
autorotate boolean

Gire automaticamente a imagem – isso garantirá que todo o texto seja orientado normalmente

Binarize
binarize integer

Em geral, este valor só deve ser utilizado sob orientação do suporte técnico. Ele pode controlar a maneira como as imagens coloridas são processadas e forçar a binarização com um limite específico. Foi demonstrado que um valor de 200 geralmente dá bons resultados nos testes, mas isso deve ser confirmado com documentos "típicos" do cliente. Ao definir isso como -1 um método alternativo é usado que tentará separar o texto de quaisquer imagens ou cores de fundo. Isso pode dar melhores resultados de OCR para certos documentos, como páginas de jornais e revistas.

Limite de pixel preto
blackPixelLimit float

Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade.

Limite de página em branco
blankPageThreshold integer

Use isso para definir o número mínimo de "On Pixels" que devem estar presentes na imagem para que uma página não seja considerada em branco. Um valor de -1 desativará a deteção de página em branco.

Tamanho da caixa
boxSize integer

Esta opção é ideal para formulários em que, por vezes, as caixas em torno do texto podem fazer com que uma área seja identificada como gráficos. Esta opção remove caixas da cópia temporária da imagem usada pelo mecanismo OCR. Não remove caixas da imagem final. Tecnicamente, esta opção remove elementos conectados com uma área mínima (em pixels e definida por esta propriedade). Atualmente, esta opção só é aplicada para imagens bitonais.

ConvertToTiff
convertToTiff boolean

Cada página do documento PDF é rasterizada para uma imagem TIFF.

CreateProcess
createProcess boolean

Defina isso como true se quiser iniciar o processo por meio do pinvoke.

Data de criação
creationDate string

Defina uma data de criação personalizada nas propriedades do documento PDF de saída. A cadeia de caracteres de data deve estar no formato 'aaaa-MM-dd HH:mm:ss'.

Deskew
deskew boolean

Deskew (endireitar) a imagem.

Despeckle
despeckle integer

Isso remove todos os elementos desconectados dentro da imagem que têm altura ou largura em pixels menor do que a figura especificada. O valor máximo é 9 e o valor padrão é 0.

DictionaryLookup
dictionaryLookup integer

Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade.

Matriz de pontos
dotmatrix boolean

Defina isso como true para melhorar o reconhecimento de fontes matriciais. O valor predefinido é falso. Se definido como true para fontes que não sejam matriciais, o reconhecimento pode ser ruim.

Ativar saída de depuração
enableDebugOutput boolean

Habilita a saída de depuração.

Comprimir PDF (MRC)
enableMrc boolean

Isso permite a compactação raster mista, que pode reduzir drasticamente o tamanho de saída de PDFs que incluem digitalizações coloridas. Observe que essa opção só é adequada quando a fonte não é um PDF ou usa ConvertToTiff.

Saída PDF/A
enablePDFAOutput boolean

Se deve ou não sair como PDF/A.

Modo de erro
errorMode integer

Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade.

Conteúdo do ficheiro de origem
fileContent True byte

Conteúdo do ficheiro para OCR

Nome do arquivo de origem com extensão
fileNameWithExtension True string

O nome do ficheiro de origem com extensão ou apenas a extensão (com um ponto inicial '.')

Deteção de flip
flipDetect integer

Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade.

Qualidade em tons de cinza
grayscaleQuality integer

Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade.

Heurística
heuristics integer

Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade.

Jbig2EncFlags
jbig2EncFlags string

Estes são os sinalizadores que serão passados para o aplicativo usado para gerar versões JBIG2 de imagens usadas na geração de PDF (supondo que essa compactação esteja habilitada). Regra geral, esta opção só deve ser utilizada sob orientação do suporte técnico.

Linguagem
language enum

Selecionar uma das opções abaixo define o idioma a ser usado para o processamento de OCR. O idioma padrão é o inglês.

LibTiffSavePageAsBmp
libTiffSavePageAsBmp boolean

Às vezes, se houver uma imagem que é 1bpp e tem compressão LZW, o pré-processamento pode fazer com que a cor da imagem seja invertida (preto para branco e branco para preto). Defina isso como verdadeiro para evitar isso.

Máximo deskew
maxDeskew float

Ângulo máximo pelo qual uma página será costurada. Regra geral, esta opção só deve ser utilizada sob orientação do apoio técnico (support@aquaforest.com).

Confiança mínima no deskew
minDeskewConfidence float

Regra geral, esta opção só deve ser utilizada sob orientação do apoio técnico (support@aquaforest.com).

Data de Modificação
modifiedDate string

Defina uma data de modificação personalizada nas propriedades do documento PDF de saída. A cadeia de caracteres de data deve estar no formato 'aaaa-MM-dd HH:mm:ss'.

Morfo
morph string

Opções morfológicas que serão aplicadas à imagem binarizada antes do OCR. Se definido como vazio, nenhum será aplicado. As opções comuns incluem as listadas abaixo, mas para mais opções, entre em contato com support@aquaforest.com.

MrcBackgroundFactor
mrcBackgroundFactor integer

Tamanho da amostragem para a parte de fundo da imagem. Quanto maior o número, maior o tamanho dos blocos de imagem usados para a média, o que resultará em uma redução no tamanho, mas também na qualidade. O valor padrão é 3

MrcForegroundFactor
mrcForegroundFactor integer

Tamanho de amostragem para a parte de primeiro plano da imagem. Quanto maior o número, maior o tamanho dos blocos de imagem usados para a média, o que resultará em uma redução no tamanho, mas também na qualidade. O valor padrão é 3

MrcQuality
mrcQuality integer

Configuração de qualidade JPEG (valor percentual 1 - 100) para uso ao salvar imagens de fundo e de primeiro plano. O valor padrão é 75

MrcTimeout
mrcTimeout integer

Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade.

NoPictures
noPictures boolean

Por padrão, se uma área do documento for identificada como uma área gráfica, nenhum processamento OCR será executado nessa área. No entanto, alguns documentos podem incluir áreas ou caixas identificadas como áreas "gráficas" ou "ilustradas", mas que, na realidade, contêm texto útil. Definir NoPictures como True fará com que ele ignore áreas identificadas como imagens, enquanto defini-lo como False forçará o OCR de áreas identificadas como imagens.

OcrProcessSetupTimeout
ocrProcessSetupTimeout integer

Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade.

OcrTimeout
ocrTimeout integer

Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade.

Palavra-passe
password string

A senha para abrir o arquivo PDF de origem

PdfToImageBpp
pdfToImageBpp enum

Os bits por pixel a serem usados para a página PDF rasterizada ao usar o mecanismo 1. Isso só se aplica a documentos que são processados usando ConvertToTiff. O valor padrão para essa propriedade é retirado da página PDF.

PdfToImageCompression
pdfToImageCompression enum

A compressão para definir as imagens extraídas ou rasterizadas de cada página do arquivo PDF de origem. Essas imagens são então OCRed para criar o PDF pesquisável. O valor padrão para essa propriedade é retirado de cada página no arquivo PDF de origem.

PdfToImageDpi
pdfToImageDpi enum

O DPI para definir as imagens rasterizadas de cada página do arquivo PDF de origem. Essas imagens são então OCRed para criar o PDF pesquisável. O valor padrão para essa propriedade é retirado de cada página no arquivo PDF de origem.

PdfToImageForceVectorCheck
pdfToImageForceVectorCheck boolean

Essa configuração é útil ao lidar com documentos que contêm objetos vetoriais (por exemplo, desenhos CAD). Por padrão, as páginas que contêm apenas objetos vetoriais são rasterizadas. As páginas que não têm imagens, mas contêm objetos vetoriais, bem como texto eletrônico, são ignoradas da rasterização. No entanto, às vezes pode haver uma página que contém objetos vetoriais (desenhos CAD), mas seu título pode estar em texto eletrônico. Para forçar a rasterização de páginas como estas, defina essa propriedade como true.

PdfToImageIncludeText
pdfToImageIncludeText boolean

Quando definido como Falso isso impedirá que a conversão de texto real (ou seja, gerado eletronicamente em oposição ao texto que faz parte de uma imagem digitalizada) seja renderizada nas imagens de página extraídas do PDF. Isso ocorre porque o texto já é pesquisável e, portanto, geralmente não requer OCR. O valor pode ser definido como True, no entanto, se o OCR for necessário neste texto real.

PdfToImageMaxRes
pdfToImageMaxRes integer

A resolução máxima das imagens rasterizadas. Se a resolução recuperada da página PDF for maior que esse valor, ela será definida como esse valor. O valor padrão para essa propriedade é 600.

PdfToImageMinRes
pdfToImageMinRes integer

A resolução mínima das imagens rasterizadas. Se a resolução recuperada da página PDF for inferior a este valor, será definida para este valor. O valor padrão para essa propriedade é 200.

Versão PDF/A
pdfaVersion enum

A versão PDF/A.

PipeClientConnectionTimeout
pipeClientConnectionTimeout integer

Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade.

RemoveBlankPage
removeBlankPage boolean

Remova páginas em branco quando BlankPageThreshold for maior que -1 e ConvertToTiff for true.

RemoveLines
removeLines boolean

Remover linhas de imagens fpr melhor reconhecimento.

RestartEngineEvery
restartEngineEvery integer

Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade.

Manter marcadores
retainBookmarks boolean

Retém todos os marcadores do arquivo de origem na saída ao usar ConvertToTiff.

Manter a data de criação
retainCreationDate boolean

Retém a data de criação do arquivo de origem nas propriedades do documento PDF de saída.

Reter metadados
retainMetadata boolean

Retém todos os metadados do arquivo de origem na saída ao usar ConvertToTiff.

Manter a data de modificação
retainModifiedDate boolean

Retém a data de modificação do arquivo de origem nas propriedades do documento PDF de saída.

Manter as preferências do espectador
retainViewerPreferences boolean

Retém todas as preferências do visualizador de PDF, modo de página e layout de página do arquivo de origem na saída ao usar o ConvertToTiff.

SalvarPredespeckle
savePredespeckle boolean

Isso usará a imagem original (ou seja, antes de aplicar o pré-processamento) no PDF de saída.

Tables
tables boolean

Esta opção, quando definida como true, tenta OCR dentro das células da tabela.

TextLayerFilterHeight
textLayerFilterHeight integer

Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade.

TextLayerFilterHeightInverted
textLayerFilterHeightInverted integer

Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade.

TextLayerFilterPercentage
textLayerFilterPercentage float

Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade.

TextLayerFilterPercentageInverted
textLayerFilterPercentageInverted float

Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade.

TextLayerFilterRatio
textLayerFilterRatio float

Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade.

TextLayerFilterRatioInverted
textLayerFilterRatioInverted float

Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade.

TextLayerFilterWidth
textLayerFilterWidth integer

Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade.

TextLayerFilterWidthInverted
textLayerFilterWidthInverted integer

Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade.

TextLayerMaxBoxes
textLayerMaxBoxes integer

Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade.

Modo de arrumação
tidyUpMode integer

Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade.

Validar PDF/A
validatePDFA boolean

Validar ou não o documento PDF/A após a conversão

Limite de correspondência de palavras
wordMatchThreshold float

Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade.

Devoluções

Dados de resposta para operação de OCR

Definições

ApiExtractPost200ApplicationJsonResponse

Name Caminho Tipo Description
Erro
ErrorMessage string

Se o valor de Is Successful for false, retornaremos uma mensagem de erro

É bem sucedido
IsSuccessful boolean

Isso retornará true se pelo menos uma página foi extraída

Informações sobre a licença
LicenceInfo string

Informações sobre sua chave de assinatura da API

Extrair arquivos de saída
SplittedFile array of object

Matriz de arquivos extraídos

(Conteúdo do arquivo)
SplittedFile.SplitFileContent byte

Uma cadeia de caracteres base 64 que representa o Conteúdo do Arquivo

(Nome do arquivo)
SplittedFile.SplitFileName string

Uma cadeia de caracteres que contém o Nome do Arquivo gerado

(Número da página)
SplittedFile.pageNumber string

O intervalo de páginas que contém o número de página onde ocorreu a extração

ApiGetTextValueJsonResponse

Name Caminho Tipo Description
Mensagem de erro
ErrorMessage string

Se o valor de Is Successful for false, retornaremos uma mensagem de erro

É bem sucedido
IsSuccessful boolean

Se o texto foi correspondido com êxito

Informações sobre a licença
LicenceInfo string

Informações sobre sua chave de assinatura da API

Resultado do texto
TextResult string

Uma cadeia de caracteres gerada a partir da aplicação do texto extraído ao Modelo de Resultado de Texto fornecido. Observe que, se a contagem de páginas for maior que uma, todas as páginas serão concatenadas usando o Separador de Página.

Results
TextResults array of object

Uma matriz que contém uma lista de páginas e os valores de texto extraídos

(Número da página)
TextResults.pageNumber string

A página onde o texto foi encontrado

(Texto da página)
TextResults.valueExtracted string

Uma cadeia de caracteres gerada a partir da aplicação do texto extraído ao Modelo de Resultado de Texto fornecido.

(Valores de zona)
TextResults.zoneValues array of string

Uma matriz que contém o texto extraído de cada zona.

ApiRenameByBarcodePost200ApplicationJsonResponse

Name Caminho Tipo Description
Código de barras
BarcodeResult string

Uma cadeia de caracteres gerada a partir da aplicação do texto extraído ao Modelo de Resultado de código de barras fornecido. Observe que, se a contagem de páginas for maior que uma, todas as páginas serão concatenadas usando o Separador de Página.

Results
BarcodeResults array of object

Uma matriz contendo uma lista de páginas e os valores de código de barras extraídos

(Número da página)
BarcodeResults.pageNumber string

A página onde o código de barras foi encontrado

(Código de barras da página)
BarcodeResults.valueExtracted string

Uma cadeia de caracteres gerada a partir da aplicação do valor de código de barras extraído ao Modelo de Resultado de código de barras fornecido.

(Valores de zona)
BarcodeResults.zoneValues array of string

Uma matriz contendo o código de barras extraído de cada zona.

Mensagem de erro
ErrorMessage string

Se o valor de Is Successful for false, retornaremos uma mensagem de erro

É bem sucedido
IsSuccessful boolean

Se um código de barras foi detetado

Informações sobre a licença
LicenceInfo string

Informações sobre sua chave de assinatura da API

ApiSplitPost200ApplicationJsonResponse

Name Caminho Tipo Description
Mensagem de erro
ErrorMessage string

Se o valor de Is Successful for false, retornaremos uma mensagem de erro

É bem sucedido
IsSuccessful boolean

Isso retornará true se pelo menos uma página dividida tiver sido correspondida.

Informações sobre a licença
LicenceInfo string

Informações sobre sua chave de assinatura da API

Dividir arquivos de saída
SplittedFile array of object

Matriz contendo cada um dos arquivos divididos juntamente com detalhes como o nome do arquivo gerado e o número da página.

(Conteúdo do arquivo)
SplittedFile.SplitFileContent byte

Uma cadeia de caracteres base 64 que representa o Conteúdo do Arquivo

(Nome do arquivo)
SplittedFile.SplitFileName string

Uma cadeia de caracteres que contém o Nome do Arquivo gerado

(Intervalo de páginas)
SplittedFile.pageNumber string

O intervalo de páginas que contém os números de página da operação de divisão

GetPDFInfoResponse

Name Caminho Tipo Description
Permitir montagem
AllowAssembly boolean

Permitir rotação, inserção ou eliminação de páginas.

Permitir impressão degradada
AllowDegradedPrinting boolean

Permita uma impressão de baixa qualidade.

Permitir conteúdo de extração
AllowExtractContents boolean

Permite a extração de texto e gráficos.

Permitir extração para acessibilidade
AllowExtractForAccessibility boolean

Permitir a extração de texto e gráficos em apoio à acessibilidade.

Permitir preenchimento de formulário
AllowFillInForm boolean

Permitir o preenchimento de campos de formulário.

Permitir modificar anotações
AllowModifyAnnotations boolean

Permitir a modificação de anotações.

Permitir modificar conteúdo
AllowModifyContents boolean

Permitir a modificação de conteúdos.

Permitir impressão
AllowPrinting boolean

Permite uma impressão de alta qualidade.

Author
Author string

Quem criou o documento.

Data de criação
CreationDate string

Esta é a data e hora em que o PDF foi criado.

Criador
Creator string

O aplicativo ou biblioteca de origem.

Mensagem de erro
ErrorMessage string

Se o valor de Is Successful for false, retornaremos uma mensagem de erro

Tamanho do arquivo (bytes)
FileSize number

O tamanho do arquivo em bytes

Tem texto oculto
HasHiddenText boolean

Isso retornará true se o arquivo PDF tiver uma camada OCR.

É criptografado
IsEncrypted boolean

Isso retornará true se este documento estiver criptografado ou não.

É pesquisável
IsSearchable boolean

Isso retornará true se o arquivo PDF for pesquisável.

É bem sucedido
IsSuccessful boolean

Retorna true se a ação foi bem-sucedida.

Palavras-chave
Keywords string

As palavras-chave podem ser separadas por vírgula.

Informações sobre a licença
LicenceInfo string

Json resumo da sua quota de subscrição.

Data de Modificação
ModifiedDate string

Esta propriedade representa a data e a hora em que o PDF foi modificado pela última vez

Número de páginas
NumberofPages integer

O número de páginas no arquivo PDF.

Versão PDF
PDFversion number

A versão da especificação PDF contra a qual o documento foi construído.

Producer
Producer string

O produto que criou o PDF. Nos primórdios do PDF, as pessoas usavam um aplicativo Creator como o Microsoft Word para escrever um documento, imprimi-lo em um arquivo PostScript e, em seguida, o produtor seria o Acrobat Distiller, o aplicativo que convertia o arquivo PostScript em PDF. Hoje em dia Criador e Produtor são muitas vezes o mesmo ou um campo é deixado em branco.

Assunto
Subject string

Do que trata o documento?

Title
Title string

O título do documento.

Preso
Trapped string

Esta propriedade é um valor booleano que indica se o documento foi intercetado. Trapping é um processo de pré-impressão que introduz áreas de cor em separações de cores, a fim de obscurecer possíveis erros de registro.

Metadados XMP
XmpMetadata string

A Extensible Metadata Platform (XMP) é um padrão ISO, originalmente criado pela Adobe Systems Inc., para a criação, processamento e intercâmbio de metadados padronizados e personalizados para documentos digitais e conjuntos de dados.

ocr_response

Dados de resposta para operação de OCR

Name Caminho Tipo Description
Mensagem de erro
ErrorMessage string

Se o valor de Is Successful for false, retornaremos uma mensagem de erro

É bem sucedido
IsSuccessful boolean

Retorna true se o OCR foi bem-sucedido.

Informações sobre a licença
LicenceInfo string

Informações sobre sua chave de assinatura da API

Conteúdo do arquivo de log
LogFileContent byte

O conteúdo do log da operação

Conteúdo do arquivo processado
OutputFileContent byte

Arquivo gerado pelo conversor de PDF Aquaforest.