Aquafloresta PDF
O conector PDF Aquaforest contém um grupo de ações que executa diferentes operações de PDF, como divisão, extração de texto, extração de código de barras e operações OCR para Office 365 e Power Automate.
Este conector está disponível nos seguintes produtos e regiões:
| Serviço | Class | Regiões |
|---|---|---|
| Estúdio Copiloto | Premium | Todas as regiões do Power Automatic , exceto as seguintes: - Governo dos EUA (CCG) - Governo dos EUA (GCC High) - China Cloud operado pela 21Vianet - Departamento de Defesa dos EUA (DoD) |
| Aplicações Lógicas | Standard | Todas as regiões do Logic Apps , exceto as seguintes: - Regiões do Azure Government - Regiões do Azure China - Departamento de Defesa dos EUA (DoD) |
| Aplicações Power | Premium | Todas as regiões do Power Apps , exceto as seguintes: - Governo dos EUA (CCG) - Governo dos EUA (GCC High) - China Cloud operado pela 21Vianet - Departamento de Defesa dos EUA (DoD) |
| Automatize o poder | Premium | Todas as regiões do Power Automatic , exceto as seguintes: - Governo dos EUA (CCG) - Governo dos EUA (GCC High) - China Cloud operado pela 21Vianet - Departamento de Defesa dos EUA (DoD) |
| Contato | |
|---|---|
| Nome | Suporte Aquaforest |
| URL | https://www.aquaforest.com/en/aquaforest-flow-doc.asp |
| support@aquaforest.com |
| Metadados do conector | |
|---|---|
| Editora | Aquaforest Limitada |
| Sítio Web | https://www.aquaforest.com/en/aquaforest-connector.asp |
| Política de privacidade | https://www.aquaforest.com/en/privacy policy.pdf |
| Categorias | Conteúdos e Ficheiros; Dados |
O conector PDF Aquaforest contém um grupo de ações que executa diferentes operações de PDF, como divisão, extração de texto, extração de código de barras e operações de OCR para Office 365 e Flow.
Pré-requisitos
Primeiro de tudo, você precisa criar uma conta de API PDF Aquaforest. Esta conta é usada para gerenciar ações PDF do Aquaforest e API PDF do Aquaforest. Use seu endereço de e-mail ativo, porque a assinatura será vinculada a esse endereço. Se já tem uma conta, basta iniciar sessão aqui.
Como obter credenciais
Faça login no portal do desenvolvedor, vá para a página Produtos e selecione o produto que deseja assinar.

Clique no botão Subscrever

Clique no botão Confirmar para confirmar o seu pedido de subscrição

Você pode acessar suas chaves de API em sua página de perfil

A criar uma ligação
O conector suporta os seguintes tipos de autenticação:
| Predefinição | Parâmetros para criar conexão. | Todas as regiões | Não compartilhável |
Padrão
Aplicável: Todas as regiões
Parâmetros para criar conexão.
Esta conexão não é compartilhável. Se o aplicativo avançado for compartilhado com outro usuário, outro usuário será solicitado a criar uma nova conexão explicitamente.
| Nome | Tipo | Description | Obrigatório |
|---|---|---|---|
| Chave de API | securestring | A chave de API para esta api | Verdade |
Limites de Limitação
| Name | Chamadas | Período de Renovação |
|---|---|---|
| Chamadas de API por conexão | 100 | 60 segundos |
Ações
| Dividir PDF por correspondência de texto |
Divide arquivos PDF com base em correspondências de texto definidas pelo usuário. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter documentação. Além disso, a Aquaforest Zonal Extraction Tool está disponível em [https://www.aquaforest.com/en/zone/get-pdf-zone.html]. |
| Dividir PDF por código de barras |
Divide arquivos PDF com base em correspondências de código de barras definidas pelo usuário. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter documentação. Além disso, a Aquaforest Zonal Extraction Tool está disponível em [https://www.aquaforest.com/en/zone/get-pdf-zone.html]. |
| Dividir PDF por página |
Divide arquivos PDF com base em opções de divisão definidas pelo usuário. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter documentação. |
| Extrair páginas PDF por código de barras |
Extraia arquivos PDF com base em correspondências de código de barras definidas pelo usuário. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter mais informações. |
| Extrair páginas PDF por texto |
Extraia arquivos PDF com base em correspondências de texto definidas pelo usuário. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter mais informações. |
| Obter dados de PDF |
Esta ação extrairá dados importantes de arquivos PDF na forma de pares Chave/Valor. |
| Obter propriedades de PDF |
Obtém as informações sobre um arquivo PDF |
| Obter texto a partir de PDF |
Obter texto de arquivos PDF com base no local do texto e expressões regulares. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter mais informações. |
| Obter valor do código de barras |
Obtenha o código de barras do PDF. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter mais informações. |
| OCR PDF ou imagens |
Gere PDF pesquisável a partir de um PDF de imagem ou imagens digitalizadas. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter mais informações. |
Dividir PDF por correspondência de texto
Divide arquivos PDF com base em correspondências de texto definidas pelo usuário. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter documentação. Além disso, a Aquaforest Zonal Extraction Tool está disponível em [https://www.aquaforest.com/en/zone/get-pdf-zone.html].
Parâmetros
| Name | Chave | Necessário | Tipo | Description |
|---|---|---|---|---|
|
Conteúdo do Ficheiro
|
fileContent | True | byte |
O conteúdo do ficheiro de origem |
|
Modelo de nome de arquivo
|
fileNameTemplate | True | string |
Modelo para o arquivo de saída se as correspondências de texto forem encontradas |
|
Páginas sem correspondência
|
noMatch | string |
Dependendo da opção de divisão escolhida acima, algumas páginas não terão nenhum valor de texto extraído. Escolha o que fazer nestas páginas. |
|
|
Sem modelo de arquivo
|
noTextFileName | True | string |
Modelo para o arquivo de saída se nenhuma correspondência de texto for encontrada |
|
Nome do arquivo
|
sourceFileName | True | string |
O nome do arquivo de origem |
|
Opções de arquivo de saída
|
splitOption | string |
Escolha o local da página com o código de barras nos arquivos de saída da operação de divisão. |
|
|
Valor
|
expression | array of string |
Forneça um ou mais valores aqui para serem usados com a propriedade acima, retornaremos o primeiro valor de texto que corresponde à regra mencionada acima. |
|
|
Localização
|
location | True | string |
Área da página - use a ferramenta Zonal para obter coordenadas: [https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
Selecionar
|
position | string |
Use isso para refinar o texto que você extrai mais, selecione uma opção que corresponda às suas necessidades |
|
|
Padrão
|
regex | string |
Se uma expressão regular for fornecida aqui, faremos a correspondência entre qualquer texto extraído e retornaremos a correspondência. |
Devoluções
Dividir PDF por código de barras
Divide arquivos PDF com base em correspondências de código de barras definidas pelo usuário. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter documentação. Além disso, a Aquaforest Zonal Extraction Tool está disponível em [https://www.aquaforest.com/en/zone/get-pdf-zone.html].
Parâmetros
| Name | Chave | Necessário | Tipo | Description |
|---|---|---|---|---|
|
Conteúdo do Ficheiro
|
fileContent | True | byte |
O conteúdo do ficheiro de origem |
|
Modelo de nome de arquivo
|
fileNameTemplate | True | string |
Modelo para o arquivo de saída se o código de barras for encontrado |
|
Páginas sem correspondência
|
noMatch | string |
Dependendo da opção de divisão escolhida acima, algumas páginas não terão valor de código de barras. Escolha o que fazer nestas páginas. |
|
|
Nenhum modelo de correspondência de código de barras
|
noTextFileName | True | string |
Modelo para o arquivo de saída se nenhum código de barras for encontrado |
|
Nome do arquivo
|
sourceFileName | True | string |
O nome do arquivo de origem |
|
Opções de arquivo de saída
|
splitOption | string |
Use isso para refinar o texto que você extrai mais, selecione uma opção que corresponda às suas necessidades |
|
|
Tipo
|
barcodeFormats | array of string |
Especifique os tipos de código de barras que deseja identificar |
|
|
Localização
|
location | True | string |
Área da página - use a ferramenta Zonal para obter coordenadas: [https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
Padrão
|
regex | string |
Se uma expressão regular for fornecida aqui, faremos a correspondência com qualquer código de barras extraído e retornaremos a correspondência. |
Devoluções
Dividir PDF por página
Divide arquivos PDF com base em opções de divisão definidas pelo usuário. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter documentação.
Parâmetros
| Name | Chave | Necessário | Tipo | Description |
|---|---|---|---|---|
|
Conteúdo do Ficheiro
|
fileContent | True | byte |
O conteúdo do arquivo de origem. |
|
Nome do arquivo de saída
|
fileNameTemplate | True | string |
Modelo de arquivo de destino que pode incluir %UNIQUEn (número exclusivo a partir de 1, zero acolchoado a n dígitos) e %FILENAME (nome de arquivo original sem a extensão). |
|
Nome do arquivo
|
sourceFileName | True | string |
O nome do arquivo de origem. |
|
Tipo de divisão
|
splitOption | True | string |
Escolha a operação de divisão a ser usada para cada arquivo. |
|
Intervalo de páginas
|
pageRange | string |
Conjunto de intervalos de páginas separados por vírgulas que define quais páginas do original devem ser extraídas. |
|
|
Repita cada
|
repeatEvery | integer |
Aplique o intervalo de páginas a cada conjunto de páginas de Intervalos de Páginas dentro do documento. Por exemplo, se 2-4 for especificado para intervalos de páginas e 4 for especificado como o intervalo de repetição, o intervalo será reaplicado a cada 4 páginas. |
|
|
Manter marcadores
|
retainBookmarks | boolean |
Os arquivos gerados incluirão marcadores do arquivo original. |
|
|
Reter metadados
|
retainMetadata | boolean |
Os arquivos gerados incluirão metadados (como Autor e Título) do arquivo original. |
Devoluções
Extrair páginas PDF por código de barras
Extraia arquivos PDF com base em correspondências de código de barras definidas pelo usuário. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter mais informações.
Parâmetros
| Name | Chave | Necessário | Tipo | Description |
|---|---|---|---|---|
|
Conteúdo do Ficheiro
|
fileContent | True | byte |
O conteúdo do ficheiro de origem |
|
Modelo de nome de arquivo
|
fileNameTemplate | True | string |
Modelo para o arquivo de saída se o código de barras for encontrado |
|
Sem modelo de arquivo
|
noTextFileName | True | string |
Modelo para o arquivo de saída se nenhum código de barras for encontrado |
|
Nome do arquivo
|
sourceFileName | True | string |
O nome do arquivo de origem |
|
Tipo
|
barcodeFormats | array of string |
Especifique os tipos de código de barras que deseja identificar |
|
|
Localização
|
location | True | string |
Área da página - use a ferramenta Zonal para obter coordenadas: [https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
Padrão
|
regex | string |
Se uma expressão regular for fornecida aqui, faremos a correspondência com qualquer código de barras extraído e retornaremos a correspondência. |
Devoluções
Extrair páginas PDF por texto
Extraia arquivos PDF com base em correspondências de texto definidas pelo usuário. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter mais informações.
Parâmetros
| Name | Chave | Necessário | Tipo | Description |
|---|---|---|---|---|
|
Conteúdo do Ficheiro
|
fileContent | True | byte |
O conteúdo do ficheiro de origem |
|
Modelo de nome de arquivo
|
fileNameTemplate | True | string |
Modelo para o arquivo de saída se as correspondências de texto forem encontradas |
|
Sem modelo de arquivo
|
noTextFileName | True | string |
Modelo para o arquivo de saída se nenhuma correspondência de texto for encontrada |
|
Nome do arquivo
|
sourceFileName | True | string |
O nome do arquivo de origem |
|
Valor
|
expression | array of string |
Forneça um ou mais valores aqui para serem usados com a propriedade acima, retornaremos o primeiro valor de texto que corresponde à regra mencionada acima. |
|
|
Localização
|
location | True | string |
Área da página - use a ferramenta Zonal para obter coordenadas: [https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
Selecionar
|
position | string |
Use isso para refinar o texto que você extrai mais, selecione uma opção que corresponda às suas necessidades |
|
|
Padrão
|
regex | string |
Se uma expressão regular for fornecida aqui, faremos a correspondência entre qualquer texto extraído e retornaremos a correspondência. |
Devoluções
Obter dados de PDF
Esta ação extrairá dados importantes de arquivos PDF na forma de pares Chave/Valor.
Parâmetros
| Name | Chave | Necessário | Tipo | Description |
|---|---|---|---|---|
|
Nome
|
settingName | True | string |
Digite o nome da configuração aqui |
|
Valor
|
settingValue | True | string |
Insira o valor da configuração aqui. |
|
Pontuação de Confiança
|
confidenceScore | number |
Defina uma pontuação de confiança mais alta para filtrar valores com menor confiança. Você pode definir qualquer valor entre 0 e 1. Recomendamos começar a partir de 0,5 |
|
|
Conversão de data
|
dateAsISO | string |
Selecione qual formato retornar o valor de data como |
|
|
Chaves esperadas
|
expectedKeys | string |
Forneça um nome de chave por linha para disponibilizar valores para ações posteriores sem analisar JSON. |
|
|
Conteúdo do Ficheiro
|
fileContent | True | byte |
O conteúdo do ficheiro de origem |
|
Limite de páginas
|
pageLimit | integer |
Número máximo de páginas a processar |
|
|
Intervalo de páginas
|
pageRange | string |
Uma representação de cadeia de caracteres dos números de página que você deseja processar. Por exemplo, 1,3-4 |
|
|
Símbolo de moeda de tira
|
stripCurrencySymbol | boolean |
Defina isso como true se quiser que os símbolos e cadeias de caracteres sejam removidos antes de retornarmos valores de moeda |
|
|
Sinónimo de correspondência
|
synonym | boolean |
Defina isso como true se quiser que devolvamos todas as chaves que são sinônimos da chave esperada. |
|
|
Dicionário de Sinónimos
|
synonymDictionary | string |
Você pode fornecer uma matriz JSON de objetos "entry", onde cada objeto contém uma lista de sinônimos em uma matriz. Por exemplo, se pretender que "N.º da fatura" e "Número da fatura" (sem distinção entre maiúsculas e minúsculas) sejam interpretados como a mesma chave, utilize o seguinte JSON: [{'entry': [ 'Invoice No', 'invoice number' ]}] |
|
|
Símbolos de corte
|
trimSymbols | boolean |
Defina isso como true se quiser que removamos todos os símbolos à esquerda e à direita das chaves encontradas antes de combiná-los com uma chave esperada. |
Devoluções
Obter propriedades de PDF
Obtém as informações sobre um arquivo PDF
Parâmetros
| Name | Chave | Necessário | Tipo | Description |
|---|---|---|---|---|
|
Conteúdo do Ficheiro
|
fileContent | True | byte |
O conteúdo do ficheiro de origem |
|
Limite de páginas
|
pageLimit | integer |
Número máximo de páginas a serem processadas, isso é usado apenas para verificar se as páginas contêm texto oculto ou para verificar se o PDF é pesquisável |
Devoluções
- Body
- GetPDFInfoResponse
Obter texto a partir de PDF
Obter texto de arquivos PDF com base no local do texto e expressões regulares. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter mais informações.
Parâmetros
| Name | Chave | Necessário | Tipo | Description |
|---|---|---|---|---|
|
Conteúdo do Ficheiro
|
fileContent | True | byte |
O conteúdo do ficheiro de origem |
|
Nenhum modelo de correspondência de texto
|
noTextTemplate | True | string |
Modelo para o texto a ser retornado se uma correspondência não for encontrada |
|
Separador de página
|
pageSeparator | string |
Forneça um separador de página para que você possa saber onde estão as quebras de página. |
|
|
Páginas
|
pagerange | string |
Forneça um intervalo de páginas do qual você deseja extrair texto, que pode ser um único número de página (1), vários números de página separados por vírgulas (1,2,3), um intervalo de páginas (1-4) ou uma mistura de todos (1,2,4-7). |
|
|
Nome do arquivo
|
sourceFileName | True | string |
O nome do arquivo de origem |
|
Modelo de resultado de texto
|
textResultTemplate | True | string |
Modelo para o texto a ser retornado se uma correspondência for encontrada |
|
Valor
|
expression | array of string |
Forneça um ou mais valores aqui para serem usados com a propriedade acima, retornaremos o primeiro valor de texto que corresponde à regra mencionada acima. |
|
|
Localização
|
location | True | string |
Área da página - use a ferramenta Zonal para obter coordenadas: [https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
Página (preterida)
|
pagenumber | integer |
Esta propriedade foi preterida, aconselhamos que você use a propriedade Pages. A propriedade Pages aplica-se a todas as zonas e permite-lhe selecionar as páginas que pretende processar. |
|
|
Selecionar
|
position | string |
Use isso para refinar o texto que você extrai mais, selecione uma opção que corresponda às suas necessidades |
|
|
Padrão
|
regex | string |
Se uma expressão regular for fornecida aqui, faremos a correspondência entre qualquer texto extraído e retornaremos a correspondência. |
Devoluções
Obter valor do código de barras
Obtenha o código de barras do PDF. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter mais informações.
Parâmetros
| Name | Chave | Necessário | Tipo | Description |
|---|---|---|---|---|
|
Modelo de resultado de código de barras
|
barcodeResultTemplate | True | string |
Modelo para o resultado do texto de saída se um código de barras for encontrado |
|
Conteúdo do Ficheiro
|
fileContent | True | byte |
O conteúdo do ficheiro de origem |
|
Sem modelo de código de barras
|
noBarcodeTemplate | True | string |
Modelo para o resultado do texto de saída se nenhum código de barras for encontrado |
|
Separador de página
|
pageSeparator | string |
Forneça um separador de página para que você possa saber onde estão as quebras de página. |
|
|
Páginas
|
pagerange | string |
Forneça um intervalo de páginas do qual você deseja extrair texto, que pode ser um único número de página (1), vários números de página separados por vírgulas (1,2,3), um intervalo de páginas (1-4) ou uma mistura de todos (1,2,4-7). |
|
|
Nome do arquivo
|
sourceFileName | True | string |
O nome do arquivo de origem |
|
Tipo
|
barcodeFormats | array of string |
Especifique os tipos de código de barras que deseja identificar |
|
|
Localização
|
location | True | string |
Área da página - use a ferramenta Zonal para obter coordenadas: [https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
Página (preterida)
|
pagenumber | integer |
Esta propriedade foi preterida, aconselhamos que você use a propriedade Pages. A propriedade Pages aplica-se a todas as zonas e permite-lhe selecionar as páginas que pretende processar. |
|
|
Padrão
|
regex | string |
Se uma expressão regular for fornecida aqui, faremos a correspondência entre qualquer texto extraído e retornaremos a correspondência. |
Devoluções
OCR PDF ou imagens
Gere PDF pesquisável a partir de um PDF de imagem ou imagens digitalizadas. Visite [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] para obter mais informações.
Parâmetros
| Name | Chave | Necessário | Tipo | Description |
|---|---|---|---|---|
|
AquaforestImageTimeout
|
aquaforestImageTimeout | integer |
Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade. |
|
|
Author
|
author | string |
Defina um Autor personalizado nas propriedades do documento PDF de saída. |
|
|
Rotação automática
|
autorotate | boolean |
Gire automaticamente a imagem – isso garantirá que todo o texto seja orientado normalmente |
|
|
Binarize
|
binarize | integer |
Em geral, este valor só deve ser utilizado sob orientação do suporte técnico. Ele pode controlar a maneira como as imagens coloridas são processadas e forçar a binarização com um limite específico. Foi demonstrado que um valor de 200 geralmente dá bons resultados nos testes, mas isso deve ser confirmado com documentos "típicos" do cliente. Ao definir isso como -1 um método alternativo é usado que tentará separar o texto de quaisquer imagens ou cores de fundo. Isso pode dar melhores resultados de OCR para certos documentos, como páginas de jornais e revistas. |
|
|
Limite de pixel preto
|
blackPixelLimit | float |
Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade. |
|
|
Limite de página em branco
|
blankPageThreshold | integer |
Use isso para definir o número mínimo de "On Pixels" que devem estar presentes na imagem para que uma página não seja considerada em branco. Um valor de -1 desativará a deteção de página em branco. |
|
|
Tamanho da caixa
|
boxSize | integer |
Esta opção é ideal para formulários em que, por vezes, as caixas em torno do texto podem fazer com que uma área seja identificada como gráficos. Esta opção remove caixas da cópia temporária da imagem usada pelo mecanismo OCR. Não remove caixas da imagem final. Tecnicamente, esta opção remove elementos conectados com uma área mínima (em pixels e definida por esta propriedade). Atualmente, esta opção só é aplicada para imagens bitonais. |
|
|
ConvertToTiff
|
convertToTiff | boolean |
Cada página do documento PDF é rasterizada para uma imagem TIFF. |
|
|
CreateProcess
|
createProcess | boolean |
Defina isso como true se quiser iniciar o processo por meio do pinvoke. |
|
|
Data de criação
|
creationDate | string |
Defina uma data de criação personalizada nas propriedades do documento PDF de saída. A cadeia de caracteres de data deve estar no formato 'aaaa-MM-dd HH:mm:ss'. |
|
|
Deskew
|
deskew | boolean |
Deskew (endireitar) a imagem. |
|
|
Despeckle
|
despeckle | integer |
Isso remove todos os elementos desconectados dentro da imagem que têm altura ou largura em pixels menor do que a figura especificada. O valor máximo é 9 e o valor padrão é 0. |
|
|
DictionaryLookup
|
dictionaryLookup | integer |
Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade. |
|
|
Matriz de pontos
|
dotmatrix | boolean |
Defina isso como true para melhorar o reconhecimento de fontes matriciais. O valor predefinido é falso. Se definido como true para fontes que não sejam matriciais, o reconhecimento pode ser ruim. |
|
|
Ativar saída de depuração
|
enableDebugOutput | boolean |
Habilita a saída de depuração. |
|
|
Comprimir PDF (MRC)
|
enableMrc | boolean |
Isso permite a compactação raster mista, que pode reduzir drasticamente o tamanho de saída de PDFs que incluem digitalizações coloridas. Observe que essa opção só é adequada quando a fonte não é um PDF ou usa ConvertToTiff. |
|
|
Saída PDF/A
|
enablePDFAOutput | boolean |
Se deve ou não sair como PDF/A. |
|
|
Modo de erro
|
errorMode | integer |
Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade. |
|
|
Conteúdo do ficheiro de origem
|
fileContent | True | byte |
Conteúdo do ficheiro para OCR |
|
Nome do arquivo de origem com extensão
|
fileNameWithExtension | True | string |
O nome do ficheiro de origem com extensão ou apenas a extensão (com um ponto inicial '.') |
|
Deteção de flip
|
flipDetect | integer |
Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade. |
|
|
Qualidade em tons de cinza
|
grayscaleQuality | integer |
Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade. |
|
|
Heurística
|
heuristics | integer |
Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade. |
|
|
Jbig2EncFlags
|
jbig2EncFlags | string |
Estes são os sinalizadores que serão passados para o aplicativo usado para gerar versões JBIG2 de imagens usadas na geração de PDF (supondo que essa compactação esteja habilitada). Regra geral, esta opção só deve ser utilizada sob orientação do suporte técnico. |
|
|
Linguagem
|
language | enum |
Selecionar uma das opções abaixo define o idioma a ser usado para o processamento de OCR. O idioma padrão é o inglês. |
|
|
LibTiffSavePageAsBmp
|
libTiffSavePageAsBmp | boolean |
Às vezes, se houver uma imagem que é 1bpp e tem compressão LZW, o pré-processamento pode fazer com que a cor da imagem seja invertida (preto para branco e branco para preto). Defina isso como verdadeiro para evitar isso. |
|
|
Máximo deskew
|
maxDeskew | float |
Ângulo máximo pelo qual uma página será costurada. Regra geral, esta opção só deve ser utilizada sob orientação do apoio técnico (support@aquaforest.com). |
|
|
Confiança mínima no deskew
|
minDeskewConfidence | float |
Regra geral, esta opção só deve ser utilizada sob orientação do apoio técnico (support@aquaforest.com). |
|
|
Data de Modificação
|
modifiedDate | string |
Defina uma data de modificação personalizada nas propriedades do documento PDF de saída. A cadeia de caracteres de data deve estar no formato 'aaaa-MM-dd HH:mm:ss'. |
|
|
Morfo
|
morph | string |
Opções morfológicas que serão aplicadas à imagem binarizada antes do OCR. Se definido como vazio, nenhum será aplicado. As opções comuns incluem as listadas abaixo, mas para mais opções, entre em contato com support@aquaforest.com. |
|
|
MrcBackgroundFactor
|
mrcBackgroundFactor | integer |
Tamanho da amostragem para a parte de fundo da imagem. Quanto maior o número, maior o tamanho dos blocos de imagem usados para a média, o que resultará em uma redução no tamanho, mas também na qualidade. O valor padrão é 3 |
|
|
MrcForegroundFactor
|
mrcForegroundFactor | integer |
Tamanho de amostragem para a parte de primeiro plano da imagem. Quanto maior o número, maior o tamanho dos blocos de imagem usados para a média, o que resultará em uma redução no tamanho, mas também na qualidade. O valor padrão é 3 |
|
|
MrcQuality
|
mrcQuality | integer |
Configuração de qualidade JPEG (valor percentual 1 - 100) para uso ao salvar imagens de fundo e de primeiro plano. O valor padrão é 75 |
|
|
MrcTimeout
|
mrcTimeout | integer |
Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade. |
|
|
NoPictures
|
noPictures | boolean |
Por padrão, se uma área do documento for identificada como uma área gráfica, nenhum processamento OCR será executado nessa área. No entanto, alguns documentos podem incluir áreas ou caixas identificadas como áreas "gráficas" ou "ilustradas", mas que, na realidade, contêm texto útil. Definir NoPictures como True fará com que ele ignore áreas identificadas como imagens, enquanto defini-lo como False forçará o OCR de áreas identificadas como imagens. |
|
|
OcrProcessSetupTimeout
|
ocrProcessSetupTimeout | integer |
Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade. |
|
|
OcrTimeout
|
ocrTimeout | integer |
Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade. |
|
|
Palavra-passe
|
password | string |
A senha para abrir o arquivo PDF de origem |
|
|
PdfToImageBpp
|
pdfToImageBpp | enum |
Os bits por pixel a serem usados para a página PDF rasterizada ao usar o mecanismo 1. Isso só se aplica a documentos que são processados usando ConvertToTiff. O valor padrão para essa propriedade é retirado da página PDF. |
|
|
PdfToImageCompression
|
pdfToImageCompression | enum |
A compressão para definir as imagens extraídas ou rasterizadas de cada página do arquivo PDF de origem. Essas imagens são então OCRed para criar o PDF pesquisável. O valor padrão para essa propriedade é retirado de cada página no arquivo PDF de origem. |
|
|
PdfToImageDpi
|
pdfToImageDpi | enum |
O DPI para definir as imagens rasterizadas de cada página do arquivo PDF de origem. Essas imagens são então OCRed para criar o PDF pesquisável. O valor padrão para essa propriedade é retirado de cada página no arquivo PDF de origem. |
|
|
PdfToImageForceVectorCheck
|
pdfToImageForceVectorCheck | boolean |
Essa configuração é útil ao lidar com documentos que contêm objetos vetoriais (por exemplo, desenhos CAD). Por padrão, as páginas que contêm apenas objetos vetoriais são rasterizadas. As páginas que não têm imagens, mas contêm objetos vetoriais, bem como texto eletrônico, são ignoradas da rasterização. No entanto, às vezes pode haver uma página que contém objetos vetoriais (desenhos CAD), mas seu título pode estar em texto eletrônico. Para forçar a rasterização de páginas como estas, defina essa propriedade como true. |
|
|
PdfToImageIncludeText
|
pdfToImageIncludeText | boolean |
Quando definido como Falso isso impedirá que a conversão de texto real (ou seja, gerado eletronicamente em oposição ao texto que faz parte de uma imagem digitalizada) seja renderizada nas imagens de página extraídas do PDF. Isso ocorre porque o texto já é pesquisável e, portanto, geralmente não requer OCR. O valor pode ser definido como True, no entanto, se o OCR for necessário neste texto real. |
|
|
PdfToImageMaxRes
|
pdfToImageMaxRes | integer |
A resolução máxima das imagens rasterizadas. Se a resolução recuperada da página PDF for maior que esse valor, ela será definida como esse valor. O valor padrão para essa propriedade é 600. |
|
|
PdfToImageMinRes
|
pdfToImageMinRes | integer |
A resolução mínima das imagens rasterizadas. Se a resolução recuperada da página PDF for inferior a este valor, será definida para este valor. O valor padrão para essa propriedade é 200. |
|
|
Versão PDF/A
|
pdfaVersion | enum |
A versão PDF/A. |
|
|
PipeClientConnectionTimeout
|
pipeClientConnectionTimeout | integer |
Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade. |
|
|
RemoveBlankPage
|
removeBlankPage | boolean |
Remova páginas em branco quando BlankPageThreshold for maior que -1 e ConvertToTiff for true. |
|
|
RemoveLines
|
removeLines | boolean |
Remover linhas de imagens fpr melhor reconhecimento. |
|
|
RestartEngineEvery
|
restartEngineEvery | integer |
Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade. |
|
|
Manter marcadores
|
retainBookmarks | boolean |
Retém todos os marcadores do arquivo de origem na saída ao usar ConvertToTiff. |
|
|
Manter a data de criação
|
retainCreationDate | boolean |
Retém a data de criação do arquivo de origem nas propriedades do documento PDF de saída. |
|
|
Reter metadados
|
retainMetadata | boolean |
Retém todos os metadados do arquivo de origem na saída ao usar ConvertToTiff. |
|
|
Manter a data de modificação
|
retainModifiedDate | boolean |
Retém a data de modificação do arquivo de origem nas propriedades do documento PDF de saída. |
|
|
Manter as preferências do espectador
|
retainViewerPreferences | boolean |
Retém todas as preferências do visualizador de PDF, modo de página e layout de página do arquivo de origem na saída ao usar o ConvertToTiff. |
|
|
SalvarPredespeckle
|
savePredespeckle | boolean |
Isso usará a imagem original (ou seja, antes de aplicar o pré-processamento) no PDF de saída. |
|
|
Tables
|
tables | boolean |
Esta opção, quando definida como true, tenta OCR dentro das células da tabela. |
|
|
TextLayerFilterHeight
|
textLayerFilterHeight | integer |
Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade. |
|
|
TextLayerFilterHeightInverted
|
textLayerFilterHeightInverted | integer |
Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade. |
|
|
TextLayerFilterPercentage
|
textLayerFilterPercentage | float |
Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade. |
|
|
TextLayerFilterPercentageInverted
|
textLayerFilterPercentageInverted | float |
Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade. |
|
|
TextLayerFilterRatio
|
textLayerFilterRatio | float |
Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade. |
|
|
TextLayerFilterRatioInverted
|
textLayerFilterRatioInverted | float |
Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade. |
|
|
TextLayerFilterWidth
|
textLayerFilterWidth | integer |
Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade. |
|
|
TextLayerFilterWidthInverted
|
textLayerFilterWidthInverted | integer |
Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade. |
|
|
TextLayerMaxBoxes
|
textLayerMaxBoxes | integer |
Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade. |
|
|
Modo de arrumação
|
tidyUpMode | integer |
Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade. |
|
|
Validar PDF/A
|
validatePDFA | boolean |
Validar ou não o documento PDF/A após a conversão |
|
|
Limite de correspondência de palavras
|
wordMatchThreshold | float |
Entre em contato com o suporte técnico (support@aquaforest.com) para obter orientação sobre como usar esta propriedade. |
Devoluções
Dados de resposta para operação de OCR
- Body
- ocr_response
Definições
ApiExtractPost200ApplicationJsonResponse
| Name | Caminho | Tipo | Description |
|---|---|---|---|
|
Erro
|
ErrorMessage | string |
Se o valor de Is Successful for false, retornaremos uma mensagem de erro |
|
É bem sucedido
|
IsSuccessful | boolean |
Isso retornará true se pelo menos uma página foi extraída |
|
Informações sobre a licença
|
LicenceInfo | string |
Informações sobre sua chave de assinatura da API |
|
Extrair arquivos de saída
|
SplittedFile | array of object |
Matriz de arquivos extraídos |
|
(Conteúdo do arquivo)
|
SplittedFile.SplitFileContent | byte |
Uma cadeia de caracteres base 64 que representa o Conteúdo do Arquivo |
|
(Nome do arquivo)
|
SplittedFile.SplitFileName | string |
Uma cadeia de caracteres que contém o Nome do Arquivo gerado |
|
(Número da página)
|
SplittedFile.pageNumber | string |
O intervalo de páginas que contém o número de página onde ocorreu a extração |
ApiGetTextValueJsonResponse
| Name | Caminho | Tipo | Description |
|---|---|---|---|
|
Mensagem de erro
|
ErrorMessage | string |
Se o valor de Is Successful for false, retornaremos uma mensagem de erro |
|
É bem sucedido
|
IsSuccessful | boolean |
Se o texto foi correspondido com êxito |
|
Informações sobre a licença
|
LicenceInfo | string |
Informações sobre sua chave de assinatura da API |
|
Resultado do texto
|
TextResult | string |
Uma cadeia de caracteres gerada a partir da aplicação do texto extraído ao Modelo de Resultado de Texto fornecido. Observe que, se a contagem de páginas for maior que uma, todas as páginas serão concatenadas usando o Separador de Página. |
|
Results
|
TextResults | array of object |
Uma matriz que contém uma lista de páginas e os valores de texto extraídos |
|
(Número da página)
|
TextResults.pageNumber | string |
A página onde o texto foi encontrado |
|
(Texto da página)
|
TextResults.valueExtracted | string |
Uma cadeia de caracteres gerada a partir da aplicação do texto extraído ao Modelo de Resultado de Texto fornecido. |
|
(Valores de zona)
|
TextResults.zoneValues | array of string |
Uma matriz que contém o texto extraído de cada zona. |
ApiRenameByBarcodePost200ApplicationJsonResponse
| Name | Caminho | Tipo | Description |
|---|---|---|---|
|
Código de barras
|
BarcodeResult | string |
Uma cadeia de caracteres gerada a partir da aplicação do texto extraído ao Modelo de Resultado de código de barras fornecido. Observe que, se a contagem de páginas for maior que uma, todas as páginas serão concatenadas usando o Separador de Página. |
|
Results
|
BarcodeResults | array of object |
Uma matriz contendo uma lista de páginas e os valores de código de barras extraídos |
|
(Número da página)
|
BarcodeResults.pageNumber | string |
A página onde o código de barras foi encontrado |
|
(Código de barras da página)
|
BarcodeResults.valueExtracted | string |
Uma cadeia de caracteres gerada a partir da aplicação do valor de código de barras extraído ao Modelo de Resultado de código de barras fornecido. |
|
(Valores de zona)
|
BarcodeResults.zoneValues | array of string |
Uma matriz contendo o código de barras extraído de cada zona. |
|
Mensagem de erro
|
ErrorMessage | string |
Se o valor de Is Successful for false, retornaremos uma mensagem de erro |
|
É bem sucedido
|
IsSuccessful | boolean |
Se um código de barras foi detetado |
|
Informações sobre a licença
|
LicenceInfo | string |
Informações sobre sua chave de assinatura da API |
ApiSplitPost200ApplicationJsonResponse
| Name | Caminho | Tipo | Description |
|---|---|---|---|
|
Mensagem de erro
|
ErrorMessage | string |
Se o valor de Is Successful for false, retornaremos uma mensagem de erro |
|
É bem sucedido
|
IsSuccessful | boolean |
Isso retornará true se pelo menos uma página dividida tiver sido correspondida. |
|
Informações sobre a licença
|
LicenceInfo | string |
Informações sobre sua chave de assinatura da API |
|
Dividir arquivos de saída
|
SplittedFile | array of object |
Matriz contendo cada um dos arquivos divididos juntamente com detalhes como o nome do arquivo gerado e o número da página. |
|
(Conteúdo do arquivo)
|
SplittedFile.SplitFileContent | byte |
Uma cadeia de caracteres base 64 que representa o Conteúdo do Arquivo |
|
(Nome do arquivo)
|
SplittedFile.SplitFileName | string |
Uma cadeia de caracteres que contém o Nome do Arquivo gerado |
|
(Intervalo de páginas)
|
SplittedFile.pageNumber | string |
O intervalo de páginas que contém os números de página da operação de divisão |
GetPDFInfoResponse
| Name | Caminho | Tipo | Description |
|---|---|---|---|
|
Permitir montagem
|
AllowAssembly | boolean |
Permitir rotação, inserção ou eliminação de páginas. |
|
Permitir impressão degradada
|
AllowDegradedPrinting | boolean |
Permita uma impressão de baixa qualidade. |
|
Permitir conteúdo de extração
|
AllowExtractContents | boolean |
Permite a extração de texto e gráficos. |
|
Permitir extração para acessibilidade
|
AllowExtractForAccessibility | boolean |
Permitir a extração de texto e gráficos em apoio à acessibilidade. |
|
Permitir preenchimento de formulário
|
AllowFillInForm | boolean |
Permitir o preenchimento de campos de formulário. |
|
Permitir modificar anotações
|
AllowModifyAnnotations | boolean |
Permitir a modificação de anotações. |
|
Permitir modificar conteúdo
|
AllowModifyContents | boolean |
Permitir a modificação de conteúdos. |
|
Permitir impressão
|
AllowPrinting | boolean |
Permite uma impressão de alta qualidade. |
|
Author
|
Author | string |
Quem criou o documento. |
|
Data de criação
|
CreationDate | string |
Esta é a data e hora em que o PDF foi criado. |
|
Criador
|
Creator | string |
O aplicativo ou biblioteca de origem. |
|
Mensagem de erro
|
ErrorMessage | string |
Se o valor de Is Successful for false, retornaremos uma mensagem de erro |
|
Tamanho do arquivo (bytes)
|
FileSize | number |
O tamanho do arquivo em bytes |
|
Tem texto oculto
|
HasHiddenText | boolean |
Isso retornará true se o arquivo PDF tiver uma camada OCR. |
|
É criptografado
|
IsEncrypted | boolean |
Isso retornará true se este documento estiver criptografado ou não. |
|
É pesquisável
|
IsSearchable | boolean |
Isso retornará true se o arquivo PDF for pesquisável. |
|
É bem sucedido
|
IsSuccessful | boolean |
Retorna true se a ação foi bem-sucedida. |
|
Palavras-chave
|
Keywords | string |
As palavras-chave podem ser separadas por vírgula. |
|
Informações sobre a licença
|
LicenceInfo | string |
Json resumo da sua quota de subscrição. |
|
Data de Modificação
|
ModifiedDate | string |
Esta propriedade representa a data e a hora em que o PDF foi modificado pela última vez |
|
Número de páginas
|
NumberofPages | integer |
O número de páginas no arquivo PDF. |
|
Versão PDF
|
PDFversion | number |
A versão da especificação PDF contra a qual o documento foi construído. |
|
Producer
|
Producer | string |
O produto que criou o PDF. Nos primórdios do PDF, as pessoas usavam um aplicativo Creator como o Microsoft Word para escrever um documento, imprimi-lo em um arquivo PostScript e, em seguida, o produtor seria o Acrobat Distiller, o aplicativo que convertia o arquivo PostScript em PDF. Hoje em dia Criador e Produtor são muitas vezes o mesmo ou um campo é deixado em branco. |
|
Assunto
|
Subject | string |
Do que trata o documento? |
|
Title
|
Title | string |
O título do documento. |
|
Preso
|
Trapped | string |
Esta propriedade é um valor booleano que indica se o documento foi intercetado. Trapping é um processo de pré-impressão que introduz áreas de cor em separações de cores, a fim de obscurecer possíveis erros de registro. |
|
Metadados XMP
|
XmpMetadata | string |
A Extensible Metadata Platform (XMP) é um padrão ISO, originalmente criado pela Adobe Systems Inc., para a criação, processamento e intercâmbio de metadados padronizados e personalizados para documentos digitais e conjuntos de dados. |
ocr_response
Dados de resposta para operação de OCR
| Name | Caminho | Tipo | Description |
|---|---|---|---|
|
Mensagem de erro
|
ErrorMessage | string |
Se o valor de Is Successful for false, retornaremos uma mensagem de erro |
|
É bem sucedido
|
IsSuccessful | boolean |
Retorna true se o OCR foi bem-sucedido. |
|
Informações sobre a licença
|
LicenceInfo | string |
Informações sobre sua chave de assinatura da API |
|
Conteúdo do arquivo de log
|
LogFileContent | byte |
O conteúdo do log da operação |
|
Conteúdo do arquivo processado
|
OutputFileContent | byte |
Arquivo gerado pelo conversor de PDF Aquaforest. |