Partilhar via


API de Visão por Computador

Extraia informações avançadas de imagens para categorizar e processar dados visuais e proteja seus usuários de conteúdo indesejado com este Serviço Cognitivo do Azure.

Este conector está disponível nos seguintes produtos e regiões:

Serviço Class Regiões
Estúdio Copiloto Standard Todas as regiões do Power Automate
Aplicações Lógicas Standard Todas as regiões do Logic Apps
Aplicações Power Standard Todas as regiões do Power Apps
Automatize o poder Standard Todas as regiões do Power Automate
Contato
Nome Microsoft
URL Suporte do Microsoft LogicApps
Suporte do Microsoft Power Automate
Suporte do Microsoft Power Apps
Metadados do conector
Editora Microsoft
Sítio Web https://azure.microsoft.com/services/cognitive-services/computer-vision/

Para usar essa integração, você precisará de um recurso do Serviço Cognitivo no portal do Azure. Você receberá um ponto de extremidade e uma chave para autenticar seus aplicativos. Para estabelecer uma ligação, forneça a chave da conta, o URL do site e selecione Criar ligação. Para saber mais sobre os custos de operação da sua conexão, saiba mais aqui.

Agora você está pronto para começar a usar essa integração.

Problemas conhecidos e limitações

Observe que os resultados da operação podem estar incompletos devido à natureza subjacente da Api de Serviço Cognitivo , que é baseada em aprendizado de máquina e reconhecimento de padrões.

Conectando-se com o Microsoft Entra ID

Para criar conexões com o Microsoft Entra ID, você deve adicionar a função Usuário de Serviços Cognitivos à sua conta para acessar. Para usar essa conexão, você deve inserir o subdomínio exclusivo associado ao seu recurso de Serviços Cognitivos nas operações de suporte.

Operações não suportadas com a autenticação do Microsoft Entra ID

Ao usar a autenticação do Microsoft Entra ID , apenas as ações V3 são suportadas. As ações preteridas continuarão a funcionar com Access Key autenticação, mas falharão se usadas com uma conexão de ID do Microsoft Entra.

A criar uma ligação

O conector suporta os seguintes tipos de autenticação:

Chave Api ApiKey Todas as regiões Compartilhável
Padrão [DEPRECATED] Esta opção é apenas para conexões mais antigas sem um tipo de autenticação explícita e é fornecida apenas para compatibilidade com versões anteriores. Todas as regiões Não compartilhável

Chave Api

ID de autenticação: keyBasedAuth

Aplicável: Todas as regiões

ApiKey

Esta é uma conexão compartilhável. Se o aplicativo de energia for compartilhado com outro usuário, a conexão também será compartilhada. Para obter mais informações, consulte a Visão geral de conectores para aplicativos de tela - Power Apps | Documentos Microsoft

Nome Tipo Description Obrigatório
Chave da conta securestring Chave de Conta dos Serviços Cognitivos Verdade
Site URL cadeia (de caracteres) URL do site raiz (exemplo: https://westus.api.cognitive.microsoft.com)

Padrão [DEPRECATED]

Aplicável: Todas as regiões

Esta opção é apenas para conexões mais antigas sem um tipo de autenticação explícita e é fornecida apenas para compatibilidade com versões anteriores.

Esta conexão não é compartilhável. Se o aplicativo avançado for compartilhado com outro usuário, outro usuário será solicitado a criar uma nova conexão explicitamente.

Nome Tipo Description Obrigatório
Chave da conta securestring Chave de Conta dos Serviços Cognitivos Verdade
Site URL cadeia (de caracteres) URL do site raiz (Exemplo: https://westus.api.cognitive.microsoft.com ). Se não for especificado, o URL do site será padronizado para 'https://westus.api.cognitive.microsoft.com'.

Limites de Limitação

Name Chamadas Período de Renovação
Chamadas de API por conexão 1200 60 segundos

Ações

Analisar imagem (v3) (visualização)

Esta operação extrai um rico conjunto de recursos visuais com base no conteúdo da imagem.

Análise de Imagens

Esta operação extrai um rico conjunto de recursos visuais com base no conteúdo da imagem.

Descrever imagem

Esta operação gera uma descrição de uma imagem em linguagem legível por humanos com frases completas.

Descrever imagem (V3) (Pré-visualização)

Esta operação gera uma descrição de uma imagem em linguagem legível por humanos com frases completas.

Descrever o conteúdo da imagem

Esta operação gera uma descrição do conteúdo da imagem em linguagem legível por humanos com frases completas.

Descrever o conteúdo da imagem (v3) (visualização)

Esta operação gera uma descrição do conteúdo da imagem em linguagem legível por humanos com frases completas.

Descrever o URL da imagem

Esta operação gera uma descrição de um URL de imagem em linguagem legível por humanos com frases completas.

Descrever o URL da imagem (V3) (Pré-visualização)

Esta operação gera uma descrição de um URL de imagem em linguagem legível por humanos com frases completas.

Detetar objetos

Gera uma lista de objetos deteced na imagem fornecida.

Detetar objetos (V3) (visualização)

Gera uma lista de objetos deteced na imagem fornecida.

Gerar miniatura

Esta operação gera uma imagem em miniatura com a largura e altura especificadas pelo usuário.

Gerar miniatura (V3) (Pré-visualização)

Esta operação gera uma imagem em miniatura com a largura e altura especificadas pelo usuário.

Imagem da tag

Gera uma lista de palavras, ou tags, que são relevantes para o conteúdo da imagem fornecida.

Imagem de marca (v3) (visualização)

Gera uma lista de palavras, ou tags, que são relevantes para o conteúdo da imagem fornecida.

Obter Área de Interesse

Retorna uma caixa delimitadora em torno da área mais importante da imagem.

Obter Área de Interesse (V3) (Pré-visualização)

Retorna uma caixa delimitadora em torno da área mais importante da imagem.

Reconhecer conteúdo específico do domínio

Reconheça celebridades ou pontos de referência em uma imagem.

Reconhecer conteúdo específico do domínio (v3) (visualização)

Reconheça celebridades ou pontos de referência em uma imagem.

Reconhecimento ótico de caracteres (OCR) para JSON

O Reconhecimento Ótico de Caracteres (OCR) deteta texto em uma imagem e extrai os caracteres reconhecidos em um fluxo JSON utilizável pela máquina.

Reconhecimento ótico de caracteres (OCR) para JSON (V3) (visualização)

O Reconhecimento Ótico de Caracteres (OCR) deteta texto em uma imagem e extrai os caracteres reconhecidos em um fluxo JSON utilizável pela máquina.

Reconhecimento ótico de caracteres (OCR) para texto

O Reconhecimento Ótico de Caracteres (OCR) deteta texto em uma imagem e extrai os caracteres reconhecidos em um arquivo de texto.

Reconhecimento ótico de caracteres (OCR) para texto (v3) (visualização)

O Reconhecimento Ótico de Caracteres (OCR) deteta texto em uma imagem e extrai os caracteres reconhecidos em um arquivo de texto.

Analisar imagem (v3) (visualização)

Esta operação extrai um rico conjunto de recursos visuais com base no conteúdo da imagem.

Parâmetros

Name Chave Necessário Tipo Description
Subdomínio ou Região de Recursos
subdomainName True string

Subdomínio ou região geográfica do Azure (por exemplo, westus)

Linguagem
language string

O serviço retornará os resultados do reconhecimento no idioma especificado.

Fonte da imagem
format True string

Fonte da imagem - incluída ou por url de referência.

Imagem
Image True dynamic

Devoluções

Análise de Imagens

Esta operação extrai um rico conjunto de recursos visuais com base no conteúdo da imagem.

Parâmetros

Name Chave Necessário Tipo Description
Linguagem
language string

O serviço retornará os resultados do reconhecimento no idioma especificado.

Fonte da imagem
format True string

Fonte da imagem - incluída ou por url de referência.

Imagem
Image True dynamic

Devoluções

Descrever imagem

Esta operação gera uma descrição de uma imagem em linguagem legível por humanos com frases completas.

Parâmetros

Name Chave Necessário Tipo Description
Máximo de Candidatos
maxCandidates number

Número máximo de descrições de candidatos a devolver.

Linguagem
language string

O serviço retornará os resultados do reconhecimento no idioma especificado.

Fonte da imagem
format True string

Fonte da imagem - incluída ou por url de referência.

Imagem
Image True dynamic

Devoluções

Descrever imagem (V3) (Pré-visualização)

Esta operação gera uma descrição de uma imagem em linguagem legível por humanos com frases completas.

Parâmetros

Name Chave Necessário Tipo Description
Subdomínio ou Região de Recursos
subdomainName True string

Subdomínio ou região geográfica do Azure (por exemplo, westus)

Máximo de Candidatos
maxCandidates number

Número máximo de descrições de candidatos a devolver.

Linguagem
language string

O serviço retornará os resultados do reconhecimento no idioma especificado.

Fonte da imagem
format True string

Fonte da imagem - incluída ou por url de referência.

Imagem
Image True dynamic

Devoluções

Descrever o conteúdo da imagem

Esta operação gera uma descrição do conteúdo da imagem em linguagem legível por humanos com frases completas.

Parâmetros

Name Chave Necessário Tipo Description
Máximo de Candidatos
maxCandidates number

Número máximo de descrições de candidatos a devolver.

Linguagem
language string

O serviço retornará os resultados do reconhecimento no idioma especificado.

Conteúdo da imagem
Image True binary

Fonte da referência da imagem no corpo.

Devoluções

Descrever o conteúdo da imagem (v3) (visualização)

Esta operação gera uma descrição do conteúdo da imagem em linguagem legível por humanos com frases completas.

Parâmetros

Name Chave Necessário Tipo Description
Subdomínio ou Região de Recursos
subdomainName True string

Subdomínio ou região geográfica do Azure (por exemplo, westus)

Máximo de Candidatos
maxCandidates number

Número máximo de descrições de candidatos a devolver.

Linguagem
language string

O serviço retornará os resultados do reconhecimento no idioma especificado.

Conteúdo da imagem
Image True binary

Fonte da referência da imagem no corpo.

Devoluções

Descrever o URL da imagem

Esta operação gera uma descrição de um URL de imagem em linguagem legível por humanos com frases completas.

Parâmetros

Name Chave Necessário Tipo Description
Máximo de Candidatos
maxCandidates number

Número máximo de descrições de candidatos a devolver.

Linguagem
language string

O serviço retornará os resultados do reconhecimento no idioma especificado.

URL da imagem
url url

Fonte de referência de imagem por URL.

Devoluções

Descrever o URL da imagem (V3) (Pré-visualização)

Esta operação gera uma descrição de um URL de imagem em linguagem legível por humanos com frases completas.

Parâmetros

Name Chave Necessário Tipo Description
Subdomínio ou Região de Recursos
subdomainName True string

Subdomínio ou região geográfica do Azure (por exemplo, westus)

Máximo de Candidatos
maxCandidates number

Número máximo de descrições de candidatos a devolver.

Linguagem
language string

O serviço retornará os resultados do reconhecimento no idioma especificado.

URL da imagem
url url

Fonte de referência de imagem por URL.

Devoluções

Detetar objetos

Gera uma lista de objetos deteced na imagem fornecida.

Parâmetros

Name Chave Necessário Tipo Description
Fonte da imagem
format True string

Fonte da imagem - incluída ou por url de referência.

Imagem
Image True dynamic

Devoluções

Detetar objetos (V3) (visualização)

Gera uma lista de objetos deteced na imagem fornecida.

Parâmetros

Name Chave Necessário Tipo Description
Subdomínio ou Região de Recursos
subdomainName True string

Subdomínio ou região geográfica do Azure (por exemplo, westus)

Fonte da imagem
format True string

Fonte da imagem - incluída ou por url de referência.

Imagem
Image True dynamic

Devoluções

Gerar miniatura

Esta operação gera uma imagem em miniatura com a largura e altura especificadas pelo usuário.

Parâmetros

Name Chave Necessário Tipo Description
Largura da miniatura
width True number

Largura da miniatura gerada - recomendado é 50

Altura da miniatura
height True number

Altura da miniatura gerada - recomendado é 50

Recorte inteligente
smartCropping boolean

Sinalizador booleano para permitir o corte inteligente

Fonte da imagem
format True string

Fonte da imagem - incluída ou por url de referência.

Imagem
Image True dynamic

Devoluções

Imagem em miniatura gerada

Miniatura
binary

Gerar miniatura (V3) (Pré-visualização)

Esta operação gera uma imagem em miniatura com a largura e altura especificadas pelo usuário.

Parâmetros

Name Chave Necessário Tipo Description
Subdomínio ou Região de Recursos
subdomainName True string

Subdomínio ou região geográfica do Azure (por exemplo, westus)

Largura da miniatura
width True number

Largura da miniatura gerada - recomendado é 50

Altura da miniatura
height True number

Altura da miniatura gerada - recomendado é 50

Recorte inteligente
smartCropping boolean

Sinalizador booleano para permitir o corte inteligente

Fonte da imagem
format True string

Fonte da imagem - incluída ou por url de referência.

Imagem
Image True dynamic

Devoluções

Imagem em miniatura gerada

Miniatura
binary

Imagem da tag

Gera uma lista de palavras, ou tags, que são relevantes para o conteúdo da imagem fornecida.

Parâmetros

Name Chave Necessário Tipo Description
Fonte da imagem
format True string

Fonte da imagem - incluída ou por url de referência.

Imagem
Image True dynamic

Devoluções

Imagem de marca (v3) (visualização)

Gera uma lista de palavras, ou tags, que são relevantes para o conteúdo da imagem fornecida.

Parâmetros

Name Chave Necessário Tipo Description
Subdomínio ou Região de Recursos
subdomainName True string

Subdomínio ou região geográfica do Azure (por exemplo, westus)

Fonte da imagem
format True string

Fonte da imagem - incluída ou por url de referência.

Imagem
Image True dynamic

Devoluções

Obter Área de Interesse

Retorna uma caixa delimitadora em torno da área mais importante da imagem.

Parâmetros

Name Chave Necessário Tipo Description
Fonte da imagem
format True string

Fonte da imagem - incluída ou por url de referência.

Imagem
Image True dynamic

Devoluções

Obter Área de Interesse (V3) (Pré-visualização)

Retorna uma caixa delimitadora em torno da área mais importante da imagem.

Parâmetros

Name Chave Necessário Tipo Description
Subdomínio ou Região de Recursos
subdomainName True string

Subdomínio ou região geográfica do Azure (por exemplo, westus)

Fonte da imagem
format True string

Fonte da imagem - incluída ou por url de referência.

Imagem
Image True dynamic

Devoluções

Reconhecer conteúdo específico do domínio

Reconheça celebridades ou pontos de referência em uma imagem.

Parâmetros

Name Chave Necessário Tipo Description
Modelo de Domínio
model True string

Modelo específico de domínio suportado para reconhecer na imagem.

Fonte da imagem
format True string

Fonte da imagem - incluída ou por url de referência.

Imagem
Image True dynamic

Devoluções

Reconhecer conteúdo específico do domínio (v3) (visualização)

Reconheça celebridades ou pontos de referência em uma imagem.

Parâmetros

Name Chave Necessário Tipo Description
Subdomínio ou Região de Recursos
subdomainName True string

Subdomínio ou região geográfica do Azure (por exemplo, westus)

Modelo de Domínio
model True string

Modelo específico de domínio suportado para reconhecer na imagem.

Fonte da imagem
format True string

Fonte da imagem - incluída ou por url de referência.

Imagem
Image True dynamic

Devoluções

Reconhecimento ótico de caracteres (OCR) para JSON

O Reconhecimento Ótico de Caracteres (OCR) deteta texto em uma imagem e extrai os caracteres reconhecidos em um fluxo JSON utilizável pela máquina.

Parâmetros

Name Chave Necessário Tipo Description
Fonte da imagem
format True string

Fonte da imagem - incluída ou por url de referência.

Imagem
Image True dynamic

Devoluções

Resposta JSON
OCRJsonResponse

Reconhecimento ótico de caracteres (OCR) para JSON (V3) (visualização)

O Reconhecimento Ótico de Caracteres (OCR) deteta texto em uma imagem e extrai os caracteres reconhecidos em um fluxo JSON utilizável pela máquina.

Parâmetros

Name Chave Necessário Tipo Description
Subdomínio ou Região de Recursos
subdomainName True string

Subdomínio ou região geográfica do Azure (por exemplo, westus)

Fonte da imagem
format True string

Fonte da imagem - incluída ou por url de referência.

Imagem
Image True dynamic

Devoluções

Resposta JSON
OCRJsonResponse

Reconhecimento ótico de caracteres (OCR) para texto

O Reconhecimento Ótico de Caracteres (OCR) deteta texto em uma imagem e extrai os caracteres reconhecidos em um arquivo de texto.

Parâmetros

Name Chave Necessário Tipo Description
Fonte da imagem
format True string

Fonte da imagem - incluída ou por url de referência.

Imagem
Image True dynamic

Devoluções

Reconhecimento ótico de caracteres (OCR) para texto (v3) (visualização)

O Reconhecimento Ótico de Caracteres (OCR) deteta texto em uma imagem e extrai os caracteres reconhecidos em um arquivo de texto.

Parâmetros

Name Chave Necessário Tipo Description
Subdomínio ou Região de Recursos
subdomainName True string

Subdomínio ou região geográfica do Azure (por exemplo, westus)

Fonte da imagem
format True string

Fonte da imagem - incluída ou por url de referência.

Imagem
Image True dynamic

Devoluções

Definições

DomainModelResponse

Name Caminho Tipo Description
celebridades
result.celebrities array of object

Celebridades reconhecidas em imagem

Confiança nas celebridades
result.celebrities.confidence float

Índice de confiança de que a imagem é de celebridade

Nome da celebridade
result.celebrities.name string

Nome da celebridade reconhecida

Lugares de destaque
result.landmarks array of object

Pontos de referência reconhecidos na imagem

Marco da Confiança
result.landmarks.confidence float

Índice de confiança de que a imagem é de referência

Nome do marco
result.landmarks.name string

Nome do marco identificado

TagResponse

Name Caminho Tipo Description
tags
tags array of object

Conjunto de tags retornadas da análise de imagem.

Pontuação de confiança da tag
tags.confidence float

Pontuação de confiança da tag identificada.

Nome da tag
tags.name string

Nome da tag identificada.

DetectResponse

Name Caminho Tipo Description
objetos
objects array of object

Conjunto de objetos retornados da análise da imagem.

Pontuação de confiança do objeto
objects.confidence float

Escore de confiança do objeto identificado.

Nome do objeto
objects.object string

Nome do objeto identificado.

AreaOfInterestResponse

OCRJsonResponse

Name Caminho Tipo Description
Linguagem de texto
language string

Idioma detetado do texto da imagem.

Matriz de regiões
regions array of object

Regiões de texto retornadas.

OCRTextResponse

Name Caminho Tipo Description
Texto detetado
text string

Texto detetado na imagem analisada

AnalyzeResponse

Name Caminho Tipo Description
categories
categories array of object

Categorias identificadas a partir da imagem

Nome da categoria
categories.name string

Nome da categoria identificada a partir da imagem

Pontuação de Confiança da Categoria
categories.score float

Índice de confiança para a categoria de imagem

Captions
description.captions array of object

Lista de legendas geradas a partir da imagem

Pontuação de confiança da legenda
description.captions.confidence float

Pontuação de confiança da legenda da imagem

Texto da legenda
description.captions.text string

Legenda de texto gerada a partir da imagem

Nomes de tags
description.tags array of string

Coleção de nomes de tags.

tags
tags array of object

Tags identificadas com pontuações de confiança.

Pontuação de confiança da tag
tags.confidence float

Pontuação de confiança para as tags identificadas.

Nome da tag
tags.name string

Nome da tag identificada.

DescribeResponse

Name Caminho Tipo Description
Captions
description.captions array of object

Lista de legendas geradas a partir da imagem

Pontuação de confiança da legenda
description.captions.confidence float

Pontuação de confiança da legenda da imagem

Texto da legenda
description.captions.text string

Legenda de texto gerada a partir da imagem

Nomes de tags
description.tags array of string

Coleção de nomes de tags.

binário

Este é o tipo de dados básico 'binário'.