API de Visão por Computador

Extraia informações avançadas de imagens para categorizar e processar dados visuais e proteja seus usuários de conteúdo indesejado com este Serviço Cognitivo do Azure.

Este conector está disponível nos seguintes produtos e regiões:

Serviço	Class	Regiões
Estúdio Copiloto	Standard	Todas as regiões do Power Automate
Aplicações Lógicas	Standard	Todas as regiões do Logic Apps
Aplicações Power	Standard	Todas as regiões do Power Apps
Automatize o poder	Standard	Todas as regiões do Power Automate

Contato
Nome	Microsoft
URL	Suporte do Microsoft LogicApps Suporte do Microsoft Power Automate Suporte do Microsoft Power Apps

Metadados do conector
Editora	Microsoft
Sítio Web	https://azure.microsoft.com/services/cognitive-services/computer-vision/

Para usar essa integração, você precisará de um recurso do Serviço Cognitivo no portal do Azure. Você receberá um ponto de extremidade e uma chave para autenticar seus aplicativos. Para estabelecer uma ligação, forneça a chave da conta, o URL do site e selecione Criar ligação. Para saber mais sobre os custos de operação da sua conexão, saiba mais aqui.

Agora você está pronto para começar a usar essa integração.

Problemas conhecidos e limitações

Observe que os resultados da operação podem estar incompletos devido à natureza subjacente da Api de Serviço Cognitivo , que é baseada em aprendizado de máquina e reconhecimento de padrões.

Conectando-se com o Microsoft Entra ID

Para criar conexões com o Microsoft Entra ID, você deve adicionar a função Usuário de Serviços Cognitivos à sua conta para acessar. Para usar essa conexão, você deve inserir o subdomínio exclusivo associado ao seu recurso de Serviços Cognitivos nas operações de suporte.

Operações não suportadas com a autenticação do Microsoft Entra ID

Ao usar a autenticação do Microsoft Entra ID , apenas as ações V3 são suportadas. As ações preteridas continuarão a funcionar com Access Key autenticação, mas falharão se usadas com uma conexão de ID do Microsoft Entra.

A criar uma ligação

O conector suporta os seguintes tipos de autenticação:


Chave Api	ApiKey	Todas as regiões	Compartilhável
Padrão [DEPRECATED]	Esta opção é apenas para conexões mais antigas sem um tipo de autenticação explícita e é fornecida apenas para compatibilidade com versões anteriores.	Todas as regiões	Não compartilhável

Chave Api

ID de autenticação: keyBasedAuth

Aplicável: Todas as regiões

ApiKey

Esta é uma conexão compartilhável. Se o aplicativo de energia for compartilhado com outro usuário, a conexão também será compartilhada. Para obter mais informações, consulte a Visão geral de conectores para aplicativos de tela - Power Apps | Documentos Microsoft

Nome	Tipo	Description	Obrigatório
Chave da conta	securestring	Chave de Conta dos Serviços Cognitivos	Verdade
Site URL	cadeia (de caracteres)	URL do site raiz (exemplo: https://westus.api.cognitive.microsoft.com)

Padrão [DEPRECATED]

Aplicável: Todas as regiões

Esta opção é apenas para conexões mais antigas sem um tipo de autenticação explícita e é fornecida apenas para compatibilidade com versões anteriores.

Esta conexão não é compartilhável. Se o aplicativo avançado for compartilhado com outro usuário, outro usuário será solicitado a criar uma nova conexão explicitamente.

Nome	Tipo	Description	Obrigatório
Chave da conta	securestring	Chave de Conta dos Serviços Cognitivos	Verdade
Site URL	cadeia (de caracteres)	URL do site raiz (Exemplo: https://westus.api.cognitive.microsoft.com ). Se não for especificado, o URL do site será padronizado para 'https://westus.api.cognitive.microsoft.com'.

Limites de Limitação

Name	Chamadas	Período de Renovação
Chamadas de API por conexão	1200	60 segundos

Ações

Analisar imagem (v3) (visualização)	Esta operação extrai um rico conjunto de recursos visuais com base no conteúdo da imagem.
Análise de Imagens	Esta operação extrai um rico conjunto de recursos visuais com base no conteúdo da imagem.
Descrever imagem	Esta operação gera uma descrição de uma imagem em linguagem legível por humanos com frases completas.
Descrever imagem (V3) (Pré-visualização)	Esta operação gera uma descrição de uma imagem em linguagem legível por humanos com frases completas.
Descrever o conteúdo da imagem	Esta operação gera uma descrição do conteúdo da imagem em linguagem legível por humanos com frases completas.
Descrever o conteúdo da imagem (v3) (visualização)	Esta operação gera uma descrição do conteúdo da imagem em linguagem legível por humanos com frases completas.
Descrever o URL da imagem	Esta operação gera uma descrição de um URL de imagem em linguagem legível por humanos com frases completas.
Descrever o URL da imagem (V3) (Pré-visualização)	Esta operação gera uma descrição de um URL de imagem em linguagem legível por humanos com frases completas.
Detetar objetos	Gera uma lista de objetos deteced na imagem fornecida.
Detetar objetos (V3) (visualização)	Gera uma lista de objetos deteced na imagem fornecida.
Gerar miniatura	Esta operação gera uma imagem em miniatura com a largura e altura especificadas pelo usuário.
Gerar miniatura (V3) (Pré-visualização)	Esta operação gera uma imagem em miniatura com a largura e altura especificadas pelo usuário.
Imagem da tag	Gera uma lista de palavras, ou tags, que são relevantes para o conteúdo da imagem fornecida.
Imagem de marca (v3) (visualização)	Gera uma lista de palavras, ou tags, que são relevantes para o conteúdo da imagem fornecida.
Obter Área de Interesse	Retorna uma caixa delimitadora em torno da área mais importante da imagem.
Obter Área de Interesse (V3) (Pré-visualização)	Retorna uma caixa delimitadora em torno da área mais importante da imagem.
Reconhecer conteúdo específico do domínio	Reconheça celebridades ou pontos de referência em uma imagem.
Reconhecer conteúdo específico do domínio (v3) (visualização)	Reconheça celebridades ou pontos de referência em uma imagem.
Reconhecimento ótico de caracteres (OCR) para JSON	O Reconhecimento Ótico de Caracteres (OCR) deteta texto em uma imagem e extrai os caracteres reconhecidos em um fluxo JSON utilizável pela máquina.
Reconhecimento ótico de caracteres (OCR) para JSON (V3) (visualização)	O Reconhecimento Ótico de Caracteres (OCR) deteta texto em uma imagem e extrai os caracteres reconhecidos em um fluxo JSON utilizável pela máquina.
Reconhecimento ótico de caracteres (OCR) para texto	O Reconhecimento Ótico de Caracteres (OCR) deteta texto em uma imagem e extrai os caracteres reconhecidos em um arquivo de texto.
Reconhecimento ótico de caracteres (OCR) para texto (v3) (visualização)	O Reconhecimento Ótico de Caracteres (OCR) deteta texto em uma imagem e extrai os caracteres reconhecidos em um arquivo de texto.

Analisar imagem (v3) (visualização)

ID da Operação:: AnalyzeImageV3

Esta operação extrai um rico conjunto de recursos visuais com base no conteúdo da imagem.

Parâmetros

Name	Chave	Necessário	Tipo	Description
Subdomínio ou Região de Recursos	subdomainName	True	string	Subdomínio ou região geográfica do Azure (por exemplo, westus)
Linguagem	language		string	O serviço retornará os resultados do reconhecimento no idioma especificado.
Fonte da imagem	format	True	string	Fonte da imagem - incluída ou por url de referência.
Imagem	Image	True	dynamic

Devoluções

Body: AnalyzeResponse

Análise de Imagens

ID da Operação:: AnalyzeImageV2

Esta operação extrai um rico conjunto de recursos visuais com base no conteúdo da imagem.

Parâmetros

Name	Chave	Necessário	Tipo	Description
Linguagem	language		string	O serviço retornará os resultados do reconhecimento no idioma especificado.
Fonte da imagem	format	True	string	Fonte da imagem - incluída ou por url de referência.
Imagem	Image	True	dynamic

Devoluções

Body: AnalyzeResponse

Descrever imagem

ID da Operação:: DescribeImageV2

Esta operação gera uma descrição de uma imagem em linguagem legível por humanos com frases completas.

Parâmetros

Name	Chave	Necessário	Tipo	Description
Máximo de Candidatos	maxCandidates		number	Número máximo de descrições de candidatos a devolver.
Linguagem	language		string	O serviço retornará os resultados do reconhecimento no idioma especificado.
Fonte da imagem	format	True	string	Fonte da imagem - incluída ou por url de referência.
Imagem	Image	True	dynamic

Devoluções

Body: DescribeResponse

Descrever imagem (V3) (Pré-visualização)

ID da Operação:: DescribeImageV3

Esta operação gera uma descrição de uma imagem em linguagem legível por humanos com frases completas.

Parâmetros

Name	Chave	Necessário	Tipo	Description
Subdomínio ou Região de Recursos	subdomainName	True	string	Subdomínio ou região geográfica do Azure (por exemplo, westus)
Máximo de Candidatos	maxCandidates		number	Número máximo de descrições de candidatos a devolver.
Linguagem	language		string	O serviço retornará os resultados do reconhecimento no idioma especificado.
Fonte da imagem	format	True	string	Fonte da imagem - incluída ou por url de referência.
Imagem	Image	True	dynamic

Devoluções

Body: DescribeResponse

Descrever o conteúdo da imagem

ID da Operação:: DescribeImageContentV2

Esta operação gera uma descrição do conteúdo da imagem em linguagem legível por humanos com frases completas.

Parâmetros

Name	Chave	Necessário	Tipo	Description
Máximo de Candidatos	maxCandidates		number	Número máximo de descrições de candidatos a devolver.
Linguagem	language		string	O serviço retornará os resultados do reconhecimento no idioma especificado.
Conteúdo da imagem	Image	True	binary	Fonte da referência da imagem no corpo.

Devoluções

Body: DescribeResponse

Descrever o conteúdo da imagem (v3) (visualização)

ID da Operação:: DescribeImageContentV3

Esta operação gera uma descrição do conteúdo da imagem em linguagem legível por humanos com frases completas.

Parâmetros

Name	Chave	Necessário	Tipo	Description
Subdomínio ou Região de Recursos	subdomainName	True	string	Subdomínio ou região geográfica do Azure (por exemplo, westus)
Máximo de Candidatos	maxCandidates		number	Número máximo de descrições de candidatos a devolver.
Linguagem	language		string	O serviço retornará os resultados do reconhecimento no idioma especificado.
Conteúdo da imagem	Image	True	binary	Fonte da referência da imagem no corpo.

Devoluções

Body: DescribeResponse

Descrever o URL da imagem

ID da Operação:: DescribeImageURLV2

Esta operação gera uma descrição de um URL de imagem em linguagem legível por humanos com frases completas.

Parâmetros

Name	Chave	Tipo	Description
Máximo de Candidatos	maxCandidates	number	Número máximo de descrições de candidatos a devolver.
Linguagem	language	string	O serviço retornará os resultados do reconhecimento no idioma especificado.
URL da imagem	url	url	Fonte de referência de imagem por URL.

Devoluções

Body: DescribeResponse

Descrever o URL da imagem (V3) (Pré-visualização)

ID da Operação:: DescribeImageURLV3

Esta operação gera uma descrição de um URL de imagem em linguagem legível por humanos com frases completas.

Parâmetros

Name	Chave	Necessário	Tipo	Description
Subdomínio ou Região de Recursos	subdomainName	True	string	Subdomínio ou região geográfica do Azure (por exemplo, westus)
Máximo de Candidatos	maxCandidates		number	Número máximo de descrições de candidatos a devolver.
Linguagem	language		string	O serviço retornará os resultados do reconhecimento no idioma especificado.
URL da imagem	url		url	Fonte de referência de imagem por URL.

Devoluções

Body: DescribeResponse

Detetar objetos

ID da Operação:: DetectObjects

Gera uma lista de objetos deteced na imagem fornecida.

Parâmetros

Name	Chave	Necessário	Tipo	Description
Fonte da imagem	format	True	string	Fonte da imagem - incluída ou por url de referência.
Imagem	Image	True	dynamic

Devoluções

Body: DetectResponse

Detetar objetos (V3) (visualização)

ID da Operação:: DetectObjectsV3

Gera uma lista de objetos deteced na imagem fornecida.

Parâmetros

Name	Chave	Necessário	Tipo	Description
Subdomínio ou Região de Recursos	subdomainName	True	string	Subdomínio ou região geográfica do Azure (por exemplo, westus)
Fonte da imagem	format	True	string	Fonte da imagem - incluída ou por url de referência.
Imagem	Image	True	dynamic

Devoluções

Body: DetectResponse

Gerar miniatura

ID da Operação:: GetThumbnailV2

Esta operação gera uma imagem em miniatura com a largura e altura especificadas pelo usuário.

Parâmetros

Name	Chave	Necessário	Tipo	Description
Largura da miniatura	width	True	number	Largura da miniatura gerada - recomendado é 50
Altura da miniatura	height	True	number	Altura da miniatura gerada - recomendado é 50
Recorte inteligente	smartCropping		boolean	Sinalizador booleano para permitir o corte inteligente
Fonte da imagem	format	True	string	Fonte da imagem - incluída ou por url de referência.
Imagem	Image	True	dynamic

Devoluções

Imagem em miniatura gerada

Miniatura: binary

Gerar miniatura (V3) (Pré-visualização)

ID da Operação:: GetThumbnailV3

Esta operação gera uma imagem em miniatura com a largura e altura especificadas pelo usuário.

Parâmetros

Name	Chave	Necessário	Tipo	Description
Subdomínio ou Região de Recursos	subdomainName	True	string	Subdomínio ou região geográfica do Azure (por exemplo, westus)
Largura da miniatura	width	True	number	Largura da miniatura gerada - recomendado é 50
Altura da miniatura	height	True	number	Altura da miniatura gerada - recomendado é 50
Recorte inteligente	smartCropping		boolean	Sinalizador booleano para permitir o corte inteligente
Fonte da imagem	format	True	string	Fonte da imagem - incluída ou por url de referência.
Imagem	Image	True	dynamic

Devoluções

Imagem em miniatura gerada

Miniatura: binary

Imagem da tag

ID da Operação:: TagImageV2

Gera uma lista de palavras, ou tags, que são relevantes para o conteúdo da imagem fornecida.

Parâmetros

Name	Chave	Necessário	Tipo	Description
Fonte da imagem	format	True	string	Fonte da imagem - incluída ou por url de referência.
Imagem	Image	True	dynamic

Devoluções

Body: TagResponse

Imagem de marca (v3) (visualização)

ID da Operação:: TagImageV3

Gera uma lista de palavras, ou tags, que são relevantes para o conteúdo da imagem fornecida.

Parâmetros

Name	Chave	Necessário	Tipo	Description
Subdomínio ou Região de Recursos	subdomainName	True	string	Subdomínio ou região geográfica do Azure (por exemplo, westus)
Fonte da imagem	format	True	string	Fonte da imagem - incluída ou por url de referência.
Imagem	Image	True	dynamic

Devoluções

Body: TagResponse

Obter Área de Interesse

ID da Operação:: GetAreaOfInterest

Retorna uma caixa delimitadora em torno da área mais importante da imagem.

Parâmetros

Name	Chave	Necessário	Tipo	Description
Fonte da imagem	format	True	string	Fonte da imagem - incluída ou por url de referência.
Imagem	Image	True	dynamic

Devoluções

Body: AreaOfInterestResponse

Obter Área de Interesse (V3) (Pré-visualização)

ID da Operação:: GetAreaOfInterestV3

Retorna uma caixa delimitadora em torno da área mais importante da imagem.

Parâmetros

Name	Chave	Necessário	Tipo	Description
Subdomínio ou Região de Recursos	subdomainName	True	string	Subdomínio ou região geográfica do Azure (por exemplo, westus)
Fonte da imagem	format	True	string	Fonte da imagem - incluída ou por url de referência.
Imagem	Image	True	dynamic

Devoluções

Body: AreaOfInterestResponse

Reconhecer conteúdo específico do domínio

ID da Operação:: RecognizeDomainSpecificContentV2

Reconheça celebridades ou pontos de referência em uma imagem.

Parâmetros

Name	Chave	Necessário	Tipo	Description
Modelo de Domínio	model	True	string	Modelo específico de domínio suportado para reconhecer na imagem.
Fonte da imagem	format	True	string	Fonte da imagem - incluída ou por url de referência.
Imagem	Image	True	dynamic

Devoluções

Body: DomainModelResponse

Reconhecer conteúdo específico do domínio (v3) (visualização)

ID da Operação:: RecognizeDomainSpecificContentV3

Reconheça celebridades ou pontos de referência em uma imagem.

Parâmetros

Name	Chave	Necessário	Tipo	Description
Subdomínio ou Região de Recursos	subdomainName	True	string	Subdomínio ou região geográfica do Azure (por exemplo, westus)
Modelo de Domínio	model	True	string	Modelo específico de domínio suportado para reconhecer na imagem.
Fonte da imagem	format	True	string	Fonte da imagem - incluída ou por url de referência.
Imagem	Image	True	dynamic

Devoluções

Body: DomainModelResponse

Reconhecimento ótico de caracteres (OCR) para JSON

ID da Operação:: OCRV2

O Reconhecimento Ótico de Caracteres (OCR) deteta texto em uma imagem e extrai os caracteres reconhecidos em um fluxo JSON utilizável pela máquina.

Parâmetros

Name	Chave	Necessário	Tipo	Description
Fonte da imagem	format	True	string	Fonte da imagem - incluída ou por url de referência.
Imagem	Image	True	dynamic

Devoluções

Resposta JSON: OCRJsonResponse

Reconhecimento ótico de caracteres (OCR) para JSON (V3) (visualização)

ID da Operação:: OCRV3

O Reconhecimento Ótico de Caracteres (OCR) deteta texto em uma imagem e extrai os caracteres reconhecidos em um fluxo JSON utilizável pela máquina.

Parâmetros

Name	Chave	Necessário	Tipo	Description
Subdomínio ou Região de Recursos	subdomainName	True	string	Subdomínio ou região geográfica do Azure (por exemplo, westus)
Fonte da imagem	format	True	string	Fonte da imagem - incluída ou por url de referência.
Imagem	Image	True	dynamic

Devoluções

Resposta JSON: OCRJsonResponse

Reconhecimento ótico de caracteres (OCR) para texto

ID da Operação:: OCRTextV2

O Reconhecimento Ótico de Caracteres (OCR) deteta texto em uma imagem e extrai os caracteres reconhecidos em um arquivo de texto.

Parâmetros

Name	Chave	Necessário	Tipo	Description
Fonte da imagem	format	True	string	Fonte da imagem - incluída ou por url de referência.
Imagem	Image	True	dynamic

Devoluções

Body: OCRTextResponse

Reconhecimento ótico de caracteres (OCR) para texto (v3) (visualização)

ID da Operação:: OCRTextV3

O Reconhecimento Ótico de Caracteres (OCR) deteta texto em uma imagem e extrai os caracteres reconhecidos em um arquivo de texto.

Parâmetros

Name	Chave	Necessário	Tipo	Description
Subdomínio ou Região de Recursos	subdomainName	True	string	Subdomínio ou região geográfica do Azure (por exemplo, westus)
Fonte da imagem	format	True	string	Fonte da imagem - incluída ou por url de referência.
Imagem	Image	True	dynamic

Devoluções

Body: OCRTextResponse

Definições

DomainModelResponse

Name	Caminho	Tipo	Description
celebridades	result.celebrities	array of object	Celebridades reconhecidas em imagem
Confiança nas celebridades	result.celebrities.confidence	float	Índice de confiança de que a imagem é de celebridade
Nome da celebridade	result.celebrities.name	string	Nome da celebridade reconhecida
Lugares de destaque	result.landmarks	array of object	Pontos de referência reconhecidos na imagem
Marco da Confiança	result.landmarks.confidence	float	Índice de confiança de que a imagem é de referência
Nome do marco	result.landmarks.name	string	Nome do marco identificado

TagResponse

Name	Caminho	Tipo	Description
tags	tags	array of object	Conjunto de tags retornadas da análise de imagem.
Pontuação de confiança da tag	tags.confidence	float	Pontuação de confiança da tag identificada.
Nome da tag	tags.name	string	Nome da tag identificada.

DetectResponse

Name	Caminho	Tipo	Description
objetos	objects	array of object	Conjunto de objetos retornados da análise da imagem.
Pontuação de confiança do objeto	objects.confidence	float	Escore de confiança do objeto identificado.
Nome do objeto	objects.object	string	Nome do objeto identificado.

AreaOfInterestResponse

OCRJsonResponse

Name	Caminho	Tipo	Description
Linguagem de texto	language	string	Idioma detetado do texto da imagem.
Matriz de regiões	regions	array of object	Regiões de texto retornadas.

OCRTextResponse

Name	Caminho	Tipo	Description
Texto detetado	text	string	Texto detetado na imagem analisada

AnalyzeResponse

Name	Caminho	Tipo	Description
categories	categories	array of object	Categorias identificadas a partir da imagem
Nome da categoria	categories.name	string	Nome da categoria identificada a partir da imagem
Pontuação de Confiança da Categoria	categories.score	float	Índice de confiança para a categoria de imagem
Captions	description.captions	array of object	Lista de legendas geradas a partir da imagem
Pontuação de confiança da legenda	description.captions.confidence	float	Pontuação de confiança da legenda da imagem
Texto da legenda	description.captions.text	string	Legenda de texto gerada a partir da imagem
Nomes de tags	description.tags	array of string	Coleção de nomes de tags.
tags	tags	array of object	Tags identificadas com pontuações de confiança.
Pontuação de confiança da tag	tags.confidence	float	Pontuação de confiança para as tags identificadas.
Nome da tag	tags.name	string	Nome da tag identificada.

DescribeResponse

Name	Caminho	Tipo	Description
Captions	description.captions	array of object	Lista de legendas geradas a partir da imagem
Pontuação de confiança da legenda	description.captions.confidence	float	Pontuação de confiança da legenda da imagem
Texto da legenda	description.captions.text	string	Legenda de texto gerada a partir da imagem
Nomes de tags	description.tags	array of string	Coleção de nomes de tags.

binário

Este é o tipo de dados básico 'binário'.

Partilhar via

API de Visão por Computador

Problemas conhecidos e limitações

Conectando-se com o Microsoft Entra ID

Operações não suportadas com a autenticação do Microsoft Entra ID

A criar uma ligação

Chave Api

Padrão [DEPRECATED]

Limites de Limitação

Ações

Analisar imagem (v3) (visualização)

Parâmetros

Devoluções

Análise de Imagens

Parâmetros

Devoluções

Descrever imagem

Parâmetros

Devoluções

Descrever imagem (V3) (Pré-visualização)

Parâmetros

Devoluções

Descrever o conteúdo da imagem

Parâmetros

Devoluções

Descrever o conteúdo da imagem (v3) (visualização)

Parâmetros

Devoluções

Descrever o URL da imagem

Parâmetros

Devoluções

Descrever o URL da imagem (V3) (Pré-visualização)

Parâmetros

Devoluções

Detetar objetos

Parâmetros

Devoluções

Detetar objetos (V3) (visualização)

Parâmetros

Devoluções

Gerar miniatura

Parâmetros

Devoluções

Gerar miniatura (V3) (Pré-visualização)

Parâmetros

Devoluções

Imagem da tag

Parâmetros

Devoluções

Imagem de marca (v3) (visualização)

Parâmetros

Devoluções

Obter Área de Interesse

Parâmetros

Devoluções

Obter Área de Interesse (V3) (Pré-visualização)

Parâmetros

Devoluções

Reconhecer conteúdo específico do domínio

Parâmetros

Devoluções

Reconhecer conteúdo específico do domínio (v3) (visualização)

Parâmetros

Devoluções

Reconhecimento ótico de caracteres (OCR) para JSON

Parâmetros

Devoluções

Reconhecimento ótico de caracteres (OCR) para JSON (V3) (visualização)

Parâmetros

Devoluções

Reconhecimento ótico de caracteres (OCR) para texto

Parâmetros

Devoluções

Reconhecimento ótico de caracteres (OCR) para texto (v3) (visualização)

Parâmetros

Devoluções

Definições

DomainModelResponse

TagResponse

DetectResponse