Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Aviso
Não recomendamos o uso deste serviço, incluindo a Azure Vision na antiga API OCR v3.2 do Foundry Tools e a API RecognizeText v2.1.
Edições OCR (Leitura)
Importante
Selecione a edição Read que melhor se adapta às suas necessidades.
| Entrada | Exemplos | Ler edição | Benefício |
|---|---|---|---|
| Imagens: Imagens gerais, em ambiente natural | rótulos, sinais de rua e cartazes | OCR para imagens (versão 4.0) | Otimizado para imagens gerais não documentais com uma API síncrona de desempenho aprimorado que facilita a incorporação de OCR em cenários de experiência do usuário. |
| Documentos: digitais e digitalizados, incluindo imagens | livros, artigos e relatórios | Modelo de leitura do Document Intelligence | Otimizado para documentos digitalizados e digitais com grande quantidade de texto, com uma API assíncrona para ajudar a automatizar o processamento inteligente de documentos em escala. |
Sobre Azure Vision v3.2 GA Read
Procura pela capacidade de leitura mais recente do Azure Vision v3.2 GA? Todos os futuros aprimoramentos do Read OCR fazem parte dos dois serviços listados anteriormente. Não há mais atualizações para o Azure Vision v3.2. Para mais informações, consulte Call Azure Vision 3.2 GA Read API e Quickstart: Azure Vision v3.2 GA Read.
OCR ou Reconhecimento ótico de carateres também é referido como reconhecimento de texto ou extração de texto. As técnicas de OCR baseadas em aprendizado de máquina permitem extrair texto impresso ou manuscrito de imagens como cartazes, placas de rua e rótulos de produtos, bem como de documentos como artigos, relatórios, formulários e faturas. O texto é normalmente extraído como palavras, linhas de texto e parágrafos ou blocos de texto, permitindo o acesso à versão digital do texto digitalizado. Essa capacidade elimina ou reduz significativamente a necessidade de entrada manual de dados.
motor de OCR
O mecanismo Read OCR da Microsoft usa vários modelos avançados de aprendizado de máquina que suportam idiomas globais. Extrai texto impresso e manuscrito, incluindo línguas e estilos de escrita mistos. Você pode usar Read como um serviço de nuvem ou como um contêiner local para implantação flexível. Ele também está disponível como uma API síncrona para cenários únicos, não documentais e somente de imagem, com aprimoramentos de desempenho que simplificam a implementação de experiências de usuário assistidas por OCR.
Como o OCR está relacionado ao Processamento Inteligente de Documentos (IDP)?
O Processamento Inteligente de Documentos (IDP) usa OCR como sua tecnologia fundamental para extrair estrutura, relacionamentos, valores-chave, entidades e outros insights centrados em documentos com um serviço avançado de IA baseado em aprendizado de máquina, como o Document Intelligence. O Document Intelligence inclui uma versão otimizada para documentos do Read como seu mecanismo de OCR enquanto delega a outros modelos para obter insights mais avançados. Se estiver a extrair texto de documentos digitalizados e digitais, use Document Intelligence Read OCR.
Como usar OCR
Experimente o OCR usando o Vision Studio. Em seguida, siga um dos links para a edição Read que melhor atende às suas necessidades.
Idiomas suportados por OCR
Ambas as versões Read disponíveis atualmente no Azure Vision suportam várias línguas para texto impresso e manuscrito. O OCR para texto impresso suporta inglês, francês, alemão, italiano, português, espanhol, chinês, japonês, coreano, russo, árabe, hindi e outros idiomas internacionais que usam scripts latinos, cirílicos, árabes e devanágaros. OCR para texto manuscrito suporta inglês, chinês simplificado, francês, alemão, italiano, japonês, coreano, português e espanhol.
Consulte a lista completa de idiomas suportados por OCR.
Características comuns do OCR
O modelo Read OCR está disponível no Azure Vision e no Document Intelligence com capacidades comuns de referência, otimizando para os respetivos cenários. A lista a seguir resume as funcionalidades comuns:
- Extração de texto impresso e manuscrito em idiomas suportados
- Páginas, linhas de texto e palavras com pontuações de localização e confiança
- Suporte para idiomas mistos, modo misto (impresso e manuscrito)
- Disponível como contêiner Distroless Docker para implantação local
Utilize as APIs de nuvem OCR ou implemente nas instalações locais
A maioria dos clientes prefere as APIs na nuvem porque são fáceis de integrar e oferecem produtividade rápida pronta para uso. A Azure e o serviço Azure Vision tratam das necessidades de escala, desempenho, segurança de dados e conformidade, enquanto você se concentra em satisfazer as necessidades dos seus clientes.
Para implementação local, o contentor Read Docker permite-lhe implementar as capacidades OCR geralmente disponíveis do Azure Vision v3.2 no seu próprio ambiente local. Os contentores são ótimos para requisitos específicos de governação de dados e segurança.
Requisitos de entrada
A API de leitura usa imagens e documentos como entrada. As imagens e documentos devem atender aos seguintes requisitos:
- Os formatos de ficheiro suportados são JPEG, PNG, BMP, PDF e TIFF.
- Para arquivos PDF e TIFF, até 2.000 páginas são processadas (apenas as duas primeiras páginas para o nível gratuito).
- O tamanho do arquivo das imagens deve ser inferior a 500 MB (4 MB para o nível gratuito) com dimensões de pelo menos 50 x 50 pixels e no máximo 10.000 x 10.000 pixels. Os ficheiros PDF não têm limite de tamanho.
- A altura mínima do texto a ser extraído é de 12 pixels para uma imagem de 1024 x 768, o que corresponde a um texto de fonte de cerca de 8 pontos a 150 DPI.
Nota
Não é necessário cortar uma imagem para linhas de texto. Envie a imagem completa para a API de leitura e ela reconhece todos os textos.
Privacidade e segurança de dados OCR
Tal como em todas as Foundry Tools, os programadores que utilizam o serviço Azure Vision devem estar atentos às políticas da Microsoft relativamente aos dados dos clientes. Consulte a página Foundry Tools no Microsoft Trust Center para saber mais.
Próximos passos
- Para OCR com imagens gerais (não documentais), experimente o início rápido da API REST da Análise de Imagens do Azure Vision 4.0.
- Para OCR com documentos PDF, Office e HTML, bem como imagens de documentos, comece com Document Intelligence Read.
- Para a versão anterior do GA, consulte o SDK do Azure Vision 3.2 GA ou os quickstarts da API REST.