Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Os armazenamentos vetoriais são usados em inúmeros domínios e situações em IA analítica e generativa, incluindo processamento de linguagem natural, reconhecimento de vídeo e imagem, sistemas de recomendação e pesquisa.
O que é um repositório vetorial?
Um armazenamento vetorial (também chamado de base de dados vetorial) é uma base de dados que armazena e gere embeddings vetoriais. Os embeddings vetoriais são representações matemáticas de dados num espaço de alta dimensão.
Neste espaço, cada dimensão corresponde a uma característica dos dados. Dezenas de milhares de dimensões podem ser usadas para representar dados sofisticados. A posição de um vetor neste espaço representa suas características. Palavras, frases, documentos inteiros, imagens, áudio e outros tipos de dados podem todos ser vetorizados.
Como funciona uma loja vetorial?
Numa loja vetorial, utiliza-se algoritmos de pesquisa vetorial para indexar e consultar embeddings. Algoritmos de pesquisa vetorial bem conhecidos incluem Disk Approximate Nearest Neighbor (DiskANN),Hierarchical Navigable Small World (HNSW) e Inverted File with Flat Compression (IVFFlat).
A pesquisa vetorial é um método que ajuda você a encontrar itens semelhantes com base em suas características de dados, em vez de correspondências exatas em um campo de propriedade. Esta técnica é útil em aplicações como procurar texto semelhante, encontrar imagens relacionadas, fazer recomendações ou até mesmo detetar anomalias.
A pesquisa vetorial é usada para consultar os embeddings vetoriais dos seus dados que criou usando um modelo de aprendizagem automática, através de uma API de embeddings. Exemplos de APIs de embeddings são Azure OpenAI Embeddings e Hugging Face no Azure.
A pesquisa vetorial mede a distância entre os vetores de dados e o vetor de consulta. Os vetores de dados mais próximos do seu vetor de consulta são os mais semelhantes semanticamente.
Quando usas o Azure Database para PostgreSQL como um vetor store, podes armazenar, indexar e consultar embeddings juntamente com os dados originais. Esta abordagem elimina o custo adicional de replicar dados numa base de dados vetorial separada e pura.
Esta arquitetura também mantém os embeddings vetoriais e os dados originais juntos. Manter os embeddings e os dados juntos facilita melhor as operações multimodais de dados. Também permite maior consistência, escala e desempenho dos dados.