Compartilhar via


BinaryQuantizationCompression interface

Contém opções de configuração específicas para o método de compactação de quantização binária usado durante a indexação e a consulta.

Extends

Propriedades

kind

Discriminatório polimórfico, que especifica os diferentes tipos que esse objeto pode ser

Propriedades herdadas

compressionName

O nome a ser associado a essa configuração específica.

defaultOversampling

Fator de sobrecarga padrão. A sobrecarga solicitará internamente mais documentos (especificados por esse multiplicador) na pesquisa inicial. Isso aumenta o conjunto de resultados que serão reclassificados usando pontuações de similaridade recomputadas de vetores de precisão total. O valor mínimo é 1, o que significa que não há sobrecarga (1x). Esse parâmetro só pode ser definido quando rerankWithOriginalVectors for true. Valores mais altos melhoram o recall em detrimento da latência.

rerankWithOriginalVectors

Se definido como true, depois que o conjunto ordenado de resultados calculado usando vetores compactados for obtido, eles serão reclassificados novamente recalculando as pontuações de similaridade de precisão total. Isso melhorará o recall em detrimento da latência.

rescoringOptions

Contém as opções de recortação.

truncationDimension

O número de dimensões para as qual truncar os vetores. Truncar os vetores reduz o tamanho dos vetores e a quantidade de dados que precisam ser transferidos durante a pesquisa. Isso pode economizar o custo de armazenamento e melhorar o desempenho da pesquisa em detrimento do recall. Ele deve ser usado apenas para inserções treinadas com o MRL (Matryoshka Representation Learning), como OpenAI text-embedding-3-large (pequeno). O valor padrão é nulo, o que significa que não há truncamento.

Detalhes da propriedade

kind

Discriminatório polimórfico, que especifica os diferentes tipos que esse objeto pode ser

kind: "binaryQuantization"

Valor da propriedade

"binaryQuantization"

Detalhes das propriedades herdadas

compressionName

O nome a ser associado a essa configuração específica.

compressionName: string

Valor da propriedade

string

Herdado deVectorSearchCompression.compressionName

defaultOversampling

Fator de sobrecarga padrão. A sobrecarga solicitará internamente mais documentos (especificados por esse multiplicador) na pesquisa inicial. Isso aumenta o conjunto de resultados que serão reclassificados usando pontuações de similaridade recomputadas de vetores de precisão total. O valor mínimo é 1, o que significa que não há sobrecarga (1x). Esse parâmetro só pode ser definido quando rerankWithOriginalVectors for true. Valores mais altos melhoram o recall em detrimento da latência.

defaultOversampling?: number

Valor da propriedade

number

Herdado deVectorSearchCompression.defaultOversampling

rerankWithOriginalVectors

Se definido como true, depois que o conjunto ordenado de resultados calculado usando vetores compactados for obtido, eles serão reclassificados novamente recalculando as pontuações de similaridade de precisão total. Isso melhorará o recall em detrimento da latência.

rerankWithOriginalVectors?: boolean

Valor da propriedade

boolean

Herdado deVectorSearchCompression.rerankWithOriginalVectors

rescoringOptions

Contém as opções de recortação.

rescoringOptions?: RescoringOptions

Valor da propriedade

Herdado deVectorSearchCompression.rescoringOptions

truncationDimension

O número de dimensões para as qual truncar os vetores. Truncar os vetores reduz o tamanho dos vetores e a quantidade de dados que precisam ser transferidos durante a pesquisa. Isso pode economizar o custo de armazenamento e melhorar o desempenho da pesquisa em detrimento do recall. Ele deve ser usado apenas para inserções treinadas com o MRL (Matryoshka Representation Learning), como OpenAI text-embedding-3-large (pequeno). O valor padrão é nulo, o que significa que não há truncamento.

truncationDimension?: number

Valor da propriedade

number

Herdado deVectorSearchCompression.truncationDimension