MicrosoftLanguageStemmingTokenizer interface

Pacote:: @azure/search-documents

Divide o texto usando regras específicas do idioma e reduz as palavras aos formulários base.

Extends: BaseLexicalTokenizer

Propriedades

isSearchTokenizer	Um valor que indica como o tokenizador é usado. Defina como true se usado como o tokenizador de pesquisa, definido como false se usado como o tokenizador de indexação. O padrão é false.
language	O idioma a ser usado. O padrão é inglês.
maxTokenLength	O comprimento máximo do token. Tokens maiores que o tamanho máximo são divididos. O comprimento máximo do token que pode ser usado é de 300 caracteres. Tokens com mais de 300 caracteres são divididos primeiro em tokens de comprimento 300 e, em seguida, cada um desses tokens é dividido com base no conjunto de comprimento máximo do token. O padrão é 255.
odatatype	Discriminatório polimórfico, que especifica os diferentes tipos que esse objeto pode ser

Propriedades herdadas

name	O nome do tokenizador. Ele deve conter apenas letras, dígitos, espaços, traços ou sublinhados, só pode iniciar e terminar com caracteres alfanuméricos e é limitado a 128 caracteres.

Detalhes da propriedade

isSearchTokenizer

Um valor que indica como o tokenizador é usado. Defina como true se usado como o tokenizador de pesquisa, definido como false se usado como o tokenizador de indexação. O padrão é false.

isSearchTokenizer?: boolean

Valor da propriedade

boolean

language

O idioma a ser usado. O padrão é inglês.

language?: MicrosoftStemmingTokenizerLanguage

Valor da propriedade

MicrosoftStemmingTokenizerLanguage

maxTokenLength

O comprimento máximo do token. Tokens maiores que o tamanho máximo são divididos. O comprimento máximo do token que pode ser usado é de 300 caracteres. Tokens com mais de 300 caracteres são divididos primeiro em tokens de comprimento 300 e, em seguida, cada um desses tokens é dividido com base no conjunto de comprimento máximo do token. O padrão é 255.

maxTokenLength?: number

Valor da propriedade

number

odatatype

Discriminatório polimórfico, que especifica os diferentes tipos que esse objeto pode ser

odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"

Valor da propriedade

"#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"

Detalhes das propriedades herdadas

name

O nome do tokenizador. Ele deve conter apenas letras, dígitos, espaços, traços ou sublinhados, só pode iniciar e terminar com caracteres alfanuméricos e é limitado a 128 caracteres.

name: string

Valor da propriedade

string

Herdado deLexicalTokenizer.name

Compartilhar via

MicrosoftLanguageStemmingTokenizer interface

Propriedades

Propriedades herdadas

Detalhes da propriedade

isSearchTokenizer

Valor da propriedade

language

Valor da propriedade

maxTokenLength

Valor da propriedade

odatatype

Valor da propriedade

Detalhes das propriedades herdadas

name

Valor da propriedade