MicrosoftLanguageStemmingTokenizer interface
Divide o texto usando regras específicas do idioma e reduz as palavras aos formulários base.
- Extends
Propriedades
| is |
Um valor que indica como o tokenizador é usado. Defina como true se usado como o tokenizador de pesquisa, definido como false se usado como o tokenizador de indexação. O padrão é false. |
| language | O idioma a ser usado. O padrão é inglês. |
| max |
O comprimento máximo do token. Tokens maiores que o tamanho máximo são divididos. O comprimento máximo do token que pode ser usado é de 300 caracteres. Tokens com mais de 300 caracteres são divididos primeiro em tokens de comprimento 300 e, em seguida, cada um desses tokens é dividido com base no conjunto de comprimento máximo do token. O padrão é 255. |
| odatatype | Discriminatório polimórfico, que especifica os diferentes tipos que esse objeto pode ser |
Propriedades herdadas
| name | O nome do tokenizador. Ele deve conter apenas letras, dígitos, espaços, traços ou sublinhados, só pode iniciar e terminar com caracteres alfanuméricos e é limitado a 128 caracteres. |
Detalhes da propriedade
isSearchTokenizer
Um valor que indica como o tokenizador é usado. Defina como true se usado como o tokenizador de pesquisa, definido como false se usado como o tokenizador de indexação. O padrão é false.
isSearchTokenizer?: boolean
Valor da propriedade
boolean
language
O idioma a ser usado. O padrão é inglês.
language?: MicrosoftStemmingTokenizerLanguage
Valor da propriedade
maxTokenLength
O comprimento máximo do token. Tokens maiores que o tamanho máximo são divididos. O comprimento máximo do token que pode ser usado é de 300 caracteres. Tokens com mais de 300 caracteres são divididos primeiro em tokens de comprimento 300 e, em seguida, cada um desses tokens é dividido com base no conjunto de comprimento máximo do token. O padrão é 255.
maxTokenLength?: number
Valor da propriedade
number
odatatype
Discriminatório polimórfico, que especifica os diferentes tipos que esse objeto pode ser
odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"
Valor da propriedade
"#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"
Detalhes das propriedades herdadas
name
O nome do tokenizador. Ele deve conter apenas letras, dígitos, espaços, traços ou sublinhados, só pode iniciar e terminar com caracteres alfanuméricos e é limitado a 128 caracteres.
name: string
Valor da propriedade
string
Herdado deLexicalTokenizer.name