Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Importante
Traduções não em inglês são fornecidas apenas para conveniência. Consulte a EN-US versão deste documento para obter a versão definitiva.
O que é uma nota de transparência?
Importante
Este artigo pressupõe que você esteja familiarizado com as diretrizes e as práticas recomendadas para o Azure Language in Foundry Tools. Para mais informações, consulte a nota de Transparência para Idioma.
Um sistema de IA inclui não apenas a tecnologia, mas também as pessoas que a usarão, que serão afetadas por ele e o ambiente em que ele é implantado. Criar um sistema adequado para sua finalidade pretendida requer uma compreensão de como a tecnologia funciona, suas funcionalidades e limitações e como obter o melhor desempenho. As Notas de Transparência da Microsoft têm como objetivo ajudar você a entender como nossa tecnologia de IA funciona, as escolhas que os proprietários do sistema podem fazer para influenciar o desempenho e o comportamento do sistema e a importância de pensar em todo o sistema, incluindo a tecnologia, as pessoas e o ambiente. Você pode usar as Notas de Transparência ao desenvolver ou implantar seu próprio sistema, ou compartilhá-las com as pessoas que usarão ou serão afetadas por seu sistema.
As notas de transparência da Microsoft fazem parte de um esforço mais amplo da Microsoft para colocar nossos princípios de IA em prática. Para saber mais, consulte os princípios de IA responsável da Microsoft.
Introdução à detecção de idioma
O recurso de detecção de idiomas detecta o idioma em que um texto de entrada é escrito e relata um único código de idioma para cada documento enviado na solicitação em uma ampla gama de idiomas, variantes, dialetos e algumas linguagens regionais/culturais. O código de idioma é emparelhado com uma pontuação de confiança.
Verifique a lista de idiomas com suporte para garantir que os idiomas necessários sejam compatíveis.
Exemplos de casos de uso
A detecção de idioma é usada em vários cenários em vários setores. Alguns exemplos incluem:
Pré-processamento de texto de outros recursos de linguagem. Outros recursos de linguagem exigem que um código de idioma seja enviado na solicitação para identificar o idioma de origem. Se você não souber o idioma de origem do seu texto, poderá usar a detecção de idioma como um pré-processador para obter o código de idioma.
Detectar idiomas para fluxo de trabalho de negócios. Por exemplo, se uma empresa receber emails em vários idiomas de clientes, ela poderá usar a detecção de idiomas para rotear os emails por idioma para falantes nativos que possam se comunicar melhor com esses clientes.
Considerações ao escolher um caso de uso
Não usar
- Não use ações automáticas sem intervenção humana para cenários de alto risco. Uma pessoa deve sempre examinar os dados de origem quando a situação econômica, a saúde ou a segurança de outra pessoa for afetada.
Considerações legais e regulatórias: as organizações precisam avaliar possíveis obrigações legais e regulatórias específicas ao usar quaisquer Ferramentas e soluções do Foundry, que podem não ser apropriadas para uso em todos os setores ou cenários. Além disso, as ferramentas ou soluções do Foundry não são projetadas e podem não ser usadas de maneiras proibidas em termos de serviço aplicáveis e códigos de conduta relevantes.
Características e limitações
Dependendo do cenário e dos dados de entrada, você pode experimentar diferentes níveis de desempenho. As informações a seguir foram projetadas para ajudá-lo a entender os principais conceitos sobre o desempenho conforme se aplicam ao uso da detecção de idioma do Language.
Limitações do sistema e práticas recomendadas para melhorar o desempenho
- Para entradas que incluem conteúdo de idioma misto , apenas um único idioma é retornado. Em geral, o idioma com a maior representação no conteúdo é retornado, mas com uma pontuação de confiança menor.
- O serviço ainda não dá suporte às versões romanizadas de todos os idiomas que não usam o script latino. Por exemplo, o Pinyin não tem suporte para chinês e não há suporte para Franco-Arabic para árabe.
- Algumas palavras existem em vários idiomas. Por exemplo, "impossível" é comum ao inglês e ao francês. Para exemplos curtos que incluem palavras ambíguas, talvez você não obtenha o idioma correto.
- Se você tiver alguma ideia sobre o país ou a região de origem do texto e encontrar idiomas mistos, poderá usar o
countryHintparâmetro para passar um código de país/região de 2 letras. - Em geral, as entradas mais longas são mais propensas a serem reconhecidas corretamente. Frases ou frases completas são mais propensas a serem reconhecidas corretamente do que palavras simples ou fragmentos de frase.
- Nem todos os idiomas serão reconhecidos. Verifique a lista de idiomas e scripts com suporte.
- Para distinguir entre vários scripts usados para escrever determinadas linguagens, como o Cazaque, o recurso de detecção de idioma retorna um nome de script e um código de script de acordo com o padrão ISO 15924 para um conjunto limitado de scripts.
- O serviço dá suporte à detecção de idioma de texto somente se ele estiver no script nativo. Por exemplo, o Pinyin não tem suporte para chinês e não há suporte para Franco-Arabic para árabe.
- Devido a lacunas desconhecidas em nossos dados de treinamento, determinados dialetos e variedades de idiomas menos representados nos dados da Web podem não ser reconhecidos corretamente.
Consulte também
- Nota de transparência sobre Idioma
- Nota de transparência para reconhecimento de entidade nomeada e informações de identificação pessoal
- Nota de transparência para Saúde
- Nota de transparência para extração de frases-chave
- Nota de transparência para resposta a perguntas
- Nota de transparência para sumarização
- Nota de transparência para Análise de Sentimento
- Privacidade e segurança de dados para idioma
- Diretrizes para integração e uso responsável com o Idioma