Partilhar via


Política de manutenção de modelos de IA generativa

Este artigo descreve a política de manutenção de modelo para as ofertas de pagamento por token das APIs do Modelo de Base, taxa de transferência provisionada das APIs do Modelo de Base e ajuste fino do Modelo de Fundação .

Para continuar a oferecer suporte aos modelos mais avançados, a Databricks pode atualizar os modelos suportados ou aposentar modelos mais antigos para essas ofertas.

Modelo de política de aposentadoria

As seções a seguir resumem a política de aposentadoria para as ofertas de recursos indicadas. Consulte Modelos aposentados para obter uma lista de modelos atualmente aposentados e datas de aposentadoria planejadas.

Importante

As políticas de desativação que se aplicam às APIs do Modelo de Fundação pagam por token e às ofertas de ajuste fino do Modelo de Fundação afetam apenas os modelos de bate-papo e conclusão suportados.

APIs de Modelos Fundamentais com pagamento por token

A tabela a seguir resume a política de desativação para o pagamento por token das APIs do Modelo de Base.

Notificação de aposentadoria Transição para a reforma Na data da aposentadoria
O Databricks executa as seguintes etapas para notificar os clientes sobre um modelo definido para desativação:
  • Na página Servindo do seu espaço de trabalho Databricks, uma mensagem de aviso aparece no cartão modelo indicando que o modelo está planejado para a desativação.
  • A documentação aplicável contém um aviso que indica que o modelo está planeado para aposentação e a data a partir da qual não será mais suportado.
A Databricks vai aposentar o modelo em três meses. Durante este período de três meses, os clientes podem:
  • Escolha migrar para um ponto de extremidade de taxa de transferência provisionada de APIs do Modelo de Base para continuar usando o modelo após sua data de fim de vida.
  • Migre fluxos de trabalho existentes para usar modelos de substituição recomendados.
O modelo não está mais disponível para uso e foi removido do produto. A documentação aplicável é atualizada para recomendar o uso de um modelo de substituição.

Capacidade de processamento provisionada das APIs do Modelo Fundamental

A tabela a seguir resume a política de desativação para a taxa de transferência provisionada das APIs do Modelo de Base.

Notificação de aposentadoria Transição para a reforma Na data da aposentadoria
O Databricks executa as seguintes etapas para notificar os clientes sobre um modelo definido para desativação:
  • Para pontos de extremidade que servem um modelo preterido, uma mensagem de aviso aparece na página de detalhes desse ponto de extremidade de serviço em seu espaço de trabalho Databricks. Esta mensagem indica que o modelo está planeado para a reforma e a data de reforma aplicável.
  • Uma mensagem de dica de ferramenta fornece modelos alternativos recomendados para migração de carga de trabalho.
  • A documentação aplicável contém um aviso que indica que o modelo está planeado para aposentação e a data a partir da qual não será mais suportado.
A Databricks vai aposentar o modelo em seis meses. Durante este semestre:
  • Os clientes podem continuar executando pontos de extremidade de taxa de transferência provisionados existentes usando o modelo preterido até a data de desativação.
  • Os clientes que não estão usando ativamente um modelo preterido não podem criar novos pontos de extremidade de taxa de transferência provisionados ou reiniciar pontos de extremidade interrompidos para um modelo preterido.
O modelo não está mais disponível para uso e foi removido do produto.
  • Todos os pontos de extremidade que usam o modelo desativado são transferidos para um estado com falha com uma mensagem descritiva. Quaisquer solicitações para esses pontos de extremidade falharão.
  • O cliente pode excluir pontos de extremidade que usam o modelo desativado, mas não pode reiniciá-los.
  • A documentação aplicável é atualizada para recomendar o uso de um modelo de substituição.

Afinação de modelo base

A tabela a seguir resume a política de aposentadoria para o ajuste fino do modelo de fundação.

Notificação de aposentadoria Transição para a reforma Na data da aposentadoria
O Databricks executa as seguintes etapas para notificar os clientes sobre um modelo definido para desativação:
  • Na guia Experimentos , uma mensagem de aviso aparece no menu suspenso para Ajuste fino do modelo básico que indica que o modelo está planejado para desativação.
  • A documentação aplicável contém um aviso que indica que o modelo está planeado para aposentação e a data a partir da qual não será mais suportado.
A Databricks aposenta o modelo em três meses. Durante esse período de três meses, os clientes podem migrar fluxos de trabalho existentes para usar modelos de substituição recomendados. O modelo não está mais disponível para uso e foi removido do produto. A documentação aplicável é atualizada para recomendar o uso de um modelo de substituição.

Atualizações de modelo

O Databricks pode enviar atualizações incrementais para modelos de pagamento por token para fornecer otimizações. Quando um modelo é atualizado, a URL do ponto de extremidade permanece a mesma, mas a ID do modelo no objeto de resposta é alterada para refletir a data da atualização. Por exemplo, se uma atualização for enviada para meta-llama/Meta-Llama-3.3-70B em 04/03/2024, o nome do modelo no objeto de resposta será atualizado para meta-llama/Meta-Llama-3.3-70B-030424. O Databricks mantém um histórico de versões das atualizações às quais você pode se referir.

Modelos aposentados

As seções a seguir resumem as desativações de modelos atuais e futuras para as ofertas de taxa de transferência provisionada de APIs de Modelo de Base, de pagamento por token de APIs de Modelo de Fundação e de APIs de Modelo de Fundação.

Aposentadorias pagas por token de APIs do Modelo de Base

A tabela a seguir mostra as desativações de modelos, suas datas de desativação e os modelos de substituição recomendados para utilizar em cargas de trabalho de APIs de Modelos Fundamentais com pagamento por utilização. A Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de aposentadoria indicada.

Importante

Em 11 de dezembro de 2024, o Meta-Llama-3.3-70B-Instruct substituiu o suporte ao Meta-Llama-3.1-70B-Instruct nos endpoints pagos por token das APIs do Foundation Model.

Modelo Data da reforma Modelo de substituição recomendado
Meta Llama 3,1 405B Fevereiro 15, 2026 OpenAI GPT OSS 120B
Antrópico Claude 3.7 Soneto 10 de março de 2026 Antrópico Claude Sonnet 4,5
DBRX Instruir 30 de abril de 2025 Meta-Lama-4-Maverick
Instruções Mixtral-8x7B 30 de abril de 2025 Meta-Lama-4-Maverick
Meta-Llama-3.1-70B-Instruct 11 de dezembro de 2024 Meta-Lama-4-Maverick
Meta-Llama-3-70B-Instruct Julho 23, 2024 Meta-Lama-4-Maverick
Meta-Lama-2-70B-Chat 30 de outubro de 2024 Meta-Lama-4-Maverick
MPT 7B Instruir 30 de agosto de 2024 Meta-Lama-4-Maverick
MPT 30B Instruir 30 de agosto de 2024 Meta-Lama-4-Maverick

Se precisar de suporte de longo prazo para uma versão específica do modelo, a Databricks recomenda utilizar APIs de Modelo Fundamental com taxa de transferência provisionada para os seus workloads de serviço.

APIs do modelo de base desativações de taxa de transferência provisionadas

A tabela a seguir mostra as aposentadorias familiares modelo, suas datas de aposentadoria e modelos de substituição recomendados a serem usados para APIs do Modelo de Base que servem cargas de trabalho provisionadas. A Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de aposentadoria indicada.

Família de modelos Data da reforma Modelo de substituição recomendado
Meta Llama 3,1 405B Maio 15, 2026 OpenAI GPT OSS 120B
Meta Lama 3 70B Fevereiro 15, 2026 Modelo comparável na mesma oferta, como Llama 3.2, 3.3 ou 4 modelo de tamanho semelhante.
Meta Lama 3 8B Fevereiro 15, 2026 Modelo comparável na mesma oferta, como Llama 3.2, 3.3 ou 4 modelo de tamanho semelhante.
Meta Lama 2 70B Fevereiro 15, 2026 Modelo comparável na mesma oferta, como Llama 3.2, 3.3 ou 4 modelo de tamanho semelhante.
Meta Lama 2 13B Fevereiro 15, 2026 Modelo comparável na mesma oferta, como Llama 3.2, 3.3 ou 4 modelo de tamanho semelhante.
Meta Lama 2 7B Fevereiro 15, 2026 Modelo comparável na mesma oferta, como Llama 3.2, 3.3 ou 4 modelo de tamanho semelhante.
Mistral 8x7B Fevereiro 15, 2026 Modelo comparável na mesma oferta, como Llama 3.2, 3.3 ou 4 modelo de tamanho semelhante.
Mixtral 7B | Fevereiro 15, 2026 Modelo comparável na mesma oferta, como Llama 3.2, 3.3 ou 4 modelo de tamanho semelhante.
DBRX 19 de dezembro de 2025 Modelo comparável na mesma oferta, como Llama 3.2, 3.3 ou 4 modelo de tamanho semelhante.
MPT 30B | 19 de dezembro de 2025 Modelo comparável na mesma oferta, como Llama 3.2, 3.3 ou 4 modelo de tamanho semelhante.
MPT 7B [en] 19 de dezembro de 2025 Modelo comparável na mesma oferta, como Llama 3.2, 3.3 ou 4 modelo de tamanho semelhante.

Modelo de Fundação Ajuste fino de aposentadorias

A tabela a seguir mostra famílias modelo aposentadas, suas datas de aposentadoria e famílias de modelos de substituição recomendadas para uso em cargas de trabalho de ajuste fino do Modelo de Base. A Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de aposentadoria indicada.

Família de modelos Data da reforma Família de modelos de substituição recomendada
DBRX 30 de abril de 2025 Llama-3.1-70B
Mixtral 30 de abril de 2025 Llama-3.1-70B
Mistral 30 de abril de 2025 Llama-3.1-8B
Meta-Lama-3.1-405B Janeiro 30, 2025 Llama-3.1-70B
Meta-Lama-3 Janeiro 7, 2025 Meta-Lama-3,1
Meta-Lama-2 Janeiro 7, 2025 Meta-Lama-3,1
Código Llama Janeiro 7, 2025 Meta-Lama-3,1