Política de manutenção de modelos de IA generativa

Esta página descreve a política de manutenção do modelo para as ofertas de pagamento por token das APIs do Modelo Fundação, débito provisionado das APIs do Modelo Fundação, Inferência em Batch com ai_query, e ofertas de ajuste fino do Modelo Fundação .

Para continuar a suportar os modelos mais avançados, a Databricks gere modelos ao longo de um ciclo de vida que vai da atualização à descontinuação e à eventual reforma.

  • Atualização: O Databricks aplica atualizações incrementais a um modelo para garantir otimizações. Ver atualizações de modelos.
  • Obsoleto: Um modelo obsoleto já não é recomendado para novas cargas de trabalho, mas continua disponível em espaços de trabalho com utilização existente do modelo. Os espaços de trabalho que não estão a usar o modelo no momento da descontinuação já não têm acesso a ele.
  • Retirada: Um modelo retirado já não está acessível e o suporte para o modelo está totalmente descontinuado. Qualquer carga de trabalho que use o modelo deixa de funcionar.

Política de despreciação de modelos

Quando a Databricks desvaloriza um modelo, esse modelo deixa de ser recomendado e está planeado para a sua reforma. A Databricks anuncia as datas de aposentação para modelos obsoletos, com os prazos de notificação resumidos nas secções seguintes. As datas de reforma podem ser anunciadas no momento da depreciação ou numa data posterior. Após a data de reforma, o modelo deixa de estar acessível e qualquer carga de trabalho que o utilize deixa de funcionar.

Para modelos obsoletos e retirados e as datas anunciadas de retirada, veja Modelos descontinuados e retirados. Para modelos de parceiros, veja Política de reforma de modelo de sócios.

Importante

As políticas de descontinuação que se aplicam às ofertas de pagamento por token e de ajuste fino do Foundation Model APIs afetam apenas os modelos de chat e conclusão suportados.

APIs do modelo de base

A tabela seguinte resume a política de descontinuação para as APIs do Modelo Foundation pay-per-token, o débito provisionado das APIs do Modelo Foundation e a Inferência em Batch com ai_query ofertas.

Notificação de descontinuação Transição para a reforma Na data da aposentadoria
A Databricks segue os seguintes passos para notificar os clientes sobre a desvalorização de um modelo:
  • Na interface do Databricks, uma mensagem de aviso indica que o modelo está obsoleto.
  • A documentação aplicável contém um aviso que indica que o modelo está obsoleto, juntamente com uma data de reforma, caso tenha sido anunciada.
Após desvalorizar um modelo, a Databricks anuncia uma data de reforma daqui a três meses ou mais. Durante este período de transição:
  • O modelo permanece disponível apenas para espaços de trabalho com cargas de trabalho existentes que o utilizam, até à data de reforma anunciada.
  • O modelo obsoleto não é acessível a partir de espaços de trabalho que não o utilizavam ativamente no momento da descontinuação.
  • Os clientes com cargas de trabalho já existentes devem migrar para o modelo de substituição recomendado ou para cargas de trabalho afetadas pelo pôr de extinção.
O modelo já não está disponível para uso e é removido do produto. Quaisquer cargas de trabalho existentes que usem o modelo deixam de funcionar. A documentação aplicável é atualizada para indicar que o modelo já não está disponível e para recomendar um modelo de substituição.

Modelo de apólice de reforma para parceiros

Os modelos parceiros são modelos que parceiros terceiros — especificamente OpenAI, Anthropic e Google — fornecem através das APIs do Modelo Fundação. Para estes modelos parceiros, os Databricks geralmente seguem os mesmos prazos de descontinuação e políticas descritos acima.

No entanto, os parceiros podem fornecer datas de reforma mais curtas do que o período de transição de três meses que a Databricks publica. Nestes casos, o Databricks tenta colmatar a lacuna redirecionando temporariamente modelos para uma versão semelhante, para que os clientes recebam o tempo completo de transição.

Por exemplo, se a reforma de um modelo parceiro for anunciada com um prazo de espera de um mês em vez de três, o Databricks redireciona o modelo por mais dois meses para evitar falhas imediatas e permitir tempo para migração. As consultas falham no final do período completo de três meses.

Note

Este redirecionamento só pode ocorrer se o modelo de substituição tiver o mesmo preço e for compatível com versões anteriores. O modelo de substituição é geralmente uma versão incremental, como a versão 3.0 versus a 3.1.

Afinação de modelo base

A tabela seguinte resume a política de depreciação para o ajuste fino do Modelo de Fundação.

Notificação de descontinuação Transição para a reforma Na data da aposentadoria
A Databricks segue os seguintes passos para notificar os clientes sobre a desvalorização de um modelo:
  • No separador Experimentos , aparece uma mensagem de aviso no menu suspenso para o ajuste fino do Modelo Foundation que indica que o modelo está obsoleto.
  • A documentação aplicável contém um aviso que indica que o modelo está obsoleto, juntamente com uma data de reforma, caso tenha sido anunciada.
Após desvalorizar um modelo, a Databricks anuncia uma data de reforma daqui a três meses ou mais. Durante este período de transição, os clientes devem migrar as suas cargas de trabalho para um modelo de substituição recomendado ou eliminar o endpoint afetado. O modelo já não está disponível para uso e é removido do produto. A documentação aplicável é atualizada para recomendar o uso de um modelo de substituição.

Atualizações de modelo

Os Databricks podem enviar atualizações incrementais do modelo para garantir otimizações. Quando o Databricks atualiza um modelo, a URL do endpoint mantém-se a mesma, mas o ID do modelo no objeto resposta muda para refletir a data da atualização. Por exemplo, se o Databricks enviar uma atualização para meta-llama/Meta-Llama-3.3-70B a data de 04/03/2024, o nome do modelo no objeto resposta atualiza-se para meta-llama/Meta-Llama-3.3-70B-030424. O Databricks mantém um histórico de versões das atualizações. Contacte a sua equipa de contas Databricks para mais detalhes.

Modelos obsoletos e retirados

As secções seguintes listam modelos que estão obsoletos (já não recomendados para novas cargas de trabalho) ou retirados (no fim da vida útil e já não disponíveis). As datas de retirada dos modelos obsoletos são anunciadas pelo menos três meses antes.

Aposentamentos das APIs do Foundation Model

A tabela seguinte mostra as desativações dos modelos, as suas datas de aposentação e modelos de substituição recomendados para usar nas APIs do Foundation Model, pay-per-token e throughput provisionado, servindo cargas de trabalho. A Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de aposentadoria indicada.

Note

Os modelos OpenAI e Google Gemini estão disponíveis apenas através dos Serviços ADI, fornecidos pela Databricks.

Modelo de parceiro Data da reforma Modelo de substituição recomendado
OpenAI GPT-5.1 Codex Max Pagamento por ficha: 16 de julho de 2026 OpenAI GPT-5.5
OpenAI GPT-5.1 Codex Mini Pagamento por ficha: 16 de julho de 2026 Códice OpenAI GPT-5.4 Mini
Códice OpenAI GPT-5.2 Pagamento por ficha: 16 de julho de 2026 OpenAI GPT-5.5
Antrópico Claude 3.7 Soneto Pagamento por ficha: 12 de abril de 2026 Utilize o modelo mais recente Claude Sonnet
Gemini 3 Pro Débito provisionado: 26 de março de 2026 Gemini 3.1 Pro. Para permitir mais tempo de migração, entre 26 de março de 2026 e 7 de junho de 2026, as chamadas API para o Gemini 3 Pro serão temporariamente redirecionadas para o Gemini 3.1 Pro. O preço de ambos os modelos é idêntico.
Modelo aberto Data da reforma Modelo de substituição recomendado
Meta Llama 3,1 405B Pagamento por ficha: 15 de fevereiro de 2026
Débito provisionado: 15 de maio de 2026
OpenAI GPT OSS 120B
DBRX / DBRX Instrução Pagamento por ficha: 30 de abril de 2025
Débito provisionado: 19 de dezembro de 2025
Pagamento por ficha: Meta-Llama-4-Maverick
Débito provisionado: Modelo comparável na mesma oferta, como modelos Llama 3.2, 3.3 ou 4 de tamanho semelhante.
Mixtral 8x7B / Mixtral-8x7B Instruir Pagamento por ficha: 30 de abril de 2025
Débito provisionado: 27 de fevereiro de 2026
Pagamento por ficha: Meta-Llama-4-Maverick
Débito provisionado: Modelo comparável na mesma oferta, como modelos Llama 3.2, 3.3 ou 4 de tamanho semelhante.
Meta Llama 3 (70B) Pagamento por ficha: 23 de julho de 2024 (Meta-Llama-3-70B-Instruct); 11 de dezembro de 2024 (Meta-Llama-3.1-70B-Instruct)
Débito provisionado: 27 de fevereiro de 2026
Pagamento por ficha: Meta-Llama-4-Maverick
Débito provisionado: Modelo comparável na mesma oferta, como modelos Llama 3.2, 3.3 ou 4 de tamanho semelhante.
Meta Llama 3 8B Débito provisionado: 27 de fevereiro de 2026 Modelos comparáveis na mesma oferta, como o Llama 3.2, 3.3 ou 4 de tamanho semelhante.
Meta Llama 2 70B / Meta-Llama-2-70B-Chat Pagamento por ficha: 30 de outubro de 2024
Débito provisionado: 27 de fevereiro de 2026
Pagamento por ficha: Meta-Llama-4-Maverick
Débito provisionado: Modelo comparável na mesma oferta, como modelos Llama 3.2, 3.3 ou 4 de tamanho semelhante.
Meta Llama 2 13B Débito provisionado: 27 de fevereiro de 2026 Modelos comparáveis na mesma oferta, como o Llama 3.2, 3.3 ou 4 de tamanho semelhante.
Meta LLaMA 2 7B Débito provisionado: 27 de fevereiro de 2026 Modelos comparáveis na mesma oferta, como o Llama 3.2, 3.3 ou 4 de tamanho semelhante.
Mistral 7B Débito provisionado: 27 de fevereiro de 2026 Modelos comparáveis na mesma oferta, como o Llama 3.2, 3.3 ou 4 de tamanho semelhante.
MPT 30B / MPT 30B Instrução Pagamento por ficha: 30 de agosto de 2024
Débito provisionado: 19 de dezembro de 2025
Pagamento por ficha: Meta-Llama-4-Maverick
Débito provisionado: Modelo comparável na mesma oferta, como modelos Llama 3.2, 3.3 ou 4 de tamanho semelhante.
MPT 7B / MPT 7B Instrução Pagamento por ficha: 30 de agosto de 2024
Débito provisionado: 19 de dezembro de 2025
Pagamento por ficha: Meta-Llama-4-Maverick
Débito provisionado: Modelo comparável na mesma oferta, como modelos Llama 3.2, 3.3 ou 4 de tamanho semelhante.

Se precisar de suporte de longo prazo para uma versão específica do modelo, a Databricks recomenda utilizar APIs de Modelo Fundamental com taxa de transferência provisionada para os seus workloads de serviço.

Modelo de Fundação Ajuste fino de aposentadorias

A tabela a seguir mostra famílias modelo aposentadas, suas datas de aposentadoria e famílias de modelos de substituição recomendadas para uso em cargas de trabalho de ajuste fino do Modelo de Base. A Databricks recomenda que você migre seus aplicativos para usar modelos de substituição antes da data de aposentadoria indicada.

Família de modelos Data da reforma Família de modelos de substituição recomendada
DBRX 30 de abril de 2025 Llama-3.1-70B
Mixtral 30 de abril de 2025 Llama-3.1-70B
Mistral 30 de abril de 2025 Llama-3.1-8B
Meta-Lama-3.1-405B Janeiro 30, 2025 Llama-3.1-70B
Meta-Lama-3 Janeiro 7, 2025 Meta-Lama-3,1
Meta-Lama-2 Janeiro 7, 2025 Meta-Lama-3,1
Código Llama Janeiro 7, 2025 Meta-Lama-3,1

Encontre cargas de trabalho que utilizem modelos retirados

Utilize a seguinte consulta para encontrar cargas de trabalho que utilizam modelos obsoletos e identifique os seus proprietários.

SELECT
   eu.requester,
   se.endpoint_name,
   se.entity_name,
   COUNT(*) AS request_count,
   SUM(eu.input_token_count) AS total_input_tokens,
   SUM(eu.output_token_count) AS total_output_tokens,
   MIN(eu.request_time) AS first_request,
   MAX(eu.request_time) AS last_request
 FROM system.serving.endpoint_usage eu
 JOIN system.serving.served_entities se
   ON eu.served_entity_id = se.served_entity_id
 WHERE LOWER(se.entity_name) LIKE '%<retired-model-name>%'
 GROUP BY eu.requester, se.endpoint_name, se.entity_name
 ORDER BY request_count DESC