Tarefa Permanente para agentes de IA

Agentes de IA que funcionam durante horas, apelam a ferramentas externas e têm de sobreviver a falhas de infraestrutura precisam de uma execução duradoura — a capacidade de verificar automaticamente o progresso e retomar de onde ficaram. O Durable Task Scheduler e o modelo de programação Durable Task disponibilizam esta infraestrutura, gerindo a gestão de estados, checkpoints e coordenação distribuída para que o seu código de agente não tenha de o fazer.

Com este modelo de programação, constróis fluxos de trabalho agentivos resilientes e com estado usando construtos de programação padrão (ciclos, condicionais, gestão de erros) em .NET, Python, Java e JavaScript/TypeScript. O ambiente de execução persiste o estado e recupera-se automaticamente das falhas.

O Durable Task não é um framework de agentes — funciona com qualquer framework de agentes de IA, incluindo Microsoft Agent Framework, LangChain ou chamadas diretas à API de LLM. Concentras-te na lógica dos agentes; A Durable Task gere uma execução fiável em larga escala.

Neste artigo, você aprende sobre:

  • Desafios na produção que a execução sustentável resolve para agentes de IA
  • Padrões de fluxo de trabalho agêntico suportados pelo modelo de programação do Durable Task
  • Como a stack tecnológica Durable Task se compara com outras opções de workflow agentic no Azure

Sugestão

Pronto para começar a construir? Salta para Agentic application patterns para exemplos de código, ou experimenta a extensão Durable Task para Microsoft Agent Framework para uma integração turnkey.

Desafios de produção que a execução duradoura resolve

Os agentes de IA em produção enfrentam vários desafios que a execução duradoura resolve:

  • Sessões longas e com estado — Interações humanas no ciclo, raciocínio em múltiplos passos e fluxos de trabalho aumentados por ferramentas podem manter um agente ativo durante horas, dias ou semanas. O agente acumula estados (histórico de conversas, resultados intermédios, decisões pendentes) que devem ser preservados em cada etapa.
  • Consumo caro de tokens — Processar grandes volumes de tokens LLM é dispendioso e demorado. Os limites de taxa podem limitar o seu agente a meio do fluxo de trabalho. Se ocorrer uma falha a meio do processo, os tokens já consumidos e o tempo já gasto são perdidos.
  • Interrupções de infraestrutura — Reinicios de computação, implementações, eventos de escalonamento e falhas transitórias podem fazer uma sessão do agente falhar. Sem recuperação, o agente tem de reiniciar do início, reconsumindo todos os tokens previamente gastos e repetindo todo o trabalho concluído.

A execução duradoura resolve estes desafios:

  • Checkpointing automático — O tempo de execução do Durable Task verifica cada transição de estado (respostas do LLM, resultados de chamadas de ferramenta, decisões de fluxo de controlo) para armazenamento durável.
  • Retomar a partir do último checkpoint — Quando ocorre uma falha, a execução recomeça automaticamente numa VM saudável. As chamadas LLM concluídas não são repetidas, preservando tanto o gasto de tokens como o tempo de relógio de parede.
  • Tentativas incorporadas — Políticas de tentativas configuráveis com backoff lidam com falhas transitórias de APIs LLM, ferramentas externas e serviços a jusante sem necessidade de código adicional.

Padrões de fluxo de trabalho agentivos

A Durable Task suporta uma variedade de padrões de fluxo de trabalho agentivos que se enquadram em duas grandes categorias:

  • Fluxos de trabalho determinísticos: O seu código define o fluxo de controlo. Escreve-se a sequência de passos — incluindo ramificação, paralelismo e tratamento de erros — usando construtos de programação padrão. O LLM é chamado como um passo dentro do fluxo de trabalho, mas não controla o fluxo global.
  • Fluxos de trabalho dirigidos por agentes (circuitos de agentes): O LLM gere o fluxo de controlo. O agente decide que ferramentas chamar, em que ordem e quando a tarefa está concluída. Forneces ferramentas e instruções, mas o agente determina o caminho de execução em tempo de execução.

Ambas as categorias beneficiam de uma execução duradoura e podem ser combinadas na mesma aplicação. Para uma análise detalhada dos padrões suportados com exemplos de código, veja Padrões de aplicação agente.

Compare opções de fluxo de trabalho agentic no Azure

Existem várias opções para construir fluxos de trabalho agentivos no Azure, além do stack tecnológico Durable Task. Cada opção tem diferentes pontos fortes e compromissos, dependendo das suas necessidades de fluxo de controlo, suporte a linguagens de programação, integração de frameworks de IA, alojamento, gestão de estados e público-alvo. A tabela seguinte ajuda-o a decidir qual se adequa às suas necessidades.

Capacidade Tarefa durável Fluxos de trabalho do Agent Framework Loop do agente do Logic Apps
Fluxo de controlo Imperativo (definido por código) Baseado em grafos (definido por código) Declarativo (designer / JSON)
Idiomas .NET, Python, Java, TypeScript/JS .NET, Python Visual designer / JSON
Suporte a frameworks de IA Any (Kernel Semântico, LangChain, AutoGen, API direta) Otimizado para Agent Framework Conectores de IA integrados
Hospedagem Funções do Azure ou qualquer outro host Qualquer; Agentes Alojados da Fundição de primeira classe Serviço gerido do Logic Apps
Armazenamento de estado Planeador de Tarefas Duráveis (gerido) Traga o seu gestor de pontos de controlo Tempo de execução do Logic Apps (gerido)
Fluxos de trabalho dirigidos por agentes Constrói o teu próprio, ou usa a extensão Tarefa Durável Built-in Ação do Agente Loop
Público-alvo Desenvolvedores de backend Programadores de aplicações Integração / utilizadores de low-code
Tarefas de execução prolongada Primeira classe (horas até à eternidade) Através de checkpointing controlado pelos programadores Apenas fluxos de trabalho com estado (até 90 dias)
Recuperação de falhas Automático Manual Automático
Observabilidade Painel de controlo do escalonador, OpenTelemetry OpenTelemetry, visualização personalizada Azure Monitor, diagnóstico de Logic Apps

Passos seguintes