Utilização de um modelo de IA generativa

Concluído

Observação

Consulte a guia Texto e imagens para obter mais detalhes!

A forma mais fácil de interagir com um modelo implementado é usar o parque de jogos de modelos no portal Foundry. Podes usar os Foundry Playgrounds para tentar perguntas, comparar modelos e capturar definições de trabalho antes de escreveres qualquer código.

Captura de ecrã dos parques infantis da Foundry.

Parâmetros de configuração chave

Vários argumentos ou parâmetros do modelo influenciam o comportamento, desempenho e custo em tempo de execução. Nas definições do playground, podes configurar parâmetros como temperatura, tokens máximos de saída e instruções do sistema. Na interface de chat do playground podes enviar prompts e ver as respostas geradas pelo modelo.

  • Temperatura: controla criatividade vs. determinismo.
  • Tokens máximos de saída – limita o comprimento da resposta; afeta o consumo de tokens e o comportamento de limitação.
  • Instruções do sistema – define o comportamento e o papel do modelo.

Ao contrário do prompt do utilizador, que é o pedido ou pergunta do utilizador final (exemplo: Para onde devo viajar?), um prompt do Sistema define comportamento, tom, ferramentas e limites de proteção para o assistente. Um exemplo de prompt do sistema é: "Você é um tutor prestável, que orienta passo a passo. Cite fontes. Recuso aconselhamento médico."

O playground é uma ponte útil entre o Foundry e o código. Depois de testares instruções representativas, podes usar o mesmo sistema e as mesmas instruções de utilizador e valores de parâmetros no teu código. O playground fornece código que pode invocar a sua implementação Foundry através da API Responses, compatível com OpenAI. O código é essencialmente o que está a correr quando usas a interface de chat para configurar definições e enviar avisos de utilizador.

Captura de ecrã do exemplo de código no portal Foundry que está baseado no playground.

Podes usar o código como ponto de partida para criar o teu próprio cliente de chat.

Crie um cliente de chat leve usando o Foundry SDK

Uma aplicação cliente leve é uma aplicação pequena e minimalista cuja função principal é recolher entradas do utilizador, chamar um serviço/API remota e apresentar resultados, sem estruturas de interface pesadas, lógica backend complexa ou grandes dependências locais. Na prática, normalmente:

  • Funciona como uma CLI (interface de linha de comandos), uma pequena utilidade de ambiente de trabalho ou uma página web simples.
  • Mantém o estado e o processamento maioritariamente no servidor (o modelo corre remotamente).
  • Tem uma pegada de código pequena e configuração mínima (muitas vezes apenas variáveis de ambiente + um script curto).
  • É fácil de prototipar, fácil de executar localmente e fácil de estender mais tarde.

Para o Foundry, um cliente de chat leve é frequentemente um ficheiro único Python que se liga a um endpoint de projeto Foundry e envia mensagens de chat para um modelo implementado. O SDK do Foundry expõe um cliente de projeto (operações nativas do Foundry) e um cliente compatível com OpenAI para chamar modelos através da API Responses. A maioria das aplicações usa ambos.

Constrói um cliente de chat em Python

Depois de criares um projeto Foundry e implementares um modelo de chat (por exemplo, gpt-4.1), podes usar o SDK Foundry. No exemplo, a aplicação cliente usa autenticação para se ligar ao endpoint do modelo, enviar um prompt e mostrar a resposta.

# pip install openai>=1.3.0
# pip install azure-ai-projects azure-identity openai

import os
from openai import OpenAI

client = OpenAI(
    base_url=f"{os.environ['AZURE_OPENAI_ENDPOINT']}/openai",
    api_key=os.environ["AZURE_OPENAI_API_KEY"]
)

response = client.responses.create(
    model=os.environ["DEPLOYMENT_NAME"],          # e.g., "gpt-4o-mini"
    input=[{"role": "system", "content": "You're a helpful assistant."},
           {"role": "user", "content": "Summarize the key points from our release notes in 3 bullets."}],
    max_output_tokens=300,
    temperature=0.7
)

print(response.output_text)

Compreender a diferença entre modelos e agentes

No Microsoft Foundry, modelos e agentes de IA generativa estão relacionados, mas servem propósitos diferentes. Pode pensar assim:

  • Modelos = inteligência bruta
  • Agentes = módulos de trabalho embalados, orientados para tarefas, construídos com base nessa inteligência

Quando utiliza um modelo de IA generativa isoladamente:

  • Quere-se inferência pura: "Pega neste comando e gera um resultado."
  • Estás a experimentar no Playground
  • Chama o modelo através da API OpenAI Responses

De seguida, aprenda a criar um agente na Foundry.