Utilização de um modelo de IA generativa
Observação
Consulte a guia Texto e imagens para obter mais detalhes!
A forma mais fácil de interagir com um modelo implementado é usar o parque de jogos de modelos no portal Foundry. Podes usar os Foundry Playgrounds para tentar perguntas, comparar modelos e capturar definições de trabalho antes de escreveres qualquer código.
Parâmetros de configuração chave
Vários argumentos ou parâmetros do modelo influenciam o comportamento, desempenho e custo em tempo de execução. Nas definições do playground, podes configurar parâmetros como temperatura, tokens máximos de saída e instruções do sistema. Na interface de chat do playground podes enviar prompts e ver as respostas geradas pelo modelo.
- Temperatura: controla criatividade vs. determinismo.
- Tokens máximos de saída – limita o comprimento da resposta; afeta o consumo de tokens e o comportamento de limitação.
- Instruções do sistema – define o comportamento e o papel do modelo.
Ao contrário do prompt do utilizador, que é o pedido ou pergunta do utilizador final (exemplo: Para onde devo viajar?), um prompt do Sistema define comportamento, tom, ferramentas e limites de proteção para o assistente. Um exemplo de prompt do sistema é: "Você é um tutor prestável, que orienta passo a passo. Cite fontes. Recuso aconselhamento médico."
O playground é uma ponte útil entre o Foundry e o código. Depois de testares instruções representativas, podes usar o mesmo sistema e as mesmas instruções de utilizador e valores de parâmetros no teu código. O playground fornece código que pode invocar a sua implementação Foundry através da API Responses, compatível com OpenAI. O código é essencialmente o que está a correr quando usas a interface de chat para configurar definições e enviar avisos de utilizador.
Podes usar o código como ponto de partida para criar o teu próprio cliente de chat.
Crie um cliente de chat leve usando o Foundry SDK
Uma aplicação cliente leve é uma aplicação pequena e minimalista cuja função principal é recolher entradas do utilizador, chamar um serviço/API remota e apresentar resultados, sem estruturas de interface pesadas, lógica backend complexa ou grandes dependências locais. Na prática, normalmente:
- Funciona como uma CLI (interface de linha de comandos), uma pequena utilidade de ambiente de trabalho ou uma página web simples.
- Mantém o estado e o processamento maioritariamente no servidor (o modelo corre remotamente).
- Tem uma pegada de código pequena e configuração mínima (muitas vezes apenas variáveis de ambiente + um script curto).
- É fácil de prototipar, fácil de executar localmente e fácil de estender mais tarde.
Para o Foundry, um cliente de chat leve é frequentemente um ficheiro único Python que se liga a um endpoint de projeto Foundry e envia mensagens de chat para um modelo implementado. O SDK do Foundry expõe um cliente de projeto (operações nativas do Foundry) e um cliente compatível com OpenAI para chamar modelos através da API Responses. A maioria das aplicações usa ambos.
Constrói um cliente de chat em Python
Depois de criares um projeto Foundry e implementares um modelo de chat (por exemplo, gpt-4.1), podes usar o SDK Foundry. No exemplo, a aplicação cliente usa autenticação para se ligar ao endpoint do modelo, enviar um prompt e mostrar a resposta.
# pip install openai>=1.3.0
# pip install azure-ai-projects azure-identity openai
import os
from openai import OpenAI
client = OpenAI(
base_url=f"{os.environ['AZURE_OPENAI_ENDPOINT']}/openai",
api_key=os.environ["AZURE_OPENAI_API_KEY"]
)
response = client.responses.create(
model=os.environ["DEPLOYMENT_NAME"], # e.g., "gpt-4o-mini"
input=[{"role": "system", "content": "You're a helpful assistant."},
{"role": "user", "content": "Summarize the key points from our release notes in 3 bullets."}],
max_output_tokens=300,
temperature=0.7
)
print(response.output_text)
Compreender a diferença entre modelos e agentes
No Microsoft Foundry, modelos e agentes de IA generativa estão relacionados, mas servem propósitos diferentes. Pode pensar assim:
- Modelos = inteligência bruta
- Agentes = módulos de trabalho embalados, orientados para tarefas, construídos com base nessa inteligência
Quando utiliza um modelo de IA generativa isoladamente:
- Quere-se inferência pura: "Pega neste comando e gera um resultado."
- Estás a experimentar no Playground
- Chama o modelo através da API OpenAI Responses
De seguida, aprenda a criar um agente na Foundry.