LLM tool

Warning

O desenvolvimento de recursos do Prompt Flow terminou em 20 de abril de 2026. O recurso será totalmente desativado em 20 de abril de 2027. Na data de desativação, o Fluxo de Prompt entra no modo somente leitura. Seus fluxos existentes continuarão a operar até essa data.

Recommended action: Migrar suas cargas de trabalho de Fluxo de Prompt para Microsoft Agent Framework antes de 20 de abril de 2027.

A ferramenta LLM (modelo de linguagem grande) no fluxo de prompt permite que você use modelos de linguagem grandes amplamente usados, como OpenAI, Azure OpenAI em Microsoft Modelos de Pesquisa ou qualquer modelo de linguagem compatível com a API de inferência de modelo de IA Azure para processamento de linguagem natural.

O fluxo de prompt fornece várias APIs de modelo de linguagem grandes:

Conclusão: os modelos de conclusão do OpenAI geram texto com base nos prompts fornecidos.
Chat: os modelos de chat do OpenAI e os modelos de chat Azure AI facilitam conversas interativas com entradas e respostas baseadas em texto.

A API embeddings não está disponível na ferramenta LLM. Use a ferramenta embedding para gerar inserções com OpenAI ou Azure OpenAI.

Note

A ferramenta LLM no fluxo de prompt não dá suporte a modelos de raciocínio (como OpenAI o1 ou o3). Para a integração de modelos de raciocínio, use a ferramenta Python para chamar as APIs de modelo diretamente. Para obter mais informações, consulte Call a reasoning model from the Python tool.

Prerequisites

Criar recursos do OpenAI:

OpenAI:
- Inscreva-se para obter uma conta no site do OpenAI.
- Entre e localize sua chave de API pessoal.
Azure OpenAI:
- Crie Azure recursos do OpenAI seguindo as instruções these. Use apenas caracteres ASCII em Azure nomes de grupo de recursos openai. O fluxo de prompt não dá suporte a caracteres não ASCII em nomes de grupo de recursos.
Modelos implantados em implantações padrão:
- Crie um ponto de extremidade com o modelo do catálogo desejado e implante-o com uma implantação padrão.
- Para usar modelos implantados na implantação padrão com suporte pela API de inferência de modelo de IA Azure, como Mistral, Cohere, Meta Llama ou Microsoft família de modelos (entre outros), create uma conexão em seu projeto com seu ponto de extremidade.

Connections

Configure conexões para recursos provisionados no fluxo de prompt.

Tipo	Name	chave de API	API type	API version
OpenAI	Required	Required	-	-
Azure OpenAI – Chave de API	Required	Required	Required	Required
Azure OpenAI – Microsoft Entra ID	Required	-	-	Required
Serverless model	Required	Required	-	-

Tip

Para usar Microsoft Entra ID tipo de autenticação para Azure conexão OpenAI, atribua a função Cognitive Services OpenAI User ou Cognitive Services OpenAI Contributor à identidade gerenciada atribuída pelo usuário ou pelo usuário.
Saiba mais sobre como especificar como usar a identidade do usuário para enviar a execução do fluxo.
Saiba mais sobre how to configure Azure OpenAI with managed identities.

Inputs

As seções a seguir mostram várias entradas.

Text completion

Name	Tipo	Description	Required
solicitação	cadeia	Solicitação de texto para o modelo de idioma.	Yes
model, deployment_name	cadeia	Modelo de linguagem a ser usado.	Yes
max_tokens	inteiro	Número máximo de tokens a serem gerados na conclusão. O padrão é 16.	No
temperature	derivar	Aleatoriedade do texto gerado. O padrão é 1.	No
stop	list	Sequência de interrupção para o texto gerado. O padrão é nulo.	No
suffix	cadeia	Texto acrescentado ao final da conclusão.	No
top_p	derivar	Probabilidade de usar a escolha superior dos tokens gerados. O padrão é 1.	No
logprobs	inteiro	Número de probabilidades de log a serem geradas. O padrão é nulo.	No
echo	boolean	Valor que indica se o prompt deve ser ecoado novamente na resposta. O padrão é false.	No
presence_penalty	derivar	Valor que controla o comportamento do modelo para frases recorrentes. O padrão é 0.	No
frequency_penalty	derivar	Valor que controla o comportamento do modelo para gerar frases raras. O padrão é 0.	No
best_of	inteiro	Número de conclusões recomendadas a serem geradas. O padrão é 1.	No
logit_bias	dicionário	Viés de logit para o modelo de idioma. O padrão é um dicionário vazio.	No

Chat

Name	Tipo	Description	Required
solicitação	cadeia	Prompt de texto que o modelo de idioma usa para uma resposta.	Yes
model, deployment_name	cadeia	Modelo de linguagem a ser usado. Esse parâmetro não será necessário se o modelo for implantado em uma implantação padrão.	Yes*
max_tokens	inteiro	Número máximo de tokens a serem gerados na resposta. O padrão é inf.	No
temperature	derivar	Aleatoriedade do texto gerado. O padrão é 1.	No
stop	list	Sequência de interrupção para o texto gerado. O padrão é nulo.	No
top_p	derivar	Probabilidade de usar a escolha superior dos tokens gerados. O padrão é 1.	No
presence_penalty	derivar	Valor que controla o comportamento do modelo para frases recorrentes. O padrão é 0.	No
frequency_penalty	derivar	Valor que controla o comportamento do modelo para gerar frases raras. O padrão é 0.	No
logit_bias	dicionário	Viés de logit para o modelo de idioma. O padrão é um dicionário vazio.	No

Outputs

API	Return type	Description
Completion	cadeia	Texto de uma conclusão prevista
Chat	cadeia	Texto de uma resposta da conversa

Usar a ferramenta LLM

Configure e selecione as conexões com recursos do OpenAI ou com uma implantação padrão.
Configure a API do modelo de linguagem grande e seus parâmetros.
Prepare o prompt com diretrizes.

Comentários

Esta página foi útil?

Last updated on 2026-04-30