LLM tool

Warning

O desenvolvimento de recursos do Prompt Flow terminou em 20 de abril de 2026. O recurso será totalmente desativado em 20 de abril de 2027. Na data de desativação, o Fluxo de Prompt entra no modo somente leitura. Seus fluxos existentes continuarão a operar até essa data.

Recommended action: Migrar suas cargas de trabalho de Fluxo de Prompt para Microsoft Agent Framework antes de 20 de abril de 2027.

A ferramenta LLM (modelo de linguagem grande) no fluxo de prompt permite que você use modelos de linguagem grandes amplamente usados, como OpenAI, Azure OpenAI em Microsoft Modelos de Pesquisa ou qualquer modelo de linguagem compatível com a API de inferência de modelo de IA Azure para processamento de linguagem natural.

O fluxo de prompt fornece várias APIs de modelo de linguagem grandes:

  • Conclusão: os modelos de conclusão do OpenAI geram texto com base nos prompts fornecidos.
  • Chat: os modelos de chat do OpenAI e os modelos de chat Azure AI facilitam conversas interativas com entradas e respostas baseadas em texto.

A API embeddings não está disponível na ferramenta LLM. Use a ferramenta embedding para gerar inserções com OpenAI ou Azure OpenAI.

Note

A ferramenta LLM no fluxo de prompt não dá suporte a modelos de raciocínio (como OpenAI o1 ou o3). Para a integração de modelos de raciocínio, use a ferramenta Python para chamar as APIs de modelo diretamente. Para obter mais informações, consulte Call a reasoning model from the Python tool.

Prerequisites

Criar recursos do OpenAI:

Connections

Configure conexões para recursos provisionados no fluxo de prompt.

Tipo Name chave de API API type API version
OpenAI Required Required - -
Azure OpenAI – Chave de API Required Required Required Required
Azure OpenAI – Microsoft Entra ID Required - - Required
Serverless model Required Required - -

Tip

Inputs

As seções a seguir mostram várias entradas.

Text completion

Name Tipo Description Required
solicitação cadeia Solicitação de texto para o modelo de idioma. Yes
model, deployment_name cadeia Modelo de linguagem a ser usado. Yes
max_tokens inteiro Número máximo de tokens a serem gerados na conclusão. O padrão é 16. No
temperature derivar Aleatoriedade do texto gerado. O padrão é 1. No
stop list Sequência de interrupção para o texto gerado. O padrão é nulo. No
suffix cadeia Texto acrescentado ao final da conclusão. No
top_p derivar Probabilidade de usar a escolha superior dos tokens gerados. O padrão é 1. No
logprobs inteiro Número de probabilidades de log a serem geradas. O padrão é nulo. No
echo boolean Valor que indica se o prompt deve ser ecoado novamente na resposta. O padrão é false. No
presence_penalty derivar Valor que controla o comportamento do modelo para frases recorrentes. O padrão é 0. No
frequency_penalty derivar Valor que controla o comportamento do modelo para gerar frases raras. O padrão é 0. No
best_of inteiro Número de conclusões recomendadas a serem geradas. O padrão é 1. No
logit_bias dicionário Viés de logit para o modelo de idioma. O padrão é um dicionário vazio. No

Chat

Name Tipo Description Required
solicitação cadeia Prompt de texto que o modelo de idioma usa para uma resposta. Yes
model, deployment_name cadeia Modelo de linguagem a ser usado. Esse parâmetro não será necessário se o modelo for implantado em uma implantação padrão. Yes*
max_tokens inteiro Número máximo de tokens a serem gerados na resposta. O padrão é inf. No
temperature derivar Aleatoriedade do texto gerado. O padrão é 1. No
stop list Sequência de interrupção para o texto gerado. O padrão é nulo. No
top_p derivar Probabilidade de usar a escolha superior dos tokens gerados. O padrão é 1. No
presence_penalty derivar Valor que controla o comportamento do modelo para frases recorrentes. O padrão é 0. No
frequency_penalty derivar Valor que controla o comportamento do modelo para gerar frases raras. O padrão é 0. No
logit_bias dicionário Viés de logit para o modelo de idioma. O padrão é um dicionário vazio. No

Outputs

API Return type Description
Completion cadeia Texto de uma conclusão prevista
Chat cadeia Texto de uma resposta da conversa

Usar a ferramenta LLM

  1. Configure e selecione as conexões com recursos do OpenAI ou com uma implantação padrão.
  2. Configure a API do modelo de linguagem grande e seus parâmetros.
  3. Prepare o prompt com diretrizes.