Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Warning
O desenvolvimento de recursos do Prompt Flow terminou em 20 de abril de 2026. O recurso será totalmente desativado em 20 de abril de 2027. Na data de desativação, o Fluxo de Prompt entra no modo somente leitura. Seus fluxos existentes continuarão a operar até essa data.
Recommended action: Migrar suas cargas de trabalho de Fluxo de Prompt para Microsoft Agent Framework antes de 20 de abril de 2027.
A ferramenta LLM (modelo de linguagem grande) no fluxo de prompt permite que você use modelos de linguagem grandes amplamente usados, como OpenAI, Azure OpenAI em Microsoft Modelos de Pesquisa ou qualquer modelo de linguagem compatível com a API de inferência de modelo de IA Azure para processamento de linguagem natural.
O fluxo de prompt fornece várias APIs de modelo de linguagem grandes:
- Conclusão: os modelos de conclusão do OpenAI geram texto com base nos prompts fornecidos.
- Chat: os modelos de chat do OpenAI e os modelos de chat Azure AI facilitam conversas interativas com entradas e respostas baseadas em texto.
A API embeddings não está disponível na ferramenta LLM. Use a ferramenta embedding para gerar inserções com OpenAI ou Azure OpenAI.
Note
A ferramenta LLM no fluxo de prompt não dá suporte a modelos de raciocínio (como OpenAI o1 ou o3). Para a integração de modelos de raciocínio, use a ferramenta Python para chamar as APIs de modelo diretamente. Para obter mais informações, consulte Call a reasoning model from the Python tool.
Prerequisites
Criar recursos do OpenAI:
OpenAI:
- Inscreva-se para obter uma conta no site do OpenAI.
- Entre e localize sua chave de API pessoal.
Azure OpenAI:
- Crie Azure recursos do OpenAI seguindo as instruções these. Use apenas caracteres ASCII em Azure nomes de grupo de recursos openai. O fluxo de prompt não dá suporte a caracteres não ASCII em nomes de grupo de recursos.
Modelos implantados em implantações padrão:
- Crie um ponto de extremidade com o modelo do catálogo desejado e implante-o com uma implantação padrão.
- Para usar modelos implantados na implantação padrão com suporte pela API de inferência de modelo de IA Azure, como Mistral, Cohere, Meta Llama ou Microsoft família de modelos (entre outros), create uma conexão em seu projeto com seu ponto de extremidade.
Connections
Configure conexões para recursos provisionados no fluxo de prompt.
| Tipo | Name | chave de API | API type | API version |
|---|---|---|---|---|
| OpenAI | Required | Required | - | - |
| Azure OpenAI – Chave de API | Required | Required | Required | Required |
| Azure OpenAI – Microsoft Entra ID | Required | - | - | Required |
| Serverless model | Required | Required | - | - |
Tip
- Para usar Microsoft Entra ID tipo de autenticação para Azure conexão OpenAI, atribua a função
Cognitive Services OpenAI UserouCognitive Services OpenAI Contributorà identidade gerenciada atribuída pelo usuário ou pelo usuário. - Saiba mais sobre como especificar como usar a identidade do usuário para enviar a execução do fluxo.
- Saiba mais sobre how to configure Azure OpenAI with managed identities.
Inputs
As seções a seguir mostram várias entradas.
Text completion
| Name | Tipo | Description | Required |
|---|---|---|---|
| solicitação | cadeia | Solicitação de texto para o modelo de idioma. | Yes |
| model, deployment_name | cadeia | Modelo de linguagem a ser usado. | Yes |
| max_tokens | inteiro | Número máximo de tokens a serem gerados na conclusão. O padrão é 16. | No |
| temperature | derivar | Aleatoriedade do texto gerado. O padrão é 1. | No |
| stop | list | Sequência de interrupção para o texto gerado. O padrão é nulo. | No |
| suffix | cadeia | Texto acrescentado ao final da conclusão. | No |
| top_p | derivar | Probabilidade de usar a escolha superior dos tokens gerados. O padrão é 1. | No |
| logprobs | inteiro | Número de probabilidades de log a serem geradas. O padrão é nulo. | No |
| echo | boolean | Valor que indica se o prompt deve ser ecoado novamente na resposta. O padrão é false. | No |
| presence_penalty | derivar | Valor que controla o comportamento do modelo para frases recorrentes. O padrão é 0. | No |
| frequency_penalty | derivar | Valor que controla o comportamento do modelo para gerar frases raras. O padrão é 0. | No |
| best_of | inteiro | Número de conclusões recomendadas a serem geradas. O padrão é 1. | No |
| logit_bias | dicionário | Viés de logit para o modelo de idioma. O padrão é um dicionário vazio. | No |
Chat
| Name | Tipo | Description | Required |
|---|---|---|---|
| solicitação | cadeia | Prompt de texto que o modelo de idioma usa para uma resposta. | Yes |
| model, deployment_name | cadeia | Modelo de linguagem a ser usado. Esse parâmetro não será necessário se o modelo for implantado em uma implantação padrão. | Yes* |
| max_tokens | inteiro | Número máximo de tokens a serem gerados na resposta. O padrão é inf. | No |
| temperature | derivar | Aleatoriedade do texto gerado. O padrão é 1. | No |
| stop | list | Sequência de interrupção para o texto gerado. O padrão é nulo. | No |
| top_p | derivar | Probabilidade de usar a escolha superior dos tokens gerados. O padrão é 1. | No |
| presence_penalty | derivar | Valor que controla o comportamento do modelo para frases recorrentes. O padrão é 0. | No |
| frequency_penalty | derivar | Valor que controla o comportamento do modelo para gerar frases raras. O padrão é 0. | No |
| logit_bias | dicionário | Viés de logit para o modelo de idioma. O padrão é um dicionário vazio. | No |
Outputs
| API | Return type | Description |
|---|---|---|
| Completion | cadeia | Texto de uma conclusão prevista |
| Chat | cadeia | Texto de uma resposta da conversa |
Usar a ferramenta LLM
- Configure e selecione as conexões com recursos do OpenAI ou com uma implantação padrão.
- Configure a API do modelo de linguagem grande e seus parâmetros.
- Prepare o prompt com diretrizes.