Azure OpenAI em Microsoft Foundry Models REST API preview reference

Este artigo fornece detalhes sobre os endpoints da API REST de inferência para o Azure OpenAI.

Especificações da API

A gestão e interação com modelos e recursos OpenAI do Azure está dividida em três superfícies principais de API:

  • Plano de controlo
  • Plano de dados - autoria
  • Plano de dados - inferência

Cada superfície/especificação API encapsula um conjunto diferente de capacidades do Azure OpenAI. Cada API tem o seu próprio conjunto único de pré-visualização e versões de APIs estáveis/geralmente disponíveis (GA). Atualmente, os lançamentos de pré-visualização tendem a seguir uma cadência mensal.

Important

Agora existe uma nova API de inferência de pré-visualização. Saiba mais no nosso guia do ciclo de vida da API.

API Última versão de pré-visualização Última versão da GA Specifications Description
Plano de controlo 2025-07-01-preview 2025-06-01 Arquivos de especificações A API do plano de controlo é usada para operações como criação de recursos, implementação de modelos e outras tarefas de gestão de recursos de nível superior. O plano de controlo também regula o que é possível fazer com capacidades como Azure Resource Manager, Bicep, Terraform e CLI do Azure.
Plano de dados v1 preview v1 Arquivos de especificações A API do plano de dados controla as operações de inferência e autoria.

Authentication

O Azure OpenAI fornece dois métodos para autenticação. Pode usar API Keys ou Microsoft Entra ID.

  • Autenticação de Chave API: Para este tipo de autenticação, todos os pedidos de API devem incluir a Chave API no api-key cabeçalho HTTP. O Quickstart fornece orientações sobre como fazer chamadas com este tipo de autenticação.

  • Microsoft Entra ID: Pode autenticar uma chamada API usando um token Microsoft Entra. Os tokens de autenticação são incluídos num pedido como Authorization cabeçalho. O token fornecido deve ser precedido por Bearer, por exemplo Bearer YOUR_AUTH_TOKEN. Pode ler o nosso guia prático sobre autenticação com Microsoft Entra ID.

Versionamento da API REST

As APIs dos serviços são versionadas usando o api-version parâmetro de consulta. Todas as versões seguem a estrutura de datas YYYY-MM-DD. Por exemplo:

POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/chat/completions?api-version=2024-06-01

Inferência do plano de dados

O restante do artigo aborda a versão de pré-visualização 2025-04-01-preview da especificação de inferência do plano de dados do Azure OpenAI.

Se procura documentação sobre a última versão da API GA, consulte a mais recente API de inferência do plano de dados GA.

Completações - Criar

POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2025-04-01-preview

Cria uma conclusão para o prompt fornecido, parâmetros e modelo escolhido.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
ID de implementação caminho Yes cadeia (de caracteres)
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: application/json

Name Tipo Description Obrigatório Predefinição
melhor_de número inteiro Gera best_of completações do lado do servidor e devolve o "melhor" (aquele com maior probabilidade logaritária por token). Os resultados não podem ser transmitidos em streaming.

Quando usado com n, best_of controla o número de conclusãos candidatas e n especifica quantas devolver ââ'�“ best_of devem ser maiores que n.

Nota: Como este parâmetro gera muitas conclusãos, pode rapidamente consumir a sua quota de tokens. Use com cuidado e certifique-se de que tem definições razoáveis para max_tokens e stop.
No 1
Echo boolean Repita o prompt além da conclusão No Falso
penalização de frequência number Número entre -2.0 e 2.0. Valores positivos penalizam novos tokens com base na sua frequência existente no texto até agora, diminuindo a probabilidade do modelo repetir a mesma frase literalmente. No 0
logit_bias objecto Modificar a probabilidade de tokens especificados aparecerem na conclusão.

Aceita um objeto JSON que mapeia tokens (especificados pelo seu ID de token no tokenizador GPT) para um valor de viés associado de -100 a 100. Matematicamente, o viés é adicionado aos logits gerados pelo modelo antes da amostragem. O efeito exato varia consoante o modelo, mas valores entre -1 e 1 devem diminuir ou aumentar a probabilidade de seleção; valores como -100 ou 100 devem resultar numa proibição ou na seleção exclusiva do token relevante.

Por exemplo, pode passar {"50256": -100} para impedir que o <token |endoftext|> seja gerado.
No None
Logprobs número inteiro Inclua as probabilidades logarítmicas dos logprobs tokens de saída mais prováveis, bem como os tokens escolhidos. Por exemplo, se logprobs for 5, a API devolve uma lista dos 5 tokens mais prováveis. A API devolve sempre o do logprob token amostrado, pelo que pode haver até logprobs+1 até elementos na resposta.

O valor máximo para logprobs é 5.
No None
máximo de tokens número inteiro O número máximo de tokens que podem ser gerados na conclusão.

A contagem de tokens do teu prompt plus max_tokens não pode exceder o comprimento do contexto do modelo.
No 16
n número inteiro Quantas conclusãos gerar para cada prompt.

Nota: Como este parâmetro gera muitas conclusãos, pode rapidamente consumir a sua quota de tokens. Use com cuidado e certifique-se de que tem definições razoáveis para max_tokens e stop.
No 1
presence_penalty number Número entre -2.0 e 2.0. Valores positivos penalizam novos tokens com base em que aparecem ou não no texto até agora, aumentando a probabilidade do modelo de falar sobre novos temas. No 0
avisar String ou array O prompt para gerar completações para, codificado como uma string, array de strings, array de tokens ou array de tokens.

Note que <|endoftext|> é o separador de documentos que o modelo vê durante o treino, por isso, se um prompt não for especificado, o modelo gera-se como se fosse do início de um novo documento.
Yes
seed número inteiro Se especificado, o nosso sistema faz o melhor esforço para amostrar deterministicamente, de modo que pedidos repetidos com os mesmos seed parâmetros e devolvam o mesmo resultado.

O determinismo não é garantido, e deves consultar o system_fingerprint parâmetro de resposta para monitorizar as alterações no backend.
No
pare String ou array Até quatro sequências em que a API deixa de gerar mais tokens. O texto devolvido não conterá a sequência de paragens. No
fluxo boolean Se deves reverter o progresso parcial. Se ativados, os tokens são enviados apenas como eventos enviados pelo servidor apenas por dados à medida que ficam disponíveis, com o fluxo terminado por uma data: [DONE] mensagem. Exemplo Python código.
No Falso
sufixo cadeia (de caracteres) O sufixo que surge após a conclusão do texto inserido.

Este parâmetro é suportado apenas para gpt-3.5-turbo-instruct.
No None
Temperatura number Que temperatura de amostragem usar, entre 0 e 2. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 tornam-na mais focada e determinística.

Geralmente recomendamos alterar isto ou top_p , mas não ambos.
No 1
top_p number Uma alternativa à amostragem com temperatura, chamada amostragem de núcleo, onde o modelo considera os resultados dos tokens com top_p massa de probabilidade. Portanto, 0,1 significa que apenas os tokens que compõem o top 10% massa de probabilidade são considerados.

Geralmente recomendamos alterar isto ou temperature , mas não ambos.
No 1
utilizador cadeia (de caracteres) Um identificador único que representa o seu utilizador final, que pode ajudar a monitorizar e detetar abusos.
No

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON createCompletionResponse

Código de Estado: padrão

Descrição: Serviço indisponível

Tipo de conteúdo Type Description
Application/JSON errorResponse

Exemplos

Exemplo

Cria uma conclusão para o prompt fornecido, parâmetros e modelo escolhido.

POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2025-04-01-preview

{
 "prompt": [
  "tell me a joke about mango"
 ],
 "max_tokens": 32,
 "temperature": 1.0,
 "n": 1
}

Respostas: Código de Estado: 200

{
  "body": {
    "id": "cmpl-7QmVI15qgYVllxK0FtxVGG6ywfzaq",
    "created": 1686617332,
    "choices": [
      {
        "text": "es\n\nWhat do you call a mango who's in charge?\n\nThe head mango.",
        "index": 0,
        "finish_reason": "stop",
        "logprobs": null
      }
    ],
    "usage": {
      "completion_tokens": 20,
      "prompt_tokens": 6,
      "total_tokens": 26
    }
  }
}

Embeddings - Criar

POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2025-04-01-preview

Obtenha uma representação vetorial de uma dada entrada que possa ser facilmente consumida por modelos e algoritmos de aprendizagem automática.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
ID de implementação caminho Yes cadeia (de caracteres) O ID de implementação do modelo que foi implementado.
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: application/json

Name Tipo Description Obrigatório Predefinição
dimensões número inteiro O número de dimensões que os embeddings de saída resultantes devem ter. Só suportado em text-embedding-3 modelos e modelos posteriores. No
encoding_format cadeia (de caracteres) O formato para devolver os embeddings. Pode ser qualquer um ou floatbase64outro. Por defeito, é float. No
dados introduzidos String ou array Input texto para embed, codificado como uma string ou array de tokens. Para incorporar múltiplas entradas num único pedido, passe um array de strings ou array de tokens. A entrada não deve exceder os tokens máximos de entrada para o modelo (8.192 tokens para text-embedding-ada-002), não pode ser uma string vazia, e qualquer array deve ter 2.048 dimensões ou menos. Além do limite por token de entrada, todos os modelos de embedding impõem um máximo de 300.000 tokens somados em todas as entradas num único pedido. Yes
tipo_de_entrada cadeia (de caracteres) Tipo de entrada de pesquisa de embedding a utilizar No
utilizador cadeia (de caracteres) Um identificador único que representa o seu utilizador final, que pode ajudar a monitorizar e detetar abusos. No

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON objecto

Exemplos

Exemplo

Devolva os embeddings para um determinado prompt.

POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2025-04-01-preview

{
 "input": [
  "this is a test"
 ]
}

Respostas: Código de Estado: 200

{
  "body": {
    "data": [
      {
        "index": 0,
        "embedding": [
          -0.012838088,
          -0.007421397,
          -0.017617522,
          -0.028278312,
          -0.018666342,
          0.01737855,
          -0.01821495,
          -0.006950092,
          -0.009937238,
          -0.038580645,
          0.010674067,
          0.02412286,
          -0.013647936,
          0.013189907,
          0.0021125758,
          0.012406612,
          0.020790534,
          0.00074595667,
          0.008397198,
          -0.00535031,
          0.008968075,
          0.014351576,
          -0.014086051,
          0.015055214,
          -0.022211088,
          -0.025198232,
          0.0065186154,
          -0.036350243,
          0.009180495,
          -0.009698266,
          0.009446018,
          -0.008463579,
          -0.0020113448
        ]
      }
    ],
    "usage": {
      "prompt_tokens": 4,
      "total_tokens": 4
    }
  }
}

Conclusão de chat - Criar

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

Cria uma conclusão para a mensagem do chat

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
ID de implementação caminho Yes cadeia (de caracteres)
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: application/json

Name Tipo Description Obrigatório Predefinição
Áudio objecto Parâmetros para saída de áudio. É obrigatório quando a saída de áudio é solicitada com modalities: ["audio"]. No
└─ formato enumeração Especifica o formato de áudio de saída. Deve ser um dos wav, mp3, flac, opus, ou pcm16.

Valores possíveis: wav, mp3, flac, opus, pcm16
No
└─ voz enumeração Especifica o tipo de voz. As vozes suportadas são alloy, echo, fable, onyx, nova, e shimmer.

Valores possíveis: alloy, echo, fable, onyx, nova, shimmer
No
data_sources matriz As entradas de configuração para as extensões de chat do Azure OpenAI que as utilizam.
Esta especificação extra só é compatível com o Azure OpenAI.
No
penalização de frequência number Número entre -2.0 e 2.0. Valores positivos penalizam novos tokens com base na sua frequência existente no texto até agora, diminuindo a probabilidade do modelo repetir a mesma frase literalmente.
No 0
function_call string ou chatCompletionFunctionCallOption Descontinuado em favor de tool_choice.

Controla qual (se existe) função é chamada pelo modelo.
none significa que o modelo não chama uma função e, em vez disso, gera uma mensagem.
auto significa que o modelo pode escolher entre gerar uma mensagem ou chamar uma função.
Especificar uma função particular via {"name": "my_function"} obriga o modelo a chamar essa função.

none é o padrão quando não há funções presentes. auto é o padrão se as funções estiverem presentes.
No
functions matriz Descontinuado em favor de tools.

Uma lista de funções para as quais o modelo pode gerar entradas JSON.
No
logit_bias objecto Modificar a probabilidade de tokens especificados aparecerem na conclusão.

Aceita um objeto JSON que mapeia os tokens (especificados pelo seu ID de token no tokenizador) para um valor de viés associado de -100 a 100. Matematicamente, o viés é adicionado aos logits gerados pelo modelo antes da amostragem. O efeito exato varia consoante o modelo, mas valores entre -1 e 1 devem diminuir ou aumentar a probabilidade de seleção; valores como -100 ou 100 devem resultar numa proibição ou na seleção exclusiva do token relevante.
No None
Logprobs boolean Se deve devolver as probabilidades logarítmicas dos tokens de saída ou não. Se for verdadeiro, devolve as probabilidades logarítmicas de cada token de saída devolvido no content de message. No Falso
max_completion_tokens número inteiro Um limite superior para o número de tokens que podem ser gerados para uma conclusão, incluindo tokens de saída visíveis e tokens de raciocínio. No
máximo de tokens número inteiro O número máximo de tokens que podem ser gerados na conclusão do chat.

O comprimento total dos tokens de entrada e dos tokens gerados é limitado pelo comprimento de contexto do modelo.
No
Mensagens matriz Uma lista de mensagens que compõem a conversa até agora. Exemplo Python código. Yes
metadados objecto Etiquetas e valores definidos pelo programador usados para filtrar completações no painel de completações armazenadas. No
Modalidades ChatCompletionModalities Tipos de saída que gostaria que o modelo gerasse para este pedido.
A maioria dos modelos é capaz de gerar texto, que é o padrão:

["text"]

O gpt-4o-audio-preview modelo também pode ser usado para gerar áudio. Para solicitar que este modelo gere tanto respostas de texto como áudio, pode usar:

["text", "audio"]
No
n número inteiro Quantas opções de conclusão de chat gerar para cada mensagem de entrada. Será cobrado com base no número de tokens gerados em todas as opções. Mantenha-se n para 1 minimizar custos. No 1
chamadas_de_ferramentas_em_paralelo ParallelToolCalls Se deve ativar a chamada paralela de funções durante a utilização da ferramenta. No Verdade
predição PredictionContent Configuração para uma Saída Prevista, que pode melhorar significativamente os tempos de resposta quando grandes partes da resposta do modelo são conhecidas antecipadamente. Isto é mais comum quando se está a regenerar um ficheiro com apenas pequenas alterações na maior parte do conteúdo. No
presence_penalty number Número entre -2.0 e 2.0. Valores positivos penalizam novos tokens com base em que aparecem ou não no texto até agora, aumentando a probabilidade do modelo de falar sobre novos temas.
No 0
esforço de raciocínio enumeração Apenas modelos O1

Limita o esforço de raciocínio para modelos de raciocínio.

Os valores atualmente suportados são low, medium, e high. Reduzir o esforço de raciocínio pode resultar em respostas mais rápidas e menos tokens usados no raciocínio numa resposta.
Valores possíveis: low, medium, high
No
formato_de_resposta ResponseFormatText ou ResponseFormatJsonObject ou ResponseFormatJsonSchema Um objeto que especifica o formato que o modelo deve gerar. Compatível com GPT-4o, GPT-4o mini, GPT-4 Turbo e todos os modelos GPT-3.5 Turbo mais recentes do que gpt-3.5-turbo-1106.

A definição para { "type": "json_schema", "json_schema": {...} } ativa ativa os Structured Outputs, que garantem que o modelo corresponde ao seu esquema JSON fornecido.

A definição para { "type": "json_object" } ativa o modo JSON, que garante que a mensagem gerada pelo modelo é JSON válida.

Importante: ao usar o modo JSON, deve também instruir o modelo a produzir JSON por si próprio através de uma mensagem do sistema ou do utilizador. Sem isto, o modelo pode gerar um fluxo interminável de espaços em branco até que a geração atinja o limite dos tokens, resultando num pedido de longa duração e aparentemente "preso". Note também que o conteúdo da mensagem pode ser parcialmente cortado se finish_reason="length", o que indica que a geração excedeu max_tokens ou a conversa excedeu o comprimento máximo do contexto.
No
seed número inteiro Esta funcionalidade está em Beta.
Se especificado, o nosso sistema faz o melhor esforço para amostrar deterministicamente, de modo que pedidos repetidos com os mesmos seed parâmetros e devolvam o mesmo resultado.
O determinismo não é garantido, e deves consultar o system_fingerprint parâmetro de resposta para monitorizar as alterações no backend.
No
pare String ou array Até 4 sequências em que a API deixa de gerar mais tokens.
No
armazenar boolean Se devemos ou não armazenar a saída deste pedido de conclusão de chat para uso nos nossos produtos de destilação ou avaliação de modelos. No
fluxo boolean Se definido, são enviados deltas parciais da mensagem, como no ChatGPT. Os tokens são enviados apenas como eventos de dados enviados pelo servidor à medida que ficam disponíveis, com o fluxo terminado por uma data: [DONE] mensagem. Exemplo Python código.
No Falso
stream_options chatCompletionStreamOptions Opções para resposta ao streaming. Só define isto quando defines stream: true.
No None
Temperatura number Que temperatura de amostragem usar, entre 0 e 2. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 tornam-na mais focada e determinística.

Geralmente recomendamos alterar isto ou top_p , mas não ambos.
No 1
tool_choice chatCompletionToolChoiceOption Controla qual (se houver) ferramenta chamada pelo modelo. none significa que o modelo não chama nenhuma ferramenta e, em vez disso, gera uma mensagem. auto significa que o modelo pode escolher entre gerar uma mensagem ou chamar uma ou mais ferramentas. required significa que o modelo tem de chamar uma ou mais ferramentas. Especificar uma ferramenta específica obriga {"type": "function", "function": {"name": "my_function"}} o modelo a chamar essa ferramenta. none é o padrão quando não há ferramentas presentes. auto é o padrão se houver ferramentas presentes. No
tools matriz Uma lista de ferramentas que o modelo pode chamar. Atualmente, apenas funções são suportadas como ferramenta. Use isto para fornecer uma lista de funções para as quais o modelo pode gerar entradas JSON. São suportadas um máximo de 128 funções.
No
top_logprobs número inteiro Um número inteiro entre 0 e 20 que especifica o número de tokens mais prováveis a serem retornados em cada posição do token, cada um com uma probabilidade logarítmica associada. logprobs deve ser definido para true se este parâmetro for utilizado. No
top_p number Uma alternativa à amostragem com temperatura, chamada amostragem de núcleo, onde o modelo considera os resultados dos tokens com top_p massa de probabilidade. Portanto, 0,1 significa que apenas os tokens que compõem o top 10% massa de probabilidade são considerados.

Geralmente recomendamos alterar isto ou temperature , mas não ambos.
No 1
utilizador cadeia (de caracteres) Um identificador único que representa o seu utilizador final, que pode ajudar a monitorizar e detetar abusos.
No
user_security_context userSecurityContext O contexto de segurança do utilizador contém vários parâmetros que descrevem a própria aplicação de IA e o utilizador final que interage com a aplicação de IA. Estes campos ajudam as suas equipas de operações de segurança a investigar e mitigar incidentes de segurança, fornecendo uma abordagem abrangente para proteger as suas aplicações de IA. Saiba mais sobre como proteger aplicações de IA usando Microsoft Defender para a Cloud. No

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON objecto

Código de Estado: padrão

Descrição: Serviço indisponível

Tipo de conteúdo Type Description
Application/JSON errorResponse

Exemplos

Exemplo

Cria uma conclusão para o prompt fornecido, parâmetros e modelo escolhido.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "system",
   "content": "you are a helpful assistant that talks like a pirate"
  },
  {
   "role": "user",
   "content": "can you tell me how to care for a parrot?"
  }
 ]
}

Respostas: Código de Estado: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Ahoy matey! So ye be wantin' to care for a fine squawkin' parrot, eh? Well, shiver me timbers, let ol' Cap'n Assistant share some wisdom with ye! Here be the steps to keepin' yer parrot happy 'n healthy:\n\n1. Secure a sturdy cage: Yer parrot be needin' a comfortable place to lay anchor! Be sure ye get a sturdy cage, at least double the size of the bird's wingspan, with enough space to spread their wings, yarrrr!\n\n2. Perches 'n toys: Aye, parrots need perches of different sizes, shapes, 'n textures to keep their feet healthy. Also, a few toys be helpin' to keep them entertained 'n their minds stimulated, arrrh!\n\n3. Proper grub: Feed yer feathered friend a balanced diet of high-quality pellets, fruits, 'n veggies to keep 'em strong 'n healthy. Give 'em fresh water every day, or ye\u00e2\u20ac\u2122ll have a scurvy bird on yer hands!\n\n4. Cleanliness: Swab their cage deck! Clean their cage on a regular basis: fresh water 'n food daily, the floor every couple of days, 'n a thorough scrubbing ev'ry few weeks, so the bird be livin' in a tidy haven, arrhh!\n\n5. Socialize 'n train: Parrots be a sociable lot, arrr! Exercise 'n interact with 'em daily to create a bond 'n maintain their mental 'n physical health. Train 'em with positive reinforcement, treat 'em kindly, yarrr!\n\n6. Proper rest: Yer parrot be needin' \u00e2\u20ac\u2122bout 10-12 hours o' sleep each night. Cover their cage 'n let them slumber in a dim, quiet quarter for a proper night's rest, ye scallywag!\n\n7. Keep a weather eye open for illness: Birds be hidin' their ailments, arrr! Be watchful for signs of sickness, such as lethargy, loss of appetite, puffin' up, or change in droppings, and make haste to a vet if need be.\n\n8. Provide fresh air 'n avoid toxins: Parrots be sensitive to draft and pollutants. Keep yer quarters well ventilated, but no drafts, arrr! Be mindful of toxins like Teflon fumes, candles, or air fresheners.\n\nSo there ye have it, me hearty! With proper care 'n commitment, yer parrot will be squawkin' \"Yo-ho-ho\" for many years to come! Good luck, sailor, and may the wind be at yer back!"
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Exemplo

Cria uma conclusão baseada nos dados do Azure Search e na identidade gerida atribuída pelo sistema.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_search",
   "parameters": {
    "endpoint": "https://your-search-endpoint.search.windows.net/",
    "index_name": "{index name}",
    "authentication": {
     "type": "system_assigned_managed_identity"
    }
   }
  }
 ]
}

Respostas: Código de Estado: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Exemplo

Cria uma conclusão baseada em dados vetoriais de imagem do Azure Search.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_search",
   "parameters": {
    "endpoint": "https://your-search-endpoint.search.windows.net/",
    "index_name": "{index name}",
    "query_type": "vector",
    "fields_mapping": {
     "image_vector_fields": [
      "image_vector"
     ]
    },
    "authentication": {
     "type": "api_key",
     "key": "{api key}"
    }
   }
  }
 ]
}

Respostas: Código de Estado: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion."
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Exemplo

Cria uma conclusão baseada nos dados do vetor de pesquisa do Azure, na mensagem do assistente anterior e na identidade gerida atribuída pelo utilizador.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a cat?"
  },
  {
   "role": "assistant",
   "content": "Content of the completion [doc1].",
   "context": {
    "intent": "cat care"
   }
  },
  {
   "role": "user",
   "content": "how about dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_search",
   "parameters": {
    "endpoint": "https://your-search-endpoint.search.windows.net/",
    "authentication": {
     "type": "user_assigned_managed_identity",
     "managed_identity_resource_id": "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{resource-name}"
    },
    "index_name": "{index name}",
    "query_type": "vector",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "in_scope": true,
    "top_n_documents": 5,
    "strictness": 3,
    "role_information": "You are an AI assistant that helps people find information.",
    "fields_mapping": {
     "content_fields_separator": "\\n",
     "content_fields": [
      "content"
     ],
     "filepath_field": "filepath",
     "title_field": "title",
     "url_field": "url",
     "vector_fields": [
      "contentvector"
     ]
    }
   }
  }
 ]
}

Respostas: Código de Estado: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content 2.",
                "title": "Citation Title 2",
                "filepath": "contoso2.txt",
                "url": "https://contoso.blob.windows.net/container/contoso2.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Exemplo

Cria uma conclusão para o Azure Cosmos DB fornecido.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_cosmos_db",
   "parameters": {
    "authentication": {
     "type": "connection_string",
     "connection_string": "mongodb+srv://rawantest:{password}$@{cluster-name}.mongocluster.cosmos.azure.com/?tls=true&authMechanism=SCRAM-SHA-256&retrywrites=false&maxIdleTimeMS=120000"
    },
    "database_name": "vectordb",
    "container_name": "azuredocs",
    "index_name": "azuredocindex",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "fields_mapping": {
     "content_fields": [
      "content"
     ],
     "vector_fields": [
      "contentvector"
     ]
    }
   }
  }
 ]
}

Respostas: Código de Estado: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Exemplo

Cria uma conclusão para a base de dados Mongo fornecida.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "mongo_db",
   "parameters": {
    "authentication": {
     "type": "username_and_password",
     "username": "<username>",
     "password": "<password>"
    },
    "endpoint": "<endpoint_name>",
    "app_name": "<application name>",
    "database_name": "sampledb",
    "collection_name": "samplecollection",
    "index_name": "sampleindex",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "fields_mapping": {
     "content_fields": [
      "content"
     ],
     "vector_fields": [
      "contentvector"
     ]
    }
   }
  }
 ]
}

Respostas: Código de Estado: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Exemplo

Cria uma conclusão para o Elasticsearch fornecido.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "elasticsearch",
   "parameters": {
    "endpoint": "https://your-elasticsearch-endpoint.eastus.azurecontainer.io",
    "index_name": "{index name}",
    "authentication": {
     "type": "key_and_key_id",
     "key": "{key}",
     "key_id": "{key id}"
    }
   }
  }
 ]
}

Respostas: Código de Estado: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Exemplo

Cria uma conclusão para o recurso Pinecone fornecido.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "pinecone",
   "parameters": {
    "authentication": {
     "type": "api_key",
     "key": "{api key}"
    },
    "environment": "{environment name}",
    "index_name": "{index name}",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "fields_mapping": {
     "title_field": "title",
     "url_field": "url",
     "filepath_field": "filepath",
     "content_fields": [
      "content"
     ],
     "content_fields_separator": "\n"
    }
   }
  }
 ]
}

Respostas: Código de Estado: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Transcrições - Criar

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

Transcreve o áudio para a língua de entrada.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
ID de implementação caminho Yes cadeia (de caracteres)
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: multipart/form-data

Name Tipo Description Obrigatório Predefinição
modelo cadeia (de caracteres) ID do modelo a usar. As opções são gpt-4o-transcribe, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15, whisper-1, e gpt-4o-transcribe-diarize. Yes
ficheiro cadeia (de caracteres) O objeto do ficheiro áudio para transcrever. Yes
linguagem cadeia (de caracteres) A linguagem do áudio de entrada. Fornecer a linguagem de entrada no formato ISO-639-1 melhora a precisão e a latência. No
avisar cadeia (de caracteres) Um texto opcional para guiar o estilo do modelo ou continuar um segmento áudio anterior. O prompt deve corresponder à linguagem do áudio. No
formato_de_resposta audioResponseFormat Define o formato da saída. No
Temperatura number A temperatura de amostragem, entre 0 e 1. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 tornam-na mais focada e determinística. Se definido para 0, o modelo usa a probabilidade logarítmica para aumentar automaticamente a temperatura até que certos limiares sejam atingidos. No 0
timestamp_granularities[] matriz As granularidades do carimbo temporal para preencher esta transcrição. response_format deve ser definido verbose_json para usar granularidades de carimbo temporal. Uma ou ambas estas opções são suportadas: word, ou segment. Nota: Não existe latência adicional para carimbos temporais de segmentos, mas gerar carimbos temporais de palavra implica latência adicional. No ['segmento']

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON objecto
texto/sem formatação cadeia (de caracteres) Texto transcrito no formato de saída (quando response_format era um dos text, vtt ou srt).

Exemplos

Exemplo

Obtém texto transcrito e metadados associados a partir dos dados de áudio falado fornecidos.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

Respostas: Código de Estado: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Exemplo

Obtém texto transcrito e metadados associados a partir dos dados de áudio falado fornecidos.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Respostas: Código de Estado: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Traduções - Create

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

Transcreve e traduz áudio de entrada para texto em inglês.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
ID de implementação caminho Yes cadeia (de caracteres)
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: multipart/form-data

Name Tipo Description Obrigatório Predefinição
ficheiro cadeia (de caracteres) O ficheiro de áudio para traduzir. Yes
avisar cadeia (de caracteres) Um texto opcional para guiar o estilo do modelo ou continuar um segmento áudio anterior. O enunciado deve estar em inglês. No
formato_de_resposta audioResponseFormat Define o formato da saída. No
Temperatura number A temperatura de amostragem, entre 0 e 1. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 tornam-na mais focada e determinística. Se definido para 0, o modelo usa a probabilidade logarítmica para aumentar automaticamente a temperatura até que certos limiares sejam atingidos. No 0

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON objecto
texto/sem formatação cadeia (de caracteres) Texto transcrito no formato de saída (quando response_format era texto, vtt ou srt).

Exemplos

Exemplo

Obtém texto transcrito em inglês e metadados associados a partir dos dados de áudio falado fornecidos.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Respostas: Código de Estado: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Exemplo

Obtém texto transcrito em inglês e metadados associados a partir dos dados de áudio falado fornecidos.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Respostas: Código de Estado: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Fala - Criar

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview

Gera áudio a partir do texto de entrada.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
ID de implementação caminho Yes cadeia (de caracteres)
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: multipart/form-data

Name Tipo Description Obrigatório Predefinição
dados introduzidos cadeia (de caracteres) O texto para sintetizar áudio. O comprimento máximo é de 4.096 caracteres. Yes
formato_de_resposta enumeração O formato para sintetizar o áudio.
Valores possíveis: mp3, opus, aac, flac, wav, pcm
No
Velocidade number A velocidade do áudio sintetizado. Selecione um valor de 0.25 para 4.0. 1.0 é o padrão. No 1.0
Voz enumeração A voz a usar para síntese de voz.
Valores possíveis: alloy, echo, fable, onyx, nova, shimmer
Yes

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
application/octet-stream cadeia (de caracteres)

Exemplos

Exemplo

Sintetiza áudio a partir do texto fornecido.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview

{
 "input": "Hi! What are you going to make?",
 "voice": "fable",
 "response_format": "mp3"
}

Respostas: Código de Estado: 200

{
  "body": "101010101"
}

Gerações de imagens - Criar

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview

Gera um lote de imagens a partir de uma legenda de texto numa dada implementação de modelo de geração de imagens

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
ID de implementação caminho Yes cadeia (de caracteres)
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: application/json

Name Tipo Description Obrigatório Predefinição
em segundo plano imageBackground Permite definir transparência para o fundo das imagens geradas. Este parâmetro é apenas suportado para modelos da série gpt-image-1. No automóvel
n número inteiro O número de imagens a gerar. Para dall-e-3, apenas n=1 é suportado. No 1
compressão_de_saída número inteiro O nível de compressão (0-100%) para as imagens geradas. Este parâmetro é suportado apenas para modelos da série gpt-image-1 com o formato de saída jpeg. No 100
formato_de_saida imagesOutputFormat O formato de ficheiro no qual as imagens geradas são devolvidas. Apenas suportado para modelos da série gpt-image-1. No png
avisar cadeia (de caracteres) Uma descrição em texto da(s) imagem(ões) desejada(s). O comprimento máximo é de 32000 caracteres para a série gpt-image-1 e 4000 caracteres para dall-e-3 Yes
imagens parciais número inteiro O número de imagens parciais a gerar. Este parâmetro é usado para respostas em streaming que devolvem imagens parciais. O valor deve estar entre 0 e 3. Quando definido para 0, a resposta será uma única imagem enviada num evento de streaming. Note que a imagem final pode ser enviada antes de o número total de imagens parciais ser gerado, se a imagem completa for gerada mais rapidamente. 0
fluxo boolean Edita a imagem em modo streaming. não false
qualidade qualidade de imagem A qualidade da imagem que será gerada. No automóvel
formato_de_resposta imagesResponseFormat O formato em que as imagens geradas são devolvidas. Este parâmetro não é suportado para gpt-image-1modelos da série -que retornam sempre imagens codificadas base64.
Valores possíveis: url, b64_json.
No url
size imageSize O tamanho das imagens geradas. No automóvel
Estilo imageStyle O estilo das imagens geradas. Só é suportado para DALL-E-3. No vívido
utilizador cadeia (de caracteres) Um identificador único que representa o seu utilizador final, que pode ajudar a monitorizar e detetar abusos. No

Respostas

Código de Estado: 200

Descrição: Ok

Tipo de conteúdo Type Description
Application/JSON generateImagesResponse

Código de Estado: padrão

Descrição: Ocorreu um erro.

Tipo de conteúdo Type Description
Application/JSON dalleErrorResponse

Exemplos

Exemplo

Cria imagens com um prompt.

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview

{
 "prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
 "n": 1,
 "style": "natural",
 "quality": "standard"
}

Respostas: Código de Estado: 200

{
  "body": {
    "created": 1698342300,
    "data": [
      {
        "revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
        "prompt_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          },
          "profanity": {
            "detected": false,
            "filtered": false
          },
          "custom_blocklists": {
            "filtered": false,
            "details": []
          }
        },
        "url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
        "content_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          }
        }
      }
    ]
  }
}

Gerações de imagens - Editar

POST https://{endpoint}/openai/deployments/{deployment-id}/images/edits?api-version=2025-04-01-preview

Edita uma imagem a partir de uma legenda de texto numa dada implementação de modelo gpt-image-1

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
ID de implementação caminho Yes cadeia (de caracteres)
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: multipart/form-data

Name Tipo Description Obrigatório Predefinição
imagem String ou array A(s) imagem(s) a editar. Deve ser um ficheiro de imagem suportado ou um array de imagens. Cada imagem deve ser um ficheiro png ou jpg com menos de 50MB. Yes
input_fidelity cadeia (de caracteres) Controla quanto esforço o modelo irá fazer para corresponder ao estilo e às características, especialmente as características faciais, das imagens de entrada. Este parâmetro é apenas suportado para modelos da série gpt-image-1. Suportes high e low. não low.
máscara cadeia (de caracteres) Uma imagem adicional cujas áreas totalmente transparentes (por exemplo, onde alfa é zero) indica onde a imagem deve ser editada. Se forem fornecidas várias imagens, a máscara será aplicada à primeira imagem. Deve ser um ficheiro PNG válido, com menos de 4MB, e ter as mesmas dimensões da imagem. No
n número inteiro O número de imagens a gerar. Deve estar entre 1 e 10. No 1
avisar cadeia (de caracteres) Uma descrição em texto da(s) imagem(ões) desejada(s). O comprimento máximo é de 32000 caracteres. Yes
qualidade qualidade de imagem A qualidade da imagem que será gerada. No automóvel
imagens parciais O número de imagens parciais a gerar. Este parâmetro é usado para respostas em streaming que devolvem imagens parciais. O valor deve estar entre 0 e 3. Quando definido para 0, a resposta será uma única imagem enviada num evento de streaming. Note que a imagem final pode ser enviada antes de o número total de imagens parciais ser gerado, se a imagem completa for gerada mais rapidamente.
fluxo boolean Edita a imagem em modo streaming. não false
formato_de_resposta imagesResponseFormat O formato em que as imagens geradas são devolvidas. No url
size imageSize O tamanho das imagens geradas. No automóvel
utilizador cadeia (de caracteres) Um identificador único que representa o seu utilizador final, que pode ajudar a monitorizar e detetar abusos. No

Respostas

Código de Estado: 200

Descrição: Ok

Tipo de conteúdo Type Description
Application/JSON generateImagesResponse

Código de Estado: padrão

Descrição: Ocorreu um erro.

Tipo de conteúdo Type Description
Application/JSON dalleErrorResponse

Lista - Assistentes

Note

A API dos Assistentes está obsoleta e será retirada a 26 de agosto de 2026. Use o serviço geralmente disponível Microsoft Foundry Agents. Siga o guia de migração para atualizar as suas cargas de trabalho. Saiba mais.

GET https://{endpoint}/openai/assistants?api-version=2025-04-01-preview

Devolve uma lista de assistentes.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
limit consulta No número inteiro Um limite para o número de objetos a devolver. O limite pode variar entre 1 e 100, e o padrão é 20.
order consulta No cadeia (de caracteres)
Valores possíveis: asc, desc
Ordena pelo created_at carimbo temporal dos objetos. asc para ordem ascendente e desc para ordem descendente.
depois consulta No cadeia (de caracteres) Um cursor para uso na paginação. after é um ID de objeto que define o seu lugar na lista. Por exemplo, se fizer um pedido de lista e receber 100 objetos, terminando em obj_foo, a sua chamada seguinte pode incluir depois=obj_foo para obter a página seguinte da lista.
antes consulta No cadeia (de caracteres) Um cursor para uso na paginação. before é um ID de objeto que define o seu lugar na lista. Por exemplo, se fizer um pedido de lista e receber 100 objetos, começando por obj_foo, a sua chamada seguinte pode incluir antes=obj_foo para obter a página anterior da lista.
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON listAssistantsResponse

Exemplos

Exemplo

Devolve uma lista de assistentes.

GET https://{endpoint}/openai/assistants?api-version=2025-04-01-preview

Respostas: Código de Estado: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "asst_abc123",
        "object": "assistant",
        "created_at": 1707257477,
        "name": "Stock Analyst",
        "description": null,
        "model": "gpt-4-1106-preview",
        "instructions": "You are a financial analyst that analyzes stock market prices and other financial data present on user uploaded files or by calling external APIs.",
        "tools": [
          {
            "type": "code_interpreter"
          }
        ],
        "tool_resources": {},
        "metadata": {},
        "top_p": 1.0,
        "temperature": 1.0,
        "response_format": "auto"
      },
      {
        "id": "asst_abc456",
        "object": "assistant",
        "created_at": 1698982718,
        "name": "My Assistant",
        "description": null,
        "model": "gpt-4-turbo",
        "instructions": "You are a helpful assistant designed to make me better at coding!",
        "tools": [],
        "tool_resources": {},
        "metadata": {},
        "top_p": 1.0,
        "temperature": 1.0,
        "response_format": "auto"
      },
      {
        "id": "asst_abc789",
        "object": "assistant",
        "created_at": 1698982643,
        "name": null,
        "description": null,
        "model": "gpt-4-turbo",
        "instructions": null,
        "tools": [],
        "tool_resources": {},
        "metadata": {},
        "top_p": 1.0,
        "temperature": 1.0,
        "response_format": "auto"
      }
    ],
    "first_id": "asst_abc123",
    "last_id": "asst_abc789",
    "has_more": false
  }
}

Criar - Assistente

POST https://{endpoint}/openai/assistants?api-version=2025-04-01-preview

Cria um assistente com um modelo e instruções.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: application/json

Name Tipo Description Obrigatório Predefinição
description cadeia (de caracteres) A descrição do assistente. O comprimento máximo é de 512 caracteres.
No
instructions cadeia (de caracteres) As instruções do sistema que o assistente utiliza. O comprimento máximo é de 256.000 caracteres.
No
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
No
modelo cadeia (de caracteres) Yes
nome cadeia (de caracteres) O nome do assistente. O comprimento máximo é de 256 caracteres.
No
formato_de_resposta assistantsApiResponseFormatOption Especifica o formato que o modelo deve produzir. Compatível com GPT-4o, GPT-4 Turbo e todos os modelos GPT-3.5 Turbo desde gpt-3.5-turbo-1106então.

Definir para { "type": "json_schema", "json_schema": {...} } ativa ativa Structured Outputs que garantem que o modelo corresponde ao esquema JSON fornecido. Saiba mais no guia de Saídas Estruturadas.

A definição para { "type": "json_object" } ativa o modo JSON, que garante que a mensagem gerada pelo modelo é JSON válida.

Importante: ao usar o modo JSON, deve também instruir o modelo a produzir JSON por si próprio através de uma mensagem do sistema ou do utilizador. Sem isto, o modelo pode gerar um fluxo interminável de espaços em branco até que a geração atinja o limite dos tokens, resultando num pedido de longa duração e aparentemente "preso". Note também que o conteúdo da mensagem pode ser parcialmente cortado se finish_reason="length", o que indica que a geração excedeu max_tokens ou a conversa excedeu o comprimento máximo do contexto.
No
Temperatura number Que temperatura de amostragem usar, entre 0 e 2. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 tornam-na mais focada e determinística.
No 1
tool_resources objecto Um conjunto de recursos usados pelas ferramentas do assistente. Os recursos são específicos para o tipo de ferramenta. Por exemplo, a code_interpreter ferramenta requer uma lista de IDs de ficheiros, enquanto file_search requer uma lista de IDs de armazenamento vetorial.
No
└─ interpretador_de_codigo objecto No
└─ identificadores_de_ficheiro matriz Uma lista de IDs de ficheiros disponibilizada à code_interpreter ferramenta. Pode haver um máximo de 20 ficheiros associados à ferramenta.
No []
└─ pesquisa_arquivo objecto No
└─ vector_store_ids matriz O armazenamento vetorial está ligado a este assistente. Pode haver um máximo de 1 armazenamento vetorial associado ao assistente.
No
└─ armazenamento_de_vetores matriz Um ajudante para criar um armazenamento vetorial com file_ids e anexá-lo a este assistente. Pode haver um máximo de 1 armazenamento vetorial associado ao assistente.
No
tools matriz Uma lista de ferramentas ativadas no assistente. Pode haver um máximo de 128 ferramentas por assistente. As ferramentas podem ser do tipo code_interpreter, retrieval, ou function.
No []
top_p number Uma alternativa à amostragem com temperatura, chamada amostragem de núcleo, onde o modelo considera os resultados dos tokens com top_p massa de probabilidade. Portanto, 0,1 significa que apenas os tokens que compõem o top 10% massa de probabilidade são considerados.

Geralmente recomendamos alterar isto ou a temperatura, mas não ambos.
No 1

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON assistantObject

Exemplos

Exemplo

Cria um assistente com um modelo e instruções.

POST https://{endpoint}/openai/assistants?api-version=2025-04-01-preview

{
 "name": "Math Tutor",
 "instructions": "When a customer asks about a specific math problem, use Python to evaluate their query.",
 "tools": [
  {
   "type": "code_interpreter"
  }
 ],
 "model": "gpt-4-1106-preview"
}

Respostas: Código de Estado: 200

{
  "body": {
    "id": "asst_4nsG2qgNzimRPE7MazXTXbU7",
    "object": "assistant",
    "created_at": 1707295707,
    "name": "Math Tutor",
    "description": null,
    "model": "gpt-4-1106-preview",
    "instructions": "When a customer asks about a specific math problem, use Python to evaluate their query.",
    "tools": [
      {
        "type": "code_interpreter"
      }
    ],
    "metadata": {},
    "top_p": 1.0,
    "temperature": 1.0,
    "response_format": "auto"
  }
}

Get - Assistente

GET https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

Vai buscar um assistente.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
assistant_id caminho Yes cadeia (de caracteres) A identificação do assistente a recuperar.
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON assistantObject

Exemplos

Exemplo

Vai buscar um assistente.

GET https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

Respostas: Código de Estado: 200

{
  "body": {
    "id": "asst_abc123",
    "object": "assistant",
    "created_at": 1699009709,
    "name": "HR Helper",
    "description": null,
    "model": "gpt-4-turbo",
    "instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies.",
    "tools": [
      {
        "type": "file_search"
      }
    ],
    "metadata": {},
    "top_p": 1.0,
    "temperature": 1.0,
    "response_format": "auto"
  }
}

Modificar - Assistente

POST https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

Modifica um assistente.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
assistant_id caminho Yes cadeia (de caracteres) O ID do assistente a modificar.
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: application/json

Name Tipo Description Obrigatório Predefinição
description cadeia (de caracteres) A descrição do assistente. O comprimento máximo é de 512 caracteres.
No
instructions cadeia (de caracteres) As instruções do sistema que o assistente utiliza. O comprimento máximo é de 32768 caracteres.
No
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
No
modelo cadeia (de caracteres) No
nome cadeia (de caracteres) O nome do assistente. O comprimento máximo é de 256 caracteres.
No
formato_de_resposta assistantsApiResponseFormatOption Especifica o formato que o modelo deve produzir. Compatível com GPT-4o, GPT-4 Turbo e todos os modelos GPT-3.5 Turbo desde gpt-3.5-turbo-1106então.

Definir para { "type": "json_schema", "json_schema": {...} } ativa ativa Structured Outputs que garantem que o modelo corresponde ao esquema JSON fornecido. Saiba mais no guia de Saídas Estruturadas.

A definição para { "type": "json_object" } ativa o modo JSON, que garante que a mensagem gerada pelo modelo é JSON válida.

Importante: ao usar o modo JSON, deve também instruir o modelo a produzir JSON por si próprio através de uma mensagem do sistema ou do utilizador. Sem isto, o modelo pode gerar um fluxo interminável de espaços em branco até que a geração atinja o limite dos tokens, resultando num pedido de longa duração e aparentemente "preso". Note também que o conteúdo da mensagem pode ser parcialmente cortado se finish_reason="length", o que indica que a geração excedeu max_tokens ou a conversa excedeu o comprimento máximo do contexto.
No
Temperatura number Que temperatura de amostragem usar, entre 0 e 2. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 tornam-na mais focada e determinística.
No 1
tool_resources objecto Um conjunto de recursos usados pelas ferramentas do assistente. Os recursos são específicos para o tipo de ferramenta. Por exemplo, a code_interpreter ferramenta requer uma lista de IDs de ficheiros, enquanto file_search requer uma lista de IDs de armazenamento vetorial.
No
└─ interpretador_de_codigo objecto No
└─ identificadores_de_ficheiro matriz Sobrepõe a lista de IDs de ficheiros disponibilizados à code_interpreter ferramenta. Pode haver um máximo de 20 ficheiros associados à ferramenta.
No []
└─ pesquisa_arquivo objecto No
└─ vector_store_ids matriz Sobrepõe o armazenamento vetorial associado a este assistente. Pode haver um máximo de 1 armazenamento vetorial associado ao assistente.
No
tools matriz Uma lista de ferramentas ativadas no assistente. Pode haver um máximo de 128 ferramentas por assistente. As ferramentas podem ser do tipo code_interpreter, retrieval, ou function.
No []
top_p number Uma alternativa à amostragem com temperatura, chamada amostragem de núcleo, onde o modelo considera os resultados dos tokens com top_p massa de probabilidade. Portanto, 0,1 significa que apenas os tokens que compõem o top 10% massa de probabilidade são considerados.

Geralmente recomendamos alterar isto ou a temperatura, mas não ambos.
No 1

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON assistantObject

Exemplos

Exemplo

Modifica um assistente.

POST https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

{
 "instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies. Always response with info from either of the files.",
 "tools": [
  {
   "type": "file_search"
  }
 ],
 "model": "gpt-4-turbo"
}

Respostas: Código de Estado: 200

{
  "body": {
    "id": "asst_123",
    "object": "assistant",
    "created_at": 1699009709,
    "name": "HR Helper",
    "description": null,
    "model": "gpt-4-turbo",
    "instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies. Always response with info from either of the files.",
    "tools": [
      {
        "type": "file_search"
      }
    ],
    "tool_resources": {
      "file_search": {
        "vector_store_ids": []
      }
    },
    "metadata": {},
    "top_p": 1.0,
    "temperature": 1.0,
    "response_format": "auto"
  }
}

Eliminar - Assistente

DELETE https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

Apaga um assistente.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
assistant_id caminho Yes cadeia (de caracteres) O ID do assistente para apagar.
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON deleteAssistantResponse

Exemplos

Exemplo

Apaga um assistente.

DELETE https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

Respostas: Código de Estado: 200

{
  "body": {
    "id": "asst_4nsG2qgNzimRPE7MazXTXbU7",
    "object": "assistant.deleted",
    "deleted": true
  }
}

Criar - Thread

Note

A API dos Assistentes está obsoleta e será retirada a 26 de agosto de 2026. Use o serviço geralmente disponível Microsoft Foundry Agents. Siga o guia de migração para atualizar as suas cargas de trabalho. Saiba mais.

POST https://{endpoint}/openai/threads?api-version=2025-04-01-preview

Cria um tópico.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: application/json

Name Tipo Description Obrigatório Predefinição
Mensagens matriz Uma lista de mensagens para começar o tópico. No
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
No
tool_resources objecto Um conjunto de recursos disponibilizados às ferramentas do assistente neste tópico. Os recursos são específicos para o tipo de ferramenta. Por exemplo, a code_interpreter ferramenta requer uma lista de IDs de ficheiros, enquanto file_search requer uma lista de IDs de armazenamento vetorial.
No
└─ interpretador_de_codigo objecto No
└─ identificadores_de_ficheiro matriz Uma lista de IDs de ficheiros disponibilizada à code_interpreter ferramenta. Pode haver um máximo de 20 ficheiros associados à ferramenta.
No []
└─ pesquisa_arquivo objecto No
└─ vector_store_ids matriz O armazenamento vetorial está ligado a este tópico. Pode haver um máximo de 1 armazenamento vetorial ligado à thread.
No
└─ armazenamento_de_vetores matriz Um ajudante para criar um armazenamento vetorial com file_ids e anexá-lo a este fio. Pode haver um máximo de 1 armazenamento vetorial ligado à thread.
No

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON threadObject

Exemplos

Exemplo

Cria um fio de conversa.

POST https://{endpoint}/openai/threads?api-version=2025-04-01-preview

Respostas: Código de Estado: 200

{
  "body": {
    "id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "object": "thread",
    "created_at": 1707297136,
    "metadata": {}
  }
}

Get - Thread

GET https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

Recupera um fio.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
thread_id caminho Yes cadeia (de caracteres) O ID do tópico para recuperar.
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON threadObject

Exemplos

Exemplo

Recupera um fio.

GET https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

Respostas: Código de Estado: 200

{
  "body": {
    "id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "object": "thread",
    "created_at": 1707297136,
    "metadata": {},
    "tool_resources": {
      "code_interpreter": {
        "file_ids": []
      }
    }
  }
}

Modificar - Thread

POST https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

Modifica um tópico.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
thread_id caminho Yes cadeia (de caracteres) O ID do tópico a modificar. Apenas os metadata que podem ser modificados.
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: application/json

Name Tipo Description Obrigatório Predefinição
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
No
tool_resources objecto Um conjunto de recursos disponibilizados às ferramentas do assistente neste tópico. Os recursos são específicos para o tipo de ferramenta. Por exemplo, a code_interpreter ferramenta requer uma lista de IDs de ficheiros, enquanto file_search requer uma lista de IDs de armazenamento vetorial.
No
└─ interpretador_de_codigo objecto No
└─ identificadores_de_ficheiro matriz Uma lista de IDs de ficheiro disponibilizada à code_interpreter ferramenta. Pode haver um máximo de 20 ficheiros associados à ferramenta.
No []
└─ pesquisa_arquivo objecto No
└─ vector_store_ids matriz O armazenamento vetorial está ligado a este tópico. Pode haver um máximo de 1 armazenamento vetorial ligado à thread.
No

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON threadObject

Exemplos

Exemplo

Modifica um tópico.

POST https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

{
 "metadata": {
  "modified": "true",
  "user": "abc123"
 }
}

Respostas: Código de Estado: 200

{
  "body": {
    "id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "object": "thread",
    "created_at": 1707297136,
    "metadata": {
      "modified": "true",
      "user": "abc123"
    },
    "tool_resources": {}
  }
}

Eliminar - Thread

DELETE https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

Apaga um tópico.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
thread_id caminho Yes cadeia (de caracteres) O ID do tópico para apagar.
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON deleteThreadResponse

Exemplos

Exemplo

Apaga um tópico.

DELETE https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

Respostas: Código de Estado: 200

{
  "body": {
    "id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "object": "thread.deleted",
    "deleted": true
  }
}

Lista - Mensagens

Note

A API dos Assistentes está obsoleta e será retirada a 26 de agosto de 2026. Use o serviço geralmente disponível Microsoft Foundry Agents. Siga o guia de migração para atualizar as suas cargas de trabalho. Saiba mais.

GET https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview

Devolve uma lista de mensagens para um determinado tópico.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
thread_id caminho Yes cadeia (de caracteres) O ID dos threads a que pertencem as mensagens.
limit consulta No número inteiro Um limite para o número de objetos a devolver. O limite pode variar entre 1 e 100, e o padrão é 20.
order consulta No cadeia (de caracteres)
Valores possíveis: asc, desc
Ordena pelo created_at carimbo temporal dos objetos. asc para ordem ascendente e desc para ordem descendente.
depois consulta No cadeia (de caracteres) Um cursor para uso na paginação. after é um ID de objeto que define o seu lugar na lista. Por exemplo, se fizer um pedido de lista e receber 100 objetos, terminando em obj_foo, a sua chamada seguinte pode incluir depois=obj_foo para obter a página seguinte da lista.
antes consulta No cadeia (de caracteres) Um cursor para uso na paginação. before é um ID de objeto que define o seu lugar na lista. Por exemplo, se fizer um pedido de lista e receber 100 objetos, começando por obj_foo, a sua chamada seguinte pode incluir antes=obj_foo para obter a página anterior da lista.
run_id consulta No cadeia (de caracteres) Filtra as mensagens pelo ID da corrida que as gerou.
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON listMessagesResponse

Exemplos

Exemplo

Listar mensagens

GET https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview

Respostas: Código de Estado: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "msg_abc123",
        "object": "thread.message",
        "created_at": 1699016383,
        "assistant_id": null,
        "thread_id": "thread_abc123",
        "run_id": null,
        "role": "user",
        "content": [
          {
            "type": "text",
            "text": {
              "value": "How does AI work? Explain it in simple terms.",
              "annotations": []
            }
          }
        ],
        "attachments": [],
        "metadata": {}
      },
      {
        "id": "msg_abc456",
        "object": "thread.message",
        "created_at": 1699016383,
        "assistant_id": null,
        "thread_id": "thread_abc123",
        "run_id": null,
        "role": "user",
        "content": [
          {
            "type": "text",
            "text": {
              "value": "Hello, what is AI?",
              "annotations": []
            }
          }
        ],
        "attachments": [],
        "metadata": {}
      }
    ],
    "first_id": "msg_abc123",
    "last_id": "msg_abc456",
    "has_more": false
  }
}

Criar - Mensagem

POST https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview

Cria uma mensagem.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
thread_id caminho Yes cadeia (de caracteres) O ID dos threads para criar uma mensagem.
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: application/json

Name Tipo Description Obrigatório Predefinição
Anexos matriz Uma lista de ficheiros anexados à mensagem e as ferramentas a que devem ser adicionados. No
conteúdo cadeia (de caracteres) O conteúdo da mensagem. Yes
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
No
função cadeia (de caracteres) O papel da entidade que está a criar a mensagem. Os valores permitidos incluem:
- user: Indica que a mensagem foi enviada por um utilizador real e deve ser usada na maioria dos casos para representar mensagens geradas pelo utilizador.
- assistant: Indica que a mensagem é gerada pelo assistente. Use este valor para inserir mensagens do assistente na conversa.
Yes

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON messageObject

Exemplos

Exemplo

Cria uma mensagem.

POST https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview

{
 "role": "user",
 "content": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces."
}

Respostas: Código de Estado: 200

{
  "body": {
    "id": "msg_as3XIk1tpVP3hdHjWBGg3uG4",
    "object": "thread.message",
    "created_at": 1707298421,
    "assistant_id": null,
    "thread_id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "run_id": null,
    "role": "user",
    "content": [
      {
        "type": "text",
        "text": {
          "value": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces.",
          "annotations": []
        }
      }
    ],
    "attachments": [],
    "metadata": {}
  }
}

Get - Mensagem

GET https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview

Recupera uma mensagem.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
thread_id caminho Yes cadeia (de caracteres) O ID dos threads a que esta mensagem pertence.
message_id caminho Yes cadeia (de caracteres) O ID da mensagem a recuperar.
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON messageObject

Exemplos

Exemplo

Recupera uma mensagem.

GET https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview

Respostas: Código de Estado: 200

{
  "body": {
    "id": "msg_as3XIk1tpVP3hdHjWBGg3uG4",
    "object": "thread.message",
    "created_at": 1707298421,
    "thread_id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "role": "user",
    "content": [
      {
        "type": "text",
        "text": {
          "value": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces.",
          "annotations": []
        }
      }
    ],
    "file_ids": [],
    "assistant_id": null,
    "run_id": null,
    "metadata": {}
  }
}

Modificar - Mensagem

POST https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview

Modifica uma mensagem.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
thread_id caminho Yes cadeia (de caracteres) O ID da thread a que esta mensagem pertence.
message_id caminho Yes cadeia (de caracteres) O ID da mensagem a modificar.
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: application/json

Name Tipo Description Obrigatório Predefinição
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
No

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON messageObject

Exemplos

Exemplo

Modificar uma mensagem.

POST https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview

{
 "metadata": {
  "modified": "true",
  "user": "abc123"
 }
}

Respostas: Código de Estado: 200

{
  "body": {
    "id": "msg_abc123",
    "object": "thread.message",
    "created_at": 1699017614,
    "assistant_id": null,
    "thread_id": "thread_abc123",
    "run_id": null,
    "role": "user",
    "content": [
      {
        "type": "text",
        "text": {
          "value": "How does AI work? Explain it in simple terms.",
          "annotations": []
        }
      }
    ],
    "file_ids": [],
    "metadata": {
      "modified": "true",
      "user": "abc123"
    }
  }
}

Create - Thread And Run

Note

A API dos Assistentes está obsoleta e será retirada a 26 de agosto de 2026. Use o serviço geralmente disponível Microsoft Foundry Agents. Siga o guia de migração para atualizar as suas cargas de trabalho. Saiba mais.

POST https://{endpoint}/openai/threads/runs?api-version=2025-04-01-preview

Cria um tópico e executa-o num único pedido.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: application/json

Name Tipo Description Obrigatório Predefinição
assistant_id cadeia (de caracteres) O ID do assistente a usar para executar esta execução. Yes
instructions cadeia (de caracteres) Sobrescrita a mensagem de sistema padrão do assistente. Isto é útil para modificar o comportamento em cada execução. No
max_completion_tokens número inteiro O número máximo de tokens de conclusão que podem ser usados ao longo da corrida. A corrida faz o melhor esforço para usar apenas o número de fichas de conclusão especificado, ao longo de várias voltas da sequência. Se a sequência exceder o número de fichas de conclusão especificado, a sequência terminará com o estado incomplete. Consulte incomplete_details para mais informações.
No
max_prompt_tokens número inteiro O número máximo de tokens de prompt que podem ser usados ao longo da corrida. A corrida faz um esforço máximo para usar apenas o número de fichas de prompt especificado, ao longo de várias voltas da sequência. Se a sequência exceder o número de tokens de prompt especificados, a sequência termina com o estado incomplete. Consulte incomplete_details para mais informações.
No
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
No
modelo cadeia (de caracteres) O ID dos modelos a serem usados para executar esta execução. Se um valor for fornecido aqui, este irá sobrepor-se ao modelo associado ao assistente. Caso contrário, será utilizado o modelo associado ao assistente. No
chamadas_de_ferramentas_em_paralelo ParallelToolCalls Se deve ativar a chamada paralela de funções durante a utilização da ferramenta. No Verdade
formato_de_resposta assistantsApiResponseFormatOption Especifica o formato que o modelo deve produzir. Compatível com GPT-4o, GPT-4 Turbo e todos os modelos GPT-3.5 Turbo desde gpt-3.5-turbo-1106então.

Definir para { "type": "json_schema", "json_schema": {...} } ativa ativa Structured Outputs que garantem que o modelo corresponde ao esquema JSON fornecido. Saiba mais no guia de Saídas Estruturadas.

A definição para { "type": "json_object" } ativa o modo JSON, que garante que a mensagem gerada pelo modelo é JSON válida.

Importante: ao usar o modo JSON, deve também instruir o modelo a produzir JSON por si próprio através de uma mensagem do sistema ou do utilizador. Sem isto, o modelo pode gerar um fluxo interminável de espaços em branco até que a geração atinja o limite dos tokens, resultando num pedido de longa duração e aparentemente "preso". Note também que o conteúdo da mensagem pode ser parcialmente cortado se finish_reason="length", o que indica que a geração excedeu max_tokens ou a conversa excedeu o comprimento máximo do contexto.
No
fluxo boolean Se true, devolve um fluxo de eventos que ocorrem durante a Execução como eventos enviados pelo servidor, terminando quando a Execução entra num estado terminal com uma data: [DONE] mensagem.
No
stream_options chatCompletionStreamOptions Opções para resposta ao streaming. Só define isto quando defines stream: true.
No None
Temperatura number Que temperatura de amostragem usar, entre 0 e 2. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 tornam-na mais focada e determinística.
No 1
conversa createThreadRequest No
tool_choice assistantsApiToolChoiceOption Controla qual (se houver) ferramenta chamada pelo modelo.
none significa que o modelo não chama nenhuma ferramenta e, em vez disso, gera uma mensagem.
auto é o valor padrão e significa que o modelo pode escolher entre gerar uma mensagem ou chamar uma ferramenta.
Especificar uma ferramenta específica, como {"type": "file_search"} ou {"type": "function", "function": {"name": "my_function"}} obriga o modelo a chamar essa ferramenta.
No
tool_resources objecto Um conjunto de recursos usados pelas ferramentas do assistente. Os recursos são específicos para o tipo de ferramenta. Por exemplo, a code_interpreter ferramenta requer uma lista de IDs de ficheiros, enquanto file_search requer uma lista de IDs de armazenamento vetorial.
No
└─ interpretador_de_codigo objecto No
└─ identificadores_de_ficheiro matriz Uma lista de IDs de ficheiros disponibilizada à code_interpreter ferramenta. Pode haver um máximo de 20 ficheiros associados à ferramenta.
No []
└─ pesquisa_arquivo objecto No
└─ vector_store_ids matriz O ID do armazenamento vetorial associado a este assistente. Pode haver um máximo de 1 armazenamento vetorial associado ao assistente.
No
tools matriz Anule as ferramentas que o assistente pode usar nesta corrida. Isto é útil para modificar o comportamento em cada execução. No
top_p number Uma alternativa à amostragem com temperatura, chamada amostragem de núcleo, onde o modelo considera os resultados dos tokens com top_p massa de probabilidade. Portanto, 0,1 significa que apenas os tokens que compõem o top 10% massa de probabilidade são considerados.

Geralmente recomendamos alterar isto ou a temperatura, mas não ambos.
No 1
truncation_strategy truncationObject Controlos sobre como um thread será truncado antes da execução. Use isto para controlar a janela de contexto inicial da execução. No

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON runObject

Exemplos

Exemplo

Cria um tópico e executa-o num único pedido.

POST https://{endpoint}/openai/threads/runs?api-version=2025-04-01-preview

{
 "assistant_id": "asst_abc123",
 "thread": {
  "messages": [
   {
    "role": "user",
    "content": "Explain deep learning to a 5 year old."
   }
  ]
 }
}

Respostas: Código de Estado: 200

{
  "body": {
    "id": "run_abc123",
    "object": "thread.run",
    "created_at": 1699076792,
    "assistant_id": "asst_abc123",
    "thread_id": "thread_abc123",
    "status": "queued",
    "started_at": null,
    "expires_at": 1699077392,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": null,
    "required_action": null,
    "last_error": null,
    "model": "gpt-4-turbo",
    "instructions": "You are a helpful assistant.",
    "tools": [],
    "tool_resources": {},
    "metadata": {},
    "temperature": 1.0,
    "top_p": 1.0,
    "max_completion_tokens": null,
    "max_prompt_tokens": null,
    "truncation_strategy": {
      "type": "auto",
      "last_messages": null
    },
    "incomplete_details": null,
    "usage": null,
    "response_format": "auto",
    "tool_choice": "auto"
  }
}

Lista - Corridas

GET https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview

Devolve uma lista de execuções pertencentes a uma thread.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
thread_id caminho Yes cadeia (de caracteres) O ID do thread a que pertence a execução.
limit consulta No número inteiro Um limite para o número de objetos a devolver. O limite pode variar entre 1 e 100, e o padrão é 20.
order consulta No cadeia (de caracteres)
Valores possíveis: asc, desc
Ordena pelo created_at carimbo temporal dos objetos. asc para ordem ascendente e desc para ordem descendente.
depois consulta No cadeia (de caracteres) Um cursor para uso na paginação. after é um ID de objeto que define o seu lugar na lista. Por exemplo, se fizer um pedido de lista e receber 100 objetos, terminando em obj_foo, a sua chamada seguinte pode incluir depois=obj_foo para obter a página seguinte da lista.
antes consulta No cadeia (de caracteres) Um cursor para uso na paginação. before é um ID de objeto que define o seu lugar na lista. Por exemplo, se fizer um pedido de lista e receber 100 objetos, começando por obj_foo, a sua chamada seguinte pode incluir antes=obj_foo para obter a página anterior da lista.
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON listRunsResponse

Exemplos

Exemplo

Devolve uma lista de execuções pertencentes a uma thread.

GET https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview

Respostas: Código de Estado: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "run_abc123",
        "object": "thread.run",
        "created_at": 1699075072,
        "assistant_id": "asst_abc123",
        "thread_id": "thread_abc123",
        "status": "completed",
        "started_at": 1699075072,
        "expires_at": null,
        "cancelled_at": null,
        "failed_at": null,
        "completed_at": 1699075073,
        "last_error": null,
        "model": "gpt-4-turbo",
        "instructions": null,
        "incomplete_details": null,
        "tools": [
          {
            "type": "code_interpreter"
          }
        ],
        "tool_resources": {
          "code_interpreter": {
            "file_ids": [
              "file-abc123",
              "file-abc456"
            ]
          }
        },
        "metadata": {},
        "usage": {
          "prompt_tokens": 123,
          "completion_tokens": 456,
          "total_tokens": 579
        },
        "temperature": 1.0,
        "top_p": 1.0,
        "max_prompt_tokens": 1000,
        "max_completion_tokens": 1000,
        "truncation_strategy": {
          "type": "auto",
          "last_messages": null
        },
        "response_format": "auto",
        "tool_choice": "auto"
      },
      {
        "id": "run_abc456",
        "object": "thread.run",
        "created_at": 1699063290,
        "assistant_id": "asst_abc123",
        "thread_id": "thread_abc123",
        "status": "completed",
        "started_at": 1699063290,
        "expires_at": null,
        "cancelled_at": null,
        "failed_at": null,
        "completed_at": 1699063291,
        "last_error": null,
        "model": "gpt-4-turbo",
        "instructions": null,
        "incomplete_details": null,
        "tools": [
          {
            "type": "code_interpreter"
          }
        ],
        "tool_resources": {
          "code_interpreter": {
            "file_ids": [
              "file-abc123",
              "file-abc456"
            ]
          }
        },
        "metadata": {},
        "usage": {
          "prompt_tokens": 123,
          "completion_tokens": 456,
          "total_tokens": 579
        },
        "temperature": 1.0,
        "top_p": 1.0,
        "max_prompt_tokens": 1000,
        "max_completion_tokens": 1000,
        "truncation_strategy": {
          "type": "auto",
          "last_messages": null
        },
        "response_format": "auto",
        "tool_choice": "auto"
      }
    ],
    "first_id": "run_abc123",
    "last_id": "run_abc456",
    "has_more": false
  }
}

Criar - Correr

POST https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview

Cria uma corrida.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
thread_id caminho Yes cadeia (de caracteres) O ID do tópico a executar.
incluir[] consulta No matriz Uma lista de campos adicionais a incluir na resposta. Atualmente, o único valor suportado é step_details.tool_calls[*].file_search.results[*].content obter o conteúdo dos resultados de pesquisa do ficheiro.
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: application/json

Name Tipo Description Obrigatório Predefinição
additional_instructions cadeia (de caracteres) Acrescenta instruções adicionais no final das instruções para a corrida. Isto é útil para modificar o comportamento a cada execução sem sobrepor outras instruções. No
additional_messages matriz Adiciona mensagens adicionais ao tópico antes de criar a execução. No
assistant_id cadeia (de caracteres) O ID do assistente a usar para executar esta execução. Yes
instructions cadeia (de caracteres) Sobrescrita a mensagem de sistema padrão do assistente. Isto é útil para modificar o comportamento em cada execução. No
max_completion_tokens número inteiro O número máximo de tokens de conclusão que podem ser usados ao longo da corrida. A corrida faz o melhor esforço para usar apenas o número de fichas de conclusão especificado, ao longo de várias voltas da sequência. Se a sequência exceder o número de fichas de conclusão especificado, a sequência terminará com o estado incomplete. Consulte incomplete_details para mais informações.
No
max_prompt_tokens número inteiro O número máximo de tokens de prompt que podem ser usados ao longo da corrida. A corrida faz um esforço máximo para usar apenas o número de fichas de prompt especificado, ao longo de várias voltas da sequência. Se a sequência exceder o número de tokens de prompt especificados, a sequência termina com o estado incomplete. Consulte incomplete_details para mais informações.
No
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
No
modelo cadeia (de caracteres) O ID do Modelo a ser usado para executar esta execução. Se um valor for fornecido aqui, este irá sobrepor-se ao modelo associado ao assistente. Caso contrário, será utilizado o modelo associado ao assistente. No
chamadas_de_ferramentas_em_paralelo ParallelToolCalls Se deve ativar a chamada paralela de funções durante a utilização da ferramenta. No Verdade
formato_de_resposta assistantsApiResponseFormatOption Especifica o formato que o modelo deve produzir. Compatível com GPT-4o, GPT-4 Turbo e todos os modelos GPT-3.5 Turbo desde gpt-3.5-turbo-1106então.

Definir para { "type": "json_schema", "json_schema": {...} } ativa ativa Structured Outputs que garantem que o modelo corresponde ao esquema JSON fornecido. Saiba mais no guia de Saídas Estruturadas.

A definição para { "type": "json_object" } ativa o modo JSON, que garante que a mensagem gerada pelo modelo é JSON válida.

Importante: ao usar o modo JSON, deve também instruir o modelo a produzir JSON por si próprio através de uma mensagem do sistema ou do utilizador. Sem isto, o modelo pode gerar um fluxo interminável de espaços em branco até que a geração atinja o limite dos tokens, resultando num pedido de longa duração e aparentemente "preso". Note também que o conteúdo da mensagem pode ser parcialmente cortado se finish_reason="length", o que indica que a geração excedeu max_tokens ou a conversa excedeu o comprimento máximo do contexto.
No
fluxo boolean Se true, devolve um fluxo de eventos que ocorrem durante a Execução como eventos enviados pelo servidor, terminando quando a Execução entra num estado terminal com uma data: [DONE] mensagem.
No
Temperatura number Que temperatura de amostragem usar, entre 0 e 2. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 tornam-na mais focada e determinística.
No 1
tool_choice assistantsApiToolChoiceOption Controla qual (se houver) ferramenta chamada pelo modelo.
none significa que o modelo não chama nenhuma ferramenta e, em vez disso, gera uma mensagem.
auto é o valor padrão e significa que o modelo pode escolher entre gerar uma mensagem ou chamar uma ferramenta.
Especificar uma ferramenta específica, como {"type": "file_search"} ou {"type": "function", "function": {"name": "my_function"}} obriga o modelo a chamar essa ferramenta.
No
tools matriz Anule as ferramentas que o assistente pode usar nesta corrida. Isto é útil para modificar o comportamento em cada execução. No
top_p number Uma alternativa à amostragem com temperatura, chamada amostragem de núcleo, onde o modelo considera os resultados dos tokens com top_p massa de probabilidade. Portanto, 0,1 significa que apenas os tokens que compõem o top 10% massa de probabilidade são considerados.

Geralmente recomendamos alterar isto ou a temperatura, mas não ambos.
No 1
truncation_strategy truncationObject Controlos sobre como um thread será truncado antes da execução. Use isto para controlar a janela de contexto inicial da execução. No

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON runObject

Exemplos

Exemplo

Cria uma corrida.

POST https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview

{
 "assistant_id": "asst_abc123"
}

Respostas: Código de Estado: 200

{
  "body": {
    "id": "run_abc123",
    "object": "thread.run",
    "created_at": 1699063290,
    "assistant_id": "asst_abc123",
    "thread_id": "thread_abc123",
    "status": "queued",
    "started_at": 1699063290,
    "expires_at": null,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": 1699063291,
    "last_error": null,
    "model": "gpt-4-turbo",
    "instructions": null,
    "incomplete_details": null,
    "tools": [
      {
        "type": "code_interpreter"
      }
    ],
    "metadata": {},
    "usage": null,
    "temperature": 1.0,
    "top_p": 1.0,
    "max_prompt_tokens": 1000,
    "max_completion_tokens": 1000,
    "truncation_strategy": {
      "type": "auto",
      "last_messages": null
    },
    "response_format": "auto",
    "tool_choice": "auto"
  }
}

Foge - Corre

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview

Recupera uma corrida.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
thread_id caminho Yes cadeia (de caracteres) O ID dos tópicos que foram executados.
run_id caminho Yes cadeia (de caracteres) O ID da corrida para recuperar.
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON runObject

Exemplos

Exemplo

Tem uma corrida.

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview

Respostas: Código de Estado: 200

{
  "body": {
    "id": "run_HsO8tYM4K5AAMAHgK0J3om8Q",
    "object": "thread.run",
    "created_at": 1707303196,
    "assistant_id": "asst_JtTwHk28cIocgFXZPCBxhOzl",
    "thread_id": "thread_eRNwflE3ncDYak1np6MdMHJh",
    "status": "completed",
    "started_at": 1707303197,
    "expires_at": null,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": 1707303201,
    "last_error": null,
    "model": "gpt-4-1106-preview",
    "instructions": "You are an AI model that empowers every person and every organization on the planet to achieve more.",
    "tools": [],
    "file_ids": [],
    "metadata": {}
  }
}

Modificar - Executar

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview

Modifica uma corrida.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
thread_id caminho Yes cadeia (de caracteres) O ID dos tópicos que foram executados.
run_id caminho Yes cadeia (de caracteres) O ID da corrida a modificar.
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: application/json

Name Tipo Description Obrigatório Predefinição
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
No

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON runObject

Exemplos

Exemplo

Modifica uma corrida.

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview

{
 "metadata": {
  "user_id": "user_abc123"
 }
}

Respostas: Código de Estado: 200

{
  "body": {
    "id": "run_abc123",
    "object": "thread.run",
    "created_at": 1699075072,
    "assistant_id": "asst_abc123",
    "thread_id": "thread_abc123",
    "status": "completed",
    "started_at": 1699075072,
    "expires_at": null,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": 1699075073,
    "last_error": null,
    "model": "gpt-4-turbo",
    "instructions": null,
    "incomplete_details": null,
    "tools": [
      {
        "type": "code_interpreter"
      }
    ],
    "tool_resources": {
      "code_interpreter": {
        "file_ids": [
          "file-abc123",
          "file-abc456"
        ]
      }
    },
    "metadata": {
      "user_id": "user_abc123"
    },
    "usage": {
      "prompt_tokens": 123,
      "completion_tokens": 456,
      "total_tokens": 579
    },
    "temperature": 1.0,
    "top_p": 1.0,
    "max_prompt_tokens": 1000,
    "max_completion_tokens": 1000,
    "truncation_strategy": {
      "type": "auto",
      "last_messages": null
    },
    "response_format": "auto",
    "tool_choice": "auto"
  }
}

Submeter - Saídas de Ferramentas a Executar

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/submit_tool_outputs?api-version=2025-04-01-preview

Quando uma execução tem e status: "requires_action"required_action.type é submit_tool_outputs, este endpoint pode ser usado para submeter as saídas das chamadas de ferramenta depois de todas estarem concluídas. Todos os resultados devem ser submetidos num único pedido.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
thread_id caminho Yes cadeia (de caracteres) O ID dos threads a que esta execução pertence.
run_id caminho Yes cadeia (de caracteres) O ID da execução que requer a submissão da saída da ferramenta.
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: application/json

Name Tipo Description Obrigatório Predefinição
fluxo boolean Se true, devolve um fluxo de eventos que ocorrem durante a Execução como eventos enviados pelo servidor, terminando quando a Execução entra num estado terminal com uma data: [DONE] mensagem.
No
tool_outputs matriz Uma lista das ferramentas para as quais os resultados estão a ser submetidos. Yes

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON runObject

Exemplos

Exemplo

Quando uma execução tem e status: "requires_action"required_action.type é submit_tool_outputs, este endpoint pode ser usado para submeter as saídas das chamadas de ferramenta depois de todas estarem concluídas. Todos os resultados devem ser submetidos num único pedido.

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/submit_tool_outputs?api-version=2025-04-01-preview

{
 "tool_outputs": [
  {
   "tool_call_id": "call_001",
   "output": "70 degrees and sunny."
  }
 ]
}

Respostas: Código de Estado: 200

{
  "body": {
    "id": "run_123",
    "object": "thread.run",
    "created_at": 1699075592,
    "assistant_id": "asst_123",
    "thread_id": "thread_123",
    "status": "queued",
    "started_at": 1699075592,
    "expires_at": 1699076192,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": null,
    "last_error": null,
    "model": "gpt-4-turbo",
    "instructions": null,
    "tools": [
      {
        "type": "function",
        "function": {
          "name": "get_current_weather",
          "description": "Get the current weather in a given location",
          "parameters": {
            "type": "object",
            "properties": {
              "location": {
                "type": "string",
                "description": "The city and state, e.g. San Francisco, CA"
              },
              "unit": {
                "type": "string",
                "enum": [
                  "celsius",
                  "fahrenheit"
                ]
              }
            },
            "required": [
              "location"
            ]
          }
        }
      }
    ],
    "metadata": {},
    "usage": null,
    "temperature": 1.0,
    "top_p": 1.0,
    "max_prompt_tokens": 1000,
    "max_completion_tokens": 1000,
    "truncation_strategy": {
      "type": "auto",
      "last_messages": null
    },
    "response_format": "auto",
    "tool_choice": "auto"
  }
}

Cancelar - Correr

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/cancel?api-version=2025-04-01-preview

Cancela uma corrida que é in_progress.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
thread_id caminho Yes cadeia (de caracteres) O ID do thread a que esta execução pertence.
run_id caminho Yes cadeia (de caracteres) O ID da corrida para cancelar.
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON runObject

Exemplos

Exemplo

Cancela uma corrida que é in_progress.

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/cancel?api-version=2025-04-01-preview

Respostas: Código de Estado: 200

{
  "body": {
    "id": "run_abc123",
    "object": "thread.run",
    "created_at": 1699076126,
    "assistant_id": "asst_abc123",
    "thread_id": "thread_abc123",
    "status": "cancelling",
    "started_at": 1699076126,
    "expires_at": 1699076726,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": null,
    "last_error": null,
    "model": "gpt-4-turbo",
    "instructions": "You summarize books.",
    "tools": [
      {
        "type": "file_search"
      }
    ],
    "tool_resources": {
      "file_search": {
        "vector_store_ids": [
          "vs_123"
        ]
      }
    },
    "metadata": {},
    "usage": null,
    "temperature": 1.0,
    "top_p": 1.0,
    "response_format": "auto"
  }
}

Lista - Run Steps

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps?api-version=2025-04-01-preview

Devolve uma lista de passos de execução pertencentes a uma execução.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
thread_id caminho Yes cadeia (de caracteres) O ID do thread a que pertencem os passos de execução e execução.
run_id caminho Yes cadeia (de caracteres) O ID da corrida a que pertencem os passos de execução.
limit consulta No número inteiro Um limite para o número de objetos a devolver. O limite pode variar entre 1 e 100, e o padrão é 20.
order consulta No cadeia (de caracteres)
Valores possíveis: asc, desc
Ordena pelo created_at carimbo temporal dos objetos. asc para ordem ascendente e desc para ordem descendente.
depois consulta No cadeia (de caracteres) Um cursor para uso na paginação. after é um ID de objeto que define o seu lugar na lista. Por exemplo, se fizer um pedido de lista e receber 100 objetos, terminando em obj_foo, a sua chamada seguinte pode incluir depois=obj_foo para obter a página seguinte da lista.
antes consulta No cadeia (de caracteres) Um cursor para uso na paginação. before é um ID de objeto que define o seu lugar na lista. Por exemplo, se fizer um pedido de lista e receber 100 objetos, começando por obj_foo, a sua chamada seguinte pode incluir antes=obj_foo para obter a página anterior da lista.
Versão da API consulta Yes cadeia (de caracteres)
incluir[] consulta No matriz Uma lista de campos adicionais a incluir na resposta. Atualmente, o único valor suportado é step_details.tool_calls[*].file_search.results[*].content obter o conteúdo dos resultados de pesquisa do ficheiro.

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON listRunStepsResponse

Exemplos

Exemplo

Devolve uma lista de passos de execução pertencentes a uma execução.

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps?api-version=2025-04-01-preview

Respostas: Código de Estado: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "step_abc123",
        "object": "thread.run.step",
        "created_at": 1699063291,
        "run_id": "run_abc123",
        "assistant_id": "asst_abc123",
        "thread_id": "thread_abc123",
        "type": "message_creation",
        "status": "completed",
        "cancelled_at": null,
        "completed_at": 1699063291,
        "expired_at": null,
        "failed_at": null,
        "last_error": null,
        "step_details": {
          "type": "message_creation",
          "message_creation": {
            "message_id": "msg_abc123"
          }
        },
        "usage": {
          "prompt_tokens": 123,
          "completion_tokens": 456,
          "total_tokens": 579
        }
      }
    ],
    "first_id": "step_abc123",
    "last_id": "step_abc456",
    "has_more": false
  }
}

Passo de Correr - Correr

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps/{step_id}?api-version=2025-04-01-preview

Recupera um passo de corrida.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
thread_id caminho Yes cadeia (de caracteres) O ID do thread ao qual pertence o passo run e run.
run_id caminho Yes cadeia (de caracteres) O ID da execução à qual pertence o passo de execução.
step_id caminho Yes cadeia (de caracteres) O ID do passo de corrida a recuperar.
incluir[] consulta No matriz Uma lista de campos adicionais a incluir na resposta. Atualmente, o único valor suportado é step_details.tool_calls[*].file_search.results[*].content obter o conteúdo dos resultados de pesquisa do ficheiro.
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON runStepObject

Exemplos

Exemplo

Recupera um passo de corrida.

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps/{step_id}?api-version=2025-04-01-preview

Respostas: Código de Estado: 200

{
  "body": {
    "id": "step_abc123",
    "object": "thread.run.step",
    "created_at": 1699063291,
    "run_id": "run_abc123",
    "assistant_id": "asst_abc123",
    "thread_id": "thread_abc123",
    "type": "message_creation",
    "status": "completed",
    "cancelled_at": null,
    "completed_at": 1699063291,
    "expired_at": null,
    "failed_at": null,
    "last_error": null,
    "step_details": {
      "type": "message_creation",
      "message_creation": {
        "message_id": "msg_abc123"
      }
    },
    "usage": {
      "prompt_tokens": 123,
      "completion_tokens": 456,
      "total_tokens": 579
    }
  }
}

Lista - Lojas Vetoriais

GET https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview

Devolve uma lista de armazenamentos vetoriais.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
limit consulta No número inteiro Um limite para o número de objetos a devolver. O limite pode variar entre 1 e 100, e o padrão é 20.
order consulta No cadeia (de caracteres)
Valores possíveis: asc, desc
Ordena pelo created_at carimbo temporal dos objetos. asc para ordem ascendente e desc para ordem descendente.
depois consulta No cadeia (de caracteres) Um cursor para uso na paginação. after é um ID de objeto que define o seu lugar na lista. Por exemplo, se fizer um pedido de lista e receber 100 objetos, terminando em obj_foo, a sua chamada seguinte pode incluir depois=obj_foo para obter a página seguinte da lista.
antes consulta No cadeia (de caracteres) Um cursor para uso na paginação. before é um ID de objeto que define o seu lugar na lista. Por exemplo, se fizer um pedido de lista e receber 100 objetos, começando por obj_foo, a sua chamada seguinte pode incluir antes=obj_foo para obter a página anterior da lista.
Versão da API consulta Yes cadeia (de caracteres) Versão da API

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON listVectorStoresResponse

Exemplos

Exemplo

Devolve uma lista de armazenamentos vetoriais.

GET https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview

Respostas: Código de Estado: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "vs_abc123",
        "object": "vector_store",
        "created_at": 1699061776,
        "name": "Support FAQ",
        "bytes": 139920,
        "file_counts": {
          "in_progress": 0,
          "completed": 3,
          "failed": 0,
          "cancelled": 0,
          "total": 3
        }
      },
      {
        "id": "vs_abc456",
        "object": "vector_store",
        "created_at": 1699061776,
        "name": "Support FAQ v2",
        "bytes": 139920,
        "file_counts": {
          "in_progress": 0,
          "completed": 3,
          "failed": 0,
          "cancelled": 0,
          "total": 3
        }
      }
    ],
    "first_id": "vs_abc123",
    "last_id": "vs_abc456",
    "has_more": false
  }
}

Criar - Armazenamento Vetorial

POST https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview

Cria um armazenamento vetorial.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
Versão da API consulta Yes cadeia (de caracteres) Versão da API

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: application/json

Name Tipo Description Obrigatório Predefinição
chunking_strategy autoChunkingStrategyRequestParam ou staticChunkingStrategyRequestParam A estratégia de fragmentação usada para fragmentar o(s) ficheiro(s). Se não estiver definido, vou usar a auto estratégia. Só se aplica se file_ids estiver não vazio. No
expira após vectorStoreExpirationAfter A política de expiração para uma loja vetorial. No
identificadores_de_arquivo matriz Uma lista de IDs de ficheiros que o armazenamento vetorial deve usar. Útil para ferramentas que file_search permitem aceder a ficheiros. No
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
No
nome cadeia (de caracteres) O nome da loja vetorial. No

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON vectorStoreObject

Exemplos

Exemplo

Cria um armazenamento vetorial.

POST https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview

Respostas: Código de Estado: 200

{
  "body": {
    "id": "vs_abc123",
    "object": "vector_store",
    "created_at": 1699061776,
    "name": "Support FAQ",
    "bytes": 139920,
    "file_counts": {
      "in_progress": 0,
      "completed": 3,
      "failed": 0,
      "cancelled": 0,
      "total": 3
    }
  }
}

Obter - Vector Store

GET https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

Recupera um armazenamento vetorial.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
identificador_de_armazenamento_vetor caminho Yes cadeia (de caracteres) O ID da loja vetorial a recuperar.
Versão da API consulta Yes cadeia (de caracteres) Versão da API

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON vectorStoreObject

Exemplos

Exemplo

Recupera um armazenamento vetorial.

GET https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

Respostas: Código de Estado: 200

{
  "body": {
    "id": "vs_abc123",
    "object": "vector_store",
    "created_at": 1699061776
  }
}

Modificar - Armazenamento Vetorial

POST https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

Modifica um armazenamento vetorial.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
identificador_de_armazenamento_vetor caminho Yes cadeia (de caracteres) O ID da loja vetorial a modificar.
Versão da API consulta Yes cadeia (de caracteres) Versão da API

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: application/json

Name Tipo Description Obrigatório Predefinição
expira após vectorStoreExpirationAfter A política de expiração para uma loja vetorial. No
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
No
nome cadeia (de caracteres) O nome da loja vetorial. No

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON vectorStoreObject

Exemplos

Exemplo

Modifica um armazenamento vetorial.

POST https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

{
 "name": "Support FAQ"
}

Respostas: Código de Estado: 200

{
  "body": {
    "id": "vs_abc123",
    "object": "vector_store",
    "created_at": 1699061776,
    "name": "Support FAQ",
    "bytes": 139920,
    "file_counts": {
      "in_progress": 0,
      "completed": 3,
      "failed": 0,
      "cancelled": 0,
      "total": 3
    }
  }
}

Delete - Armazenamento Vetorial

DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

Apaga um armazenamento vetorial.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
identificador_de_armazenamento_vetor caminho Yes cadeia (de caracteres) O ID da loja vetorial para apagar.
Versão da API consulta Yes cadeia (de caracteres) Versão da API

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON deleteVectorStoreResponse

Exemplos

Exemplo

Apaga um armazenamento vetorial.

DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

Respostas: Código de Estado: 200

{
  "body": {
    "id": "vs_abc123",
    "object": "vector_store.deleted",
    "deleted": true
  }
}

Lista - Ficheiros de Armazenamento Vetorial

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview

Devolve uma lista de ficheiros de armazenamento vetorial.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
identificador_de_armazenamento_vetor caminho Yes cadeia (de caracteres) O ID da loja vetorial a que pertencem os ficheiros.
limit consulta No número inteiro Um limite para o número de objetos a devolver. O limite pode variar entre 1 e 100, e o padrão é 20.
order consulta No cadeia (de caracteres)
Valores possíveis: asc, desc
Ordena pelo created_at carimbo temporal dos objetos. asc para ordem ascendente e desc para ordem descendente.
depois consulta No cadeia (de caracteres) Um cursor para uso na paginação. after é um ID de objeto que define o seu lugar na lista. Por exemplo, se fizer um pedido de lista e receber 100 objetos, terminando em obj_foo, a sua chamada seguinte pode incluir depois=obj_foo para obter a página seguinte da lista.
antes consulta No cadeia (de caracteres) Um cursor para uso na paginação. before é um ID de objeto que define o seu lugar na lista. Por exemplo, se fizer um pedido de lista e receber 100 objetos, começando por obj_foo, a sua chamada seguinte pode incluir antes=obj_foo para obter a página anterior da lista.
filtro consulta No cadeia (de caracteres)
Valores possíveis: in_progress, completed, failed, cancelled
Filtrar por estado do ficheiro. Uma de in_progress, completed, failed, cancelled.
Versão da API consulta Yes cadeia (de caracteres) Versão da API

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON listVectorStoreFilesResponse

Exemplos

Exemplo

Devolve uma lista de ficheiros de armazenamento vetorial.

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview

Respostas: Código de Estado: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "file-abc123",
        "object": "vector_store.file",
        "created_at": 1699061776,
        "vector_store_id": "vs_abc123"
      },
      {
        "id": "file-abc456",
        "object": "vector_store.file",
        "created_at": 1699061776,
        "vector_store_id": "vs_abc123"
      }
    ],
    "first_id": "file-abc123",
    "last_id": "file-abc456",
    "has_more": false
  }
}

Create - Ficheiro de Armazenamento Vetorial

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview

Crie um ficheiro de armazenamento vetorial anexando um ficheiro a um armazenamento vetorial.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
identificador_de_armazenamento_vetor caminho Yes cadeia (de caracteres) O ID da loja vetorial para a qual criar um ficheiro.
Versão da API consulta Yes cadeia (de caracteres) Versão da API

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: application/json

Name Tipo Description Obrigatório Predefinição
chunking_strategy chunkingStrategyRequestParam A estratégia de fragmentação usada para fragmentar o(s) ficheiro(s). Se não estiver definido, vou usar a auto estratégia. No
identificação_de_ficheiro cadeia (de caracteres) Um ID de ficheiro que a loja vetorial deve usar. Útil para ferramentas que file_search permitem aceder a ficheiros. Yes

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON vectorStoreFileObject

Exemplos

Exemplo

Crie um ficheiro de armazenamento vetorial anexando um ficheiro a um armazenamento vetorial.

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview

{
 "file_id": "file-abc123"
}

Respostas: Código de Estado: 200

{
  "body": {
    "id": "file-abc123",
    "object": "vector_store.file",
    "created_at": 1699061776,
    "usage_bytes": 1234,
    "vector_store_id": "vs_abcd",
    "status": "completed",
    "last_error": null
  }
}

Get - Ficheiro de Armazenamento Vetorial

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview

Recupera um ficheiro de armazenamento vetorial.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
identificador_de_armazenamento_vetor caminho Yes cadeia (de caracteres) O ID da loja vetorial a que o ficheiro pertence.
identificação_de_ficheiro caminho Yes cadeia (de caracteres) O ID do ficheiro que está a ser recuperado.
Versão da API consulta Yes cadeia (de caracteres) Versão da API

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON vectorStoreFileObject

Exemplos

Exemplo

Recupera um ficheiro de armazenamento vetorial.

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview

Respostas: Código de Estado: 200

{
  "body": {
    "id": "file-abc123",
    "object": "vector_store.file",
    "created_at": 1699061776,
    "vector_store_id": "vs_abcd",
    "status": "completed",
    "last_error": null
  }
}

Eliminar - Ficheiro de Armazenamento Vetorial

DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview

Apagar um ficheiro de armazenamento vetorial. Isto remove o ficheiro da loja vetorial, mas o ficheiro em si não será eliminado. Para eliminar o ficheiro, use o endpoint delete file.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
identificador_de_armazenamento_vetor caminho Yes cadeia (de caracteres) O ID da loja vetorial a que o ficheiro pertence.
identificação_de_ficheiro caminho Yes cadeia (de caracteres) O ID do ficheiro para apagar.
Versão da API consulta Yes cadeia (de caracteres) Versão da API

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON deleteVectorStoreFileResponse

Exemplos

Exemplo

Apagar um ficheiro de armazenamento vetorial. Isto remove o ficheiro da loja vetorial, mas o ficheiro em si não será eliminado. Para eliminar o ficheiro, use o endpoint delete file.

DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview

Respostas: Código de Estado: 200

{
  "body": {
    "id": "file_abc123",
    "object": "vector_store.file.deleted",
    "deleted": true
  }
}

Updatevectorstorefileattributes

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview

Atualizar atributos num ficheiro de armazenamento vetorial.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
identificador_de_armazenamento_vetor caminho Yes cadeia (de caracteres) O ID do armazenamento vetorial a que o ficheiro pertence.
identificação_de_ficheiro caminho Yes cadeia (de caracteres) O ID do ficheiro para atualizar atributos.

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: application/json

Name Tipo Description Obrigatório Predefinição
attributes VectorStoreFileAttributes Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado e para consultar objetos através da API ou do dashboard. As teclas são cadeias com um comprimento máximo de 64 caracteres. Os valores são cadeias com um comprimento máximo de 512 caracteres, booleanos ou números.
Yes

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON vectorStoreFileObject

Recuperar o conteúdo do ficheiro de armazenamento vetorial

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}/content?api-version=2025-04-01-preview

Recupere o conteúdo analisado de um ficheiro de armazenamento vetorial.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
identificador_de_armazenamento_vetor caminho Yes cadeia (de caracteres) O ID do armazenamento vetorial.
identificação_de_ficheiro caminho Yes cadeia (de caracteres) O ID do ficheiro dentro da loja vetorial.

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON VectorStoreFileContentResponse

Armazenamento vetorial de pesquisa

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/search?api-version=2025-04-01-preview

Pesquise numa loja vetorial por blocos relevantes com base num filtro de consulta e atributos de ficheiro.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
identificador_de_armazenamento_vetor caminho Yes cadeia (de caracteres) O ID da loja vetorial para pesquisar.

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: application/json

Name Tipo Description Obrigatório Predefinição
filters Filtro de Comparação ou Filtro Composto Um filtro a aplicar com base nos atributos do ficheiro. No
máximo_número_de_resultados número inteiro O número máximo de resultados a devolver. Este número deve estar entre 1 e 50, inclusive. No 10
consulta String ou array Uma cadeia de consulta para uma pesquisa Yes
opções_de_classificação objecto Opções de classificação para pesquisa. No
└─ classificador enumeração
Valores possíveis: auto, default-2024-11-15
No
└─ limiar_de_pontuação number No 0
rewrite_query boolean Se deve reescrever a consulta em linguagem natural para pesquisa vetorial. No Falso

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON VectorStoreSearchResultsPage

Criar - Lote de Ficheiro de Armazenamento Vetorial

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches?api-version=2025-04-01-preview

Cria um lote de ficheiro de armazenamento vetorial.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
identificador_de_armazenamento_vetor caminho Yes cadeia (de caracteres) O ID da loja vetorial para a qual criar um File Batch.
Versão da API consulta Yes cadeia (de caracteres) Versão da API

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: application/json

Name Tipo Description Obrigatório Predefinição
chunking_strategy chunkingStrategyRequestParam A estratégia de fragmentação usada para fragmentar o(s) ficheiro(s). Se não estiver definido, vou usar a auto estratégia. No
identificadores_de_arquivo matriz Uma lista de IDs de ficheiro que a loja vetorial deve usar. Útil para ferramentas que file_search permitem aceder a ficheiros. Yes

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON vectorStoreFileBatchObject

Exemplos

Exemplo

Cria um lote de ficheiro de armazenamento vetorial.

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches?api-version=2025-04-01-preview

{
 "file_ids": [
  "file-abc123",
  "file-abc456"
 ]
}

Respostas: Código de Estado: 200

{
  "id": "vsfb_abc123",
  "object": "vector_store.file_batch",
  "created_at": 1699061776,
  "vector_store_id": "vs_abc123",
  "status": "in_progress",
  "file_counts": {
    "in_progress": 1,
    "completed": 1,
    "failed": 0,
    "cancelled": 0,
    "total": 0
  }
}

Get - Lote de ficheiros de armazenamento vetorial

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}?api-version=2025-04-01-preview

Recupera um lote de ficheiro de armazenamento vetorial.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
identificador_de_armazenamento_vetor caminho Yes cadeia (de caracteres) O ID do armazenamento vetorial a que pertence o lote de ficheiros.
batch_id caminho Yes cadeia (de caracteres) O ID do lote de ficheiros que está a ser recuperado.
Versão da API consulta Yes cadeia (de caracteres) Versão da API

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON vectorStoreFileBatchObject

Exemplos

Exemplo

Recupera um lote de ficheiro de armazenamento vetorial.

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}?api-version=2025-04-01-preview

Respostas: Código de Estado: 200

{
  "body": {
    "id": "vsfb_abc123",
    "object": "vector_store.file_batch",
    "created_at": 1699061776,
    "vector_store_id": "vs_abc123",
    "status": "in_progress",
    "file_counts": {
      "in_progress": 1,
      "completed": 1,
      "failed": 0,
      "cancelled": 0,
      "total": 0
    }
  }
}

Cancelar - Lote de ficheiros de armazenamento vetorial

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/cancel?api-version=2025-04-01-preview

Cancela um lote de ficheiros de armazenamento vetorial. Isto tenta cancelar o processamento dos ficheiros neste lote o mais rapidamente possível.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
identificador_de_armazenamento_vetor caminho Yes cadeia (de caracteres) O ID do armazenamento vetorial a que pertence o lote de ficheiros.
batch_id caminho Yes cadeia (de caracteres) O ID do lote de ficheiros para cancelar.
Versão da API consulta Yes cadeia (de caracteres) Versão da API

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON vectorStoreFileBatchObject

Exemplos

Exemplo

Cancela um lote de ficheiros de armazenamento vetorial. Isto tenta cancelar o processamento dos ficheiros neste lote o mais rapidamente possível.

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/cancel?api-version=2025-04-01-preview

Respostas: Código de Estado: 200

{
  "body": {
    "id": "vsfb_abc123",
    "object": "vector_store.file_batch",
    "created_at": 1699061776,
    "vector_store_id": "vs_abc123",
    "status": "cancelling",
    "file_counts": {
      "in_progress": 12,
      "completed": 3,
      "failed": 0,
      "cancelled": 0,
      "total": 15
    }
  }
}

Lista - Ficheiros Batch de Armazenamento Vetorial

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/files?api-version=2025-04-01-preview

Devolve uma lista de ficheiros de armazenamento vetorial em lote.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
identificador_de_armazenamento_vetor caminho Yes cadeia (de caracteres) O ID da loja vetorial a que pertencem os ficheiros.
batch_id caminho Yes cadeia (de caracteres) O ID do lote de ficheiros a que pertencem os ficheiros.
limit consulta No número inteiro Um limite para o número de objetos a devolver. O limite pode variar entre 1 e 100, e o padrão é 20.
order consulta No cadeia (de caracteres)
Valores possíveis: asc, desc
Ordena pelo created_at carimbo temporal dos objetos. asc para ordem ascendente e desc para ordem descendente.
depois consulta No cadeia (de caracteres) Um cursor para uso na paginação. after é um ID de objeto que define o seu lugar na lista. Por exemplo, se fizer um pedido de lista e receber 100 objetos, terminando em obj_foo, a sua chamada seguinte pode incluir depois=obj_foo para obter a página seguinte da lista.
antes consulta No cadeia (de caracteres) Um cursor para uso na paginação. before é um ID de objeto que define o seu lugar na lista. Por exemplo, se fizer um pedido de lista e receber 100 objetos, começando por obj_foo, a sua chamada seguinte pode incluir antes=obj_foo para obter a página anterior da lista.
filtro consulta No cadeia (de caracteres)
Valores possíveis: in_progress, completed, failed, cancelled
Filtrar por estado do ficheiro. Uma de in_progress, completed, failed, cancelled.
Versão da API consulta Yes cadeia (de caracteres) Versão da API

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON listVectorStoreFilesResponse

Exemplos

Exemplo

Devolve uma lista de ficheiros de armazenamento vetorial.

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/files?api-version=2025-04-01-preview

Respostas: Código de Estado: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "file-abc123",
        "object": "vector_store.file",
        "created_at": 1699061776,
        "vector_store_id": "vs_abc123"
      },
      {
        "id": "file-abc456",
        "object": "vector_store.file",
        "created_at": 1699061776,
        "vector_store_id": "vs_abc123"
      }
    ],
    "first_id": "file-abc123",
    "last_id": "file-abc456",
    "has_more": false
  }
}

Criar - Realtimesession

POST https://{endpoint}/openai/realtimeapi/sessions?api-version=2025-04-01-preview

Crie um token de API efémero para utilização em aplicações do lado do cliente com a API em tempo real. Pode ser configurado com os mesmos parâmetros de sessão do session.update evento cliente. Responde com um objeto de sessão, além de uma client_secret chave que contém um token efémero de API utilizável que pode ser usado para autenticar clientes de navegador para a API de Tempo Real.

Órgão do Pedido

Tipo de conteúdo: application/json

Name Tipo Description Obrigatório Predefinição
input_audio_format enumeração O formato do áudio de entrada. As opções são pcm16, g711_ulaw, ou g711_alaw.
Para pcm16, o áudio de entrada deve ser PCM de 16 bits a uma taxa de amostragem de 24kHz, ordem de um único canal (mono) e little-endian.

Valores possíveis: pcm16, g711_ulaw, g711_alaw
No
input_audio_noise_reduction objecto Configuração para redução de ruído de áudio de entrada. Isto pode ser configurado para null desligar.
A redução de ruído filtra o áudio adicionado ao buffer de áudio de entrada antes de ser enviado para o VAD e para o modelo.
Filtrar o áudio pode melhorar a precisão do VAD e da deteção de curvas (reduzindo falsos positivos) e o desempenho do modelo ao melhorar a perceção do áudio de entrada.
No
└─ tipo enumeração Tipo de redução de ruído. near_field é para microfones de conversa próxima, como auscultadores, é far_field para microfones de campo distante, como portáteis ou microfones de sala de conferências.

Valores possíveis: near_field, far_field
No
input_audio_transcription objecto Configuração para transcrição de áudio de entrada, por defeito desligado e pode ser definido para null desligar uma vez ligado. A transcrição de áudio de entrada não é nativa do modelo, pois o modelo consome áudio diretamente. A transcrição corre de forma assíncrona através do endpoint de Transcrições e deve ser tratada como orientação do conteúdo áudio de entrada, em vez do que exatamente o modelo ouviu. O cliente pode, opcionalmente, definir a linguagem e pedir para transcrição, que oferecem orientação adicional ao serviço de transcrição.
No
└─ língua cadeia (de caracteres) A linguagem do áudio de entrada. Fornecer a linguagem de entrada no formato ISO-639-1 (por exemplo, en) melhora a precisão e a latência.
No
└─ modelo cadeia (de caracteres) O modelo a usar para transcrição, as opções atuais são gpt-4o-transcribe, gpt-4o-transcribe-diarize, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15, e whisper-1.
No
└─ Prompt cadeia (de caracteres) Um texto opcional para guiar o estilo do modelo ou continuar um segmento áudio anterior.
Para whisper-1, o prompt é uma lista de palavras-chave.
Para gpt-4o-transcribe modelos, o prompt é uma cadeia de texto livre, por exemplo "espera palavras relacionadas com tecnologia".
No
instructions cadeia (de caracteres) As instruções padrão do sistema (ou seja, a mensagem do sistema) antecediam as chamadas de modelo. Este campo permite ao cliente orientar o modelo nas respostas desejadas. O modelo pode ser instruído sobre o conteúdo e o formato das respostas (por exemplo, "seja extremamente sucinto", "aja amigável", "aqui estão exemplos de boas respostas") e sobre o comportamento áudio (por exemplo, "fala depressa", "injeta emoção na tua voz", "ri frequentemente"). As instruções não são garantidas de serem seguidas pelo modelo, mas fornecem orientação ao modelo sobre o comportamento desejado.

Note que o servidor define instruções padrão que serão usadas se este campo não estiver definido e que são visíveis no session.created evento no início da sessão.
No
max_response_output_tokens inteiro ou cadeia Número máximo de tokens de saída para uma resposta de um único assistente, incluindo chamadas de ferramenta. Fornecer um número inteiro entre 1 e 4096 para limitar os tokens de saída, ou inf para o número máximo de tokens disponíveis para um dado modelo. Por defeito, é inf.
No
Modalidades O conjunto de modalidades com que o modelo pode responder. Para desativar o áudio, defina para ["texto"].
No
modelo cadeia (de caracteres) O nome da implantação usada para esta sessão.
No
output_audio_format enumeração O formato do áudio de saída. As opções são pcm16, g711_ulaw, ou g711_alaw.
Para pcm16, o áudio de saída é amostrado a uma taxa de 24kHz.

Valores possíveis: pcm16, g711_ulaw, g711_alaw
No
Temperatura number Temperatura de amostragem para o modelo, limitada a [0,6, 1,2]. Para modelos áudio, recomenda-se vivamente uma temperatura de 0,8 para melhor desempenho.
No 0.8
tool_choice cadeia (de caracteres) Como o modelo escolhe as ferramentas. As opções são auto, none, required, ou especificar uma função.
No automóvel
tools matriz Ferramentas (funções) disponíveis para o modelo. No
turn_detection objecto Configuração para deteção de turnos, ether Server VAD ou Semântic VAD. Isto pode ser definido para null desligar, caso em que o cliente terá de ativar manualmente a resposta do modelo.
O VAD do servidor significa que o modelo deteta o início e o fim da fala com base no volume do áudio e responde no final da fala do utilizador.
O VAD semântico é mais avançado e utiliza um modelo de deteção de curvas (em conjunto com o VAD) para estimar semanticamente se o utilizador terminou de falar, definindo depois dinamicamente um timeout com base nesta probabilidade. Por exemplo, se o áudio do utilizador se esmorecer com uhhm, o modelo terá uma baixa probabilidade de fim de turno e esperará mais tempo para que o utilizador continue a falar. Isto pode ser útil para conversas mais naturais, mas pode ter uma latência mais elevada.
No
└─ criar_resposta boolean Se deve ou não gerar automaticamente uma resposta quando ocorre um evento de paragem VAD.
No Verdade
└─ Entusiasmo enumeração Usado apenas para semantic_vad o modo. A vontade do modelo de responder. low Vai esperar mais tempo que o utilizador continue a falar, high vai responder mais rapidamente. auto é o padrão e é equivalente a medium.

Valores possíveis: low, medium, high, auto
No
└─ resposta_de_interrupção boolean Se deve ou não interromper automaticamente qualquer resposta em curso com saída para a conversa padrão (ou seja, conversation de auto) quando ocorre um evento de início VAD.
No Verdade
└─ preenchimento_prefixo_ms número inteiro Usado apenas para server_vad o modo. Quantidade de áudio a incluir antes do VAD detetar a fala (em milissegundos). Por defeito é 300ms.
No
└─ duração_do_silêncio_ms número inteiro Usado apenas para server_vad o modo. Duração do silêncio para detetar a paragem da fala (em milissegundos). Por defeito é 500ms. Com valores mais curtos, o modelo responderá mais rapidamente, mas pode entrar em pausas curtas do utilizador.
No
└─ limiar number Usado apenas para server_vad o modo. Limiar de ativação para VAD (0.0 a 1.0), este é por defeito 0.5. Um limiar mais elevado exigirá um áudio mais alto para ativar o modelo, podendo assim ter melhor desempenho em ambientes ruidosos.
No
└─ tipo enumeração Tipo de deteção de curva.

Valores possíveis: server_vad, semantic_vad
No
Voz VoiceIdsShared No

Respostas

Código de Estado: 200

Descrição: Sessão criada com sucesso.

Tipo de conteúdo Type Description
Application/JSON RealtimeSessionCreateResponse

Criar - Transcriptionrealtimesession

POST https://{endpoint}/openai/realtimeapi/transcription_sessions?api-version=2025-04-01-preview

Crie um token API efémero para utilização em aplicações do lado do cliente com a API Realtime especificamente para transcrições em tempo real. Pode ser configurado com os mesmos parâmetros de sessão do transcription_session.update evento cliente. Responde com um objeto de sessão, além de uma client_secret chave que contém um token efémero de API utilizável que pode ser usado para autenticar clientes de navegador para a API de Tempo Real.

Órgão do Pedido

Tipo de conteúdo: application/json

Name Tipo Description Obrigatório Predefinição
include matriz O conjunto de itens a incluir na transcrição. Os itens atualmente disponíveis são:
- item.input_audio_transcription.logprobs
No
input_audio_format enumeração O formato do áudio de entrada. As opções são pcm16, g711_ulaw, ou g711_alaw.
Para pcm16, o áudio de entrada deve ser PCM de 16 bits a uma taxa de amostragem de 24kHz, ordem de um único canal (mono) e little-endian.

Valores possíveis: pcm16, g711_ulaw, g711_alaw
No
input_audio_noise_reduction objecto Configuração para redução de ruído de áudio de entrada. Isto pode ser configurado para null desligar.
A redução de ruído filtra o áudio adicionado ao buffer de áudio de entrada antes de ser enviado para o VAD e para o modelo.
Filtrar o áudio pode melhorar a precisão do VAD e da deteção de curvas (reduzindo falsos positivos) e o desempenho do modelo ao melhorar a perceção do áudio de entrada.
No
└─ tipo enumeração Tipo de redução de ruído. near_field é para microfones de conversa próxima, como auscultadores, é far_field para microfones de campo distante, como portáteis ou microfones de sala de conferências.

Valores possíveis: near_field, far_field
No
input_audio_transcription objecto Configuração para transcrição áudio de entrada. O cliente pode, opcionalmente, definir a linguagem e pedir para transcrição, que oferecem orientação adicional ao serviço de transcrição.
No
└─ língua cadeia (de caracteres) A linguagem do áudio de entrada. Fornecer a linguagem de entrada no formato ISO-639-1 (por exemplo, en) melhora a precisão e a latência.
No
└─ modelo enumeração O modelo a usar para transcrição, as opções atuais são gpt-4o-transcribe, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15, e whisper-1.

Valores possíveis: gpt-4o-transcribe, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15, whisper-1
No
└─ Prompt cadeia (de caracteres) Um texto opcional para guiar o estilo do modelo ou continuar um segmento áudio anterior.
Para whisper-1, o prompt é uma lista de palavras-chave.
Para gpt-4o-transcribe modelos, o prompt é uma cadeia de texto livre, por exemplo "espera palavras relacionadas com tecnologia".
No
Modalidades O conjunto de modalidades com que o modelo pode responder. Para desativar o áudio, defina para ["texto"].
No
turn_detection objecto Configuração para deteção de turnos, ether Server VAD ou Semântic VAD. Isto pode ser definido para null desligar, caso em que o cliente terá de ativar manualmente a resposta do modelo.
O VAD do servidor significa que o modelo deteta o início e o fim da fala com base no volume do áudio e responde no final da fala do utilizador.
O VAD semântico é mais avançado e utiliza um modelo de deteção de curvas (em conjunto com o VAD) para estimar semanticamente se o utilizador terminou de falar, definindo depois dinamicamente um timeout com base nesta probabilidade. Por exemplo, se o áudio do utilizador se esmorecer com uhhm, o modelo terá uma baixa probabilidade de fim de turno e esperará mais tempo para que o utilizador continue a falar. Isto pode ser útil para conversas mais naturais, mas pode ter uma latência mais elevada.
No
└─ criar_resposta boolean Se deve ou não gerar automaticamente uma resposta quando ocorre um evento de paragem VAD. Não disponível para sessões de transcrição.
No Verdade
└─ Entusiasmo enumeração Usado apenas para semantic_vad o modo. A vontade do modelo de responder. low Vai esperar mais tempo que o utilizador continue a falar, high vai responder mais rapidamente. auto é o padrão e é equivalente a medium.

Valores possíveis: low, medium, high, auto
No
└─ resposta_de_interrupção boolean Se deve ou não interromper automaticamente qualquer resposta em curso com saída para a conversa padrão (ou seja, conversation de auto) quando ocorre um evento de início VAD. Não disponível para sessões de transcrição.
No Verdade
└─ preenchimento_prefixo_ms número inteiro Usado apenas para server_vad o modo. Quantidade de áudio a incluir antes do VAD detetar a fala (em milissegundos). Por defeito é 300ms.
No
└─ duração_do_silêncio_ms número inteiro Usado apenas para server_vad o modo. Duração do silêncio para detetar a paragem da fala (em milissegundos). Por defeito é 500ms. Com valores mais curtos, o modelo responderá mais rapidamente, mas pode entrar em pausas curtas do utilizador.
No
└─ limiar number Usado apenas para server_vad o modo. Limiar de ativação para VAD (0.0 a 1.0), este é por defeito 0.5. Um limiar mais elevado exigirá um áudio mais alto para ativar o modelo, podendo assim ter melhor desempenho em ambientes ruidosos.
No
└─ tipo enumeração Tipo de deteção de curva.

Valores possíveis: server_vad, semantic_vad
No

Respostas

Código de Estado: 200

Descrição: Sessão criada com sucesso.

Tipo de conteúdo Type Description
Application/JSON RealtimeTranscriptionSessionCreateResponse

Respostas

POST https://{endpoint}/openai/responses?api-version=2025-04-01-preview

Cria uma resposta modelo.

Órgão do Pedido

Tipo de conteúdo: application/json

Name Tipo Description Obrigatório Predefinição
include matriz No
dados introduzidos String ou array Entradas de modelo Yes
instructions cadeia (de caracteres) Insere uma mensagem do sistema (ou do desenvolvedor) como o primeiro elemento no contexto do modelo.

Ao usar junto com previous_response_id, as instruções de uma resposta anterior não serão transferidas para a resposta seguinte. Isto facilita a troca de mensagens do sistema (ou do programador) em novas respostas.
No
max_output_tokens número inteiro Um limite superior para o número de tokens que podem ser gerados para uma resposta, incluindo tokens de saída visíveis e estado de conversa.
No
chamadas_de_ferramentas_em_paralelo boolean Se permitir que o modelo execute chamadas de ferramenta em paralelo.
No Verdade
previous_response_id cadeia (de caracteres) O ID único da resposta anterior ao modelo. Usa isto para criar conversas com vários turnos. Saiba mais sobre o estado da conversa.
No
reasoning Reasoning Opções de configuração para modelos de raciocínio. No
armazenar boolean Se deve armazenar a resposta gerada do modelo para recuperação posterior via API.
No Verdade
fluxo boolean Se definido como verdadeiro, os dados de resposta do modelo serão transmitidos para o cliente à medida que são gerados usando eventos enviados pelo servidor.
Consulte a secção de Streaming abaixo para mais informações.
No Falso
enviar SMS objecto Opções de configuração para uma resposta de texto do modelo. Pode ser texto simples ou dados JSON estruturados. Saiba mais:
- Entradas e saídas de texto
- Saídas Estruturadas
No
└─ formato TextResponseFormatConfiguration Um objeto que especifica o formato que o modelo deve gerar.

Configurar { "type": "json_schema" } ativa o Structured Outputs, que garante que o modelo corresponde ao seu esquema JSON fornecido.

O formato padrão é { "type": "text" } sem opções adicionais.

Não recomendado para gpt-4o e modelos mais recentes:

Configurar para { "type": "json_object" } ativar o modo JSON mais antigo, que garante que a mensagem gerada pelo modelo é JSON válida. O uso json_schema é preferido para modelos que o suportam.
No
tool_choice OpçõesDeEscolhaFerramenta ou TiposEscolhaFerramenta ou FunçãoDeEscolhaFerramenta Como o modelo deve escolher qual ferramenta (ou ferramentas) usar ao gerar uma resposta. Consulte o tools parâmetro para ver como especificar que ferramentas o modelo pode chamar.
No
tools matriz Um conjunto de ferramentas que o modelo pode invocar enquanto gera uma resposta. Podes especificar qual ferramenta usar definindo o tool_choice parâmetro.

As duas categorias de ferramentas que pode fornecer ao modelo são:

- Ferramentas integradas: Ferramentas fornecidas pela OpenAI que estendem o
Capacidades do modelo
No
truncation enumeração A estratégia de truncamento a usar para a resposta do modelo.
- auto: Se o contexto desta resposta e das anteriores exceder o tamanho da janela de contexto do modelo, o modelo truncará a resposta para se ajustar à janela de contexto, eliminando itens de entrada a meio da conversa.
- disabled (padrão): Se uma resposta de modelo exceder o tamanho da janela de contexto para um modelo, o pedido falhará com um erro 400.

Valores possíveis: auto, disabled
No

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON response
text/event-stream responseStreamEvent

Código de Estado: padrão

Descrição: Serviço indisponível

Tipo de conteúdo Type Description
Application/JSON errorResponse

API de Respostas - itens de entrada

GET https://{endpoint}/openai/responses/{response_id}?api-version=2025-04-01-preview

Recupera uma resposta do modelo com o ID indicado.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
response_id caminho Yes cadeia (de caracteres) O ID da resposta para recuperar.
include consulta No matriz Campos adicionais a incluir na resposta. Consulte o include parâmetro para criação de Resposta acima para mais informações.

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON response

Código de Estado: padrão

Descrição: Serviço indisponível

Tipo de conteúdo Type Description
Application/JSON errorResponse

Apagar resposta

DELETE https://{endpoint}/openai/responses/{response_id}?api-version=2025-04-01-preview

Apaga uma resposta de modelo com o ID indicado.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
response_id caminho Yes cadeia (de caracteres) O ID da resposta para apagar.

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Respostas

Código de Estado: 200

Descrição: OK

Código de Estado: 404

Descrição: Não Encontrado

Tipo de conteúdo Type Description
Application/JSON error

Código de Estado: padrão

Descrição: Serviço indisponível

Tipo de conteúdo Type Description
Application/JSON errorResponse

API de respostas - lista de itens de resposta

GET https://{endpoint}/openai/responses/{response_id}/input_items?api-version=2025-04-01-preview

Devolve uma lista de itens de entrada para uma dada resposta.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
response_id caminho Yes cadeia (de caracteres) O ID da resposta para recuperar itens de entrada para.
limit consulta No número inteiro Um limite para o número de objetos a devolver. O limite pode variar entre 1 e 100, e o padrão é 20.
order consulta No cadeia (de caracteres)
Valores possíveis: asc, desc
A ordem para devolver os itens de entrada. O padrão é asc.
- asc: Devolve os itens de entrada por ordem crescente.
- desc: Devolver os itens de entrada por ordem decrescente.
depois consulta No cadeia (de caracteres) Um ID de item para listar os itens depois, usado na paginação.
antes consulta No cadeia (de caracteres) Um ID de item para listar itens anteriores, usado na paginação.

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON responseItemList

Components

errorResponse

Name Tipo Description Obrigatório Predefinição
erro error No

Base de Dados de Erros

Name Tipo Description Obrigatório Predefinição
código cadeia (de caracteres) No
mensagem cadeia (de caracteres) No

erro

Name Tipo Description Obrigatório Predefinição
inner_error innerError Erro interno com detalhes adicionais. No
param cadeia (de caracteres) No
tipo cadeia (de caracteres) No

innerError

Erro interno com detalhes adicionais.

Name Tipo Description Obrigatório Predefinição
código innerErrorCode Códigos de erro para o objeto de erro interno. No
content_filter_results contentFilterPromptResults Informação sobre a categoria de filtragem de conteúdos (ódio, sexual, violência, self_harm), se foi detetada, bem como o nível de gravidade (escala very_low, baixa, média, alta que determina a intensidade e o nível de risco do conteúdo nocivo) e se foi filtrada ou não. Informação sobre conteúdos de jailbreak e palavrões, se foram detetados e se foram filtrados ou não. E informação sobre a lista de bloqueio de clientes, se foi filtrada e o seu ID. No

innerErrorCode

Códigos de erro para o objeto de erro interno.

Propriedade valor
Description Códigos de erro para o objeto de erro interno.
Type cadeia (de caracteres)
Valores ResponsibleAIPolicyViolation

dalleErrorResponse

Name Tipo Description Obrigatório Predefinição
erro dalleError No

dalleError

Name Tipo Description Obrigatório Predefinição
inner_error dalleInnerError Erro interno com detalhes adicionais. No
param cadeia (de caracteres) No
tipo cadeia (de caracteres) No

dalleInnerError

Erro interno com detalhes adicionais.

Name Tipo Description Obrigatório Predefinição
código innerErrorCode Códigos de erro para o objeto de erro interno. No
content_filter_results dalleFilterResults Informação sobre a categoria de filtragem de conteúdos (ódio, sexual, violência, self_harm), se foi detetada, bem como o nível de gravidade (escala very_low, baixa, média, alta que determina a intensidade e o nível de risco do conteúdo nocivo) e se foi filtrada ou não. Informação sobre conteúdos de jailbreak e palavrões, se foram detetados e se foram filtrados ou não. E informação sobre a lista de bloqueio de clientes, se foi filtrada e o seu ID. No
Proposta de Melhorias: - Certificar-se de que as frases e termos são traduzidos corretamente para refletir o mesmo significado do texto de origem. - Adaptar quaisquer termos em inglês que possam ser traduzidos naturalmente para português, preservando o seu significado. - Corrigir quaisquer questões gramaticais para aumentar a fluência e a legibilidade em português. - Usar a estrutura de frases em português natural para que a tradução soe nativa. - Verificar o uso apropriado de pontuação e registro para o português. cadeia (de caracteres) O prompt que foi usado para gerar a imagem, caso tenha havido alguma revisão ao prompt. No

contentFilterCompletionTextSpan

Descreve um intervalo dentro do texto de conclusão gerado. O Offset 0 é o primeiro ponto de código UTF32 do texto de completamento.

Name Tipo Description Obrigatório Predefinição
completion_end_offset número inteiro Deslocamento do primeiro ponto de código UTF32 que está excluído do vão. Este campo é sempre igual a completion_start_offset para vãos vazios. Este campo é sempre maior do que completion_start_offset para vãos não vazios. Yes
completion_start_offset número inteiro Deslocamento do ponto de código UTF32 que inicia o vão. Yes

resultadoBaseFiltroDeConteúdo

Name Tipo Description Obrigatório Predefinição
filtered boolean Yes

resultadoDeSeveridadeDoFiltroDeConteúdo

Name Tipo Description Obrigatório Predefinição
filtered boolean Yes
severity cadeia (de caracteres) No

resultado de deteção de filtro de conteúdo

Name Tipo Description Obrigatório Predefinição
detected boolean No
filtered boolean Yes

Detetado filtro de conteúdo com resultado de citação

Name Tipo Description Obrigatório Predefinição
citação objecto No
└─ URL cadeia (de caracteres) No
└─ licença cadeia (de caracteres) No

contentFilterDetectedWithCompletionTextSpansResult

Name Tipo Description Obrigatório Predefinição
details matriz No

contentFilterIdResult

Name Tipo Description Obrigatório Predefinição
filtered boolean Yes
id cadeia (de caracteres) No

baseDeResultadosDoFiltroDeConteúdo

Informação sobre os resultados do filtro de conteúdo.

Name Tipo Description Obrigatório Predefinição
custom_blocklists contentFilterDetailedResults Resultados de filtragem de conteúdo com um detalhe dos IDs dos filtros de conteúdo para os segmentos filtrados. No
erro Base de erro No
hate resultadoDaGravidadeDoFiltroDeConteúdo No
profanity resultadoDetetadoDoFiltroDeConteúdo No
self_harm resultadoDaGravidadeDoFiltroDeConteúdo No
sexual resultadoDaGravidadeDoFiltroDeConteúdo No
violence resultadoDaGravidadeDoFiltroDeConteúdo No

contentFilterPromptResults

Informação sobre a categoria de filtragem de conteúdos (ódio, sexual, violência, self_harm), se foi detetada, bem como o nível de gravidade (escala very_low, baixa, média, alta que determina a intensidade e o nível de risco do conteúdo nocivo) e se foi filtrada ou não. Informação sobre conteúdos de jailbreak e palavrões, se foram detetados e se foram filtrados ou não. E informação sobre a lista de bloqueio de clientes, se foi filtrada e o seu ID.

Name Tipo Description Obrigatório Predefinição
custom_blocklists contentFilterDetailedResults Resultados de filtragem de conteúdo com um detalhe dos IDs dos filtros de conteúdo para os segmentos filtrados. No
erro Base de erro No
hate resultadoDaGravidadeDoFiltroDeConteúdo No
indirect_attack resultadoDetetadoDoFiltroDeConteúdo No
jailbreak resultadoDetetadoDoFiltroDeConteúdo No
profanity resultadoDetetadoDoFiltroDeConteúdo No
self_harm resultadoDaGravidadeDoFiltroDeConteúdo No
sexual resultadoDaGravidadeDoFiltroDeConteúdo No
violence resultadoDaGravidadeDoFiltroDeConteúdo No

resultadosEscolhaFiltroConteúdo

Informação sobre a categoria de filtragem de conteúdos (ódio, sexual, violência, self_harm), se foi detetada, bem como o nível de gravidade (escala very_low, baixa, média, alta que determina a intensidade e o nível de risco do conteúdo nocivo) e se foi filtrada ou não. Informação sobre texto de terceiros e palavrões, se foram detetados e se foram filtrados ou não. E informação sobre a lista de bloqueio de clientes, se foi filtrada e o seu ID.

Name Tipo Description Obrigatório Predefinição
custom_blocklists contentFilterDetailedResults Resultados de filtragem de conteúdo com um detalhe dos IDs dos filtros de conteúdo para os segmentos filtrados. No
erro Base de erro No
hate resultadoDaGravidadeDoFiltroDeConteúdo No
profanity resultadoDetetadoDoFiltroDeConteúdo No
protected_material_code filtroDeConteúdoDetetadoComResultadoDeCitação No
protected_material_text resultadoDetetadoDoFiltroDeConteúdo No
self_harm resultadoDaGravidadeDoFiltroDeConteúdo No
sexual resultadoDaGravidadeDoFiltroDeConteúdo No
ungrounded_material contentFilterDetectedWithCompletionTextSpansResult No
violence resultadoDaGravidadeDoFiltroDeConteúdo No

contentFilterDetailedResults

Resultados de filtragem de conteúdo com um detalhe dos IDs dos filtros de conteúdo para os segmentos filtrados.

Name Tipo Description Obrigatório Predefinição
details matriz No
filtered boolean Yes

Resultado do Filtro de Prompt

Resultados de filtragem de conteúdo para um único prompt no pedido.

Name Tipo Description Obrigatório Predefinição
content_filter_results contentFilterPromptResults Informação sobre a categoria de filtragem de conteúdos (ódio, sexual, violência, self_harm), se foi detetada, bem como o nível de gravidade (escala very_low, baixa, média, alta que determina a intensidade e o nível de risco do conteúdo nocivo) e se foi filtrada ou não. Informação sobre conteúdos de jailbreak e palavrões, se foram detetados e se foram filtrados ou não. E informação sobre a lista de bloqueio de clientes, se foi filtrada e o seu ID. No
prompt_index número inteiro No

promptFiltrarResultados

Filtrar conteúdo resulta em zero ou mais prompts no pedido. Num pedido de streaming, os resultados de diferentes prompts podem chegar em horários distintos ou em ordens distintas.

Nenhuma propriedade definida para este componente.

Resultados do Filtro de Conteúdo do Dalle

Informação sobre os resultados do filtro de conteúdo.

Name Tipo Description Obrigatório Predefinição
hate resultadoDaGravidadeDoFiltroDeConteúdo No
self_harm resultadoDaGravidadeDoFiltroDeConteúdo No
sexual resultadoDaGravidadeDoFiltroDeConteúdo No
violence resultadoDaGravidadeDoFiltroDeConteúdo No

dalleFilterResults

Informação sobre a categoria de filtragem de conteúdos (ódio, sexual, violência, self_harm), se foi detetada, bem como o nível de gravidade (escala very_low, baixa, média, alta que determina a intensidade e o nível de risco do conteúdo nocivo) e se foi filtrada ou não. Informação sobre conteúdos de jailbreak e palavrões, se foram detetados e se foram filtrados ou não. E informação sobre a lista de bloqueio de clientes, se foi filtrada e o seu ID.

Name Tipo Description Obrigatório Predefinição
custom_blocklists contentFilterDetailedResults Resultados de filtragem de conteúdo com um detalhe dos IDs dos filtros de conteúdo para os segmentos filtrados. No
hate resultadoDaGravidadeDoFiltroDeConteúdo No
jailbreak resultadoDetetadoDoFiltroDeConteúdo No
profanity resultadoDetetadoDoFiltroDeConteúdo No
self_harm resultadoDaGravidadeDoFiltroDeConteúdo No
sexual resultadoDaGravidadeDoFiltroDeConteúdo No
violence resultadoDaGravidadeDoFiltroDeConteúdo No

chatConclucoesPedidoComum

Name Tipo Description Obrigatório Predefinição
penalização de frequência number Número entre -2.0 e 2.0. Valores positivos penalizam novos tokens com base na sua frequência existente no texto até agora, diminuindo a probabilidade do modelo repetir a mesma frase literalmente. No 0
logit_bias objecto Modificar a probabilidade de tokens especificados aparecerem na conclusão. Aceita um objeto json que mapeia tokens (especificados pelo seu ID de token no tokenizador) para um valor de viés associado de -100 a 100. Matematicamente, o viés é adicionado aos logits gerados pelo modelo antes da amostragem. O efeito exato varia consoante o modelo, mas valores entre -1 e 1 devem diminuir ou aumentar a probabilidade de seleção; valores como -100 ou 100 devem resultar numa proibição ou na seleção exclusiva do token relevante. No
max_completion_tokens número inteiro Um limite superior para o número de tokens que podem ser gerados para uma conclusão, incluindo tokens de saída visíveis e tokens de raciocínio. No
máximo de tokens número inteiro O número máximo de tokens permitido para a resposta gerada. Por defeito, o número de tokens que o modelo pode devolver será (4096 - tokens de prompt). Isto não é compatível com modelos da série O1. No 4096
metadados objecto Etiquetas e valores definidos pelo programador usados para filtrar completações no painel de completações armazenadas. No
presence_penalty number Número entre -2.0 e 2.0. Valores positivos penalizam novos tokens com base em que aparecem ou não no texto até agora, aumentando a probabilidade do modelo de falar sobre novos temas. No 0
pare String ou array Até 4 sequências em que a API deixa de gerar mais tokens. No
armazenar boolean Se devemos ou não armazenar a saída deste pedido de conclusão de chat para uso nos nossos produtos de destilação ou avaliação de modelos. No
fluxo boolean Se definido, são enviados deltas parciais da mensagem, como no ChatGPT. Os tokens são enviados apenas como eventos de dados enviados pelo servidor à medida que ficam disponíveis, com o fluxo terminado por uma data: [DONE] mensagem. No Falso
Temperatura number Que temperatura de amostragem usar, entre 0 e 2. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 tornam-na mais focada e determinística.
Geralmente recomendamos alterar isto ou top_p , mas não ambos.
No 1
top_p number Uma alternativa à amostragem com temperatura, chamada amostragem de núcleo, onde o modelo considera os resultados dos tokens com top_p massa de probabilidade. Portanto, 0,1 significa que apenas os tokens que compõem o top 10% massa de probabilidade são considerados.
Geralmente recomendamos alterar isto ou temperature , mas não ambos.
No 1
utilizador cadeia (de caracteres) Um identificador único que representa o seu utilizador final, que pode ajudar o Azure OpenAI a monitorizar e detetar abusos. No

criarPedidoDeConclusão

Name Tipo Description Obrigatório Predefinição
melhor_de número inteiro Gera best_of completações do lado do servidor e devolve o "melhor" (aquele com maior probabilidade logaritária por token). Os resultados não podem ser transmitidos em streaming.

Quando usado com n, best_of controla o número de concluições candidatas e n especifica quantas devolver. best_of deve ser maior que n.

Nota: Como este parâmetro gera muitas conclusãos, pode rapidamente consumir a sua quota de tokens. Use com cuidado e certifique-se de que tem definições razoáveis para max_tokens e stop.
No 1
Echo boolean Repita o prompt além da conclusão
No Falso
penalização de frequência number Número entre -2.0 e 2.0. Valores positivos penalizam novos tokens com base na sua frequência existente no texto até agora, diminuindo a probabilidade do modelo repetir a mesma frase literalmente.
No 0
logit_bias objecto Modificar a probabilidade de tokens especificados aparecerem na conclusão.

Aceita um objeto JSON que mapeia tokens (especificados pelo seu ID de token no tokenizador GPT) para um valor de viés associado de -100 a 100. Matematicamente, o viés é adicionado aos logits gerados pelo modelo antes da amostragem. O efeito exato varia consoante o modelo, mas valores entre -1 e 1 devem diminuir ou aumentar a probabilidade de seleção; valores como -100 ou 100 devem resultar numa proibição ou na seleção exclusiva do token relevante.

Por exemplo, pode passar {"50256": -100} para impedir que o <token |endoftext|> seja gerado.
No None
Logprobs número inteiro Inclua as probabilidades logarítmicas dos logprobs tokens de saída mais prováveis, bem como os tokens escolhidos. Por exemplo, se logprobs for 5, a API devolverá uma lista dos 5 tokens mais prováveis. A API irá sempre devolver o logprob do token amostrado, pelo que pode haver até logprobs+1 até elementos na resposta.

O valor máximo para logprobs é 5.
No None
máximo de tokens número inteiro O número máximo de tokens que pode ser gerado na conclusão.

A contagem de tokens do teu prompt plus max_tokens não pode exceder o comprimento do contexto do modelo.
No 16
n número inteiro Quantas conclusãos gerar para cada prompt.

Nota: Como este parâmetro gera muitas conclusãos, pode rapidamente consumir a sua quota de tokens. Use com cuidado e certifique-se de que tem definições razoáveis para max_tokens e stop.
No 1
presence_penalty number Número entre -2.0 e 2.0. Valores positivos penalizam novos tokens com base em que aparecem ou não no texto até agora, aumentando a probabilidade do modelo de falar sobre novos temas.
No 0
avisar String ou array O(s) prompt(s) para gerar completações para codificados como uma string, array de strings, array de tokens ou array de tokens.

Note que <|endoftext|> é o separador de documentos que o modelo vê durante o treino, por isso, se não for especificado um prompt, o modelo gerará como se fosse do início de um novo documento.
Yes
seed número inteiro Se especificado, o nosso sistema faz o melhor esforço para amostrar deterministicamente, de modo que pedidos repetidos com os mesmos seed parâmetros e devolvam o mesmo resultado.

O determinismo não é garantido, e deves consultar o system_fingerprint parâmetro de resposta para monitorizar as alterações no backend.
No
pare String ou array Até 4 sequências em que a API deixa de gerar mais tokens. O texto devolvido não conterá a sequência de paragens.
No
fluxo boolean Se deves reverter o progresso parcial. Se ativados, os tokens são enviados apenas como eventos enviados pelo servidor apenas por dados à medida que ficam disponíveis, com o fluxo terminado por uma data: [DONE] mensagem. Exemplo Python código.
No Falso
sufixo cadeia (de caracteres) O sufixo que surge após a conclusão do texto inserido.

Este parâmetro é suportado apenas para gpt-3.5-turbo-instruct.
No None
Temperatura number Que temperatura de amostragem usar, entre 0 e 2. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 tornam-na mais focada e determinística.

Geralmente recomendamos alterar isto ou top_p , mas não ambos.
No 1
top_p number Uma alternativa à amostragem com temperatura, chamada amostragem de núcleo, onde o modelo considera os resultados dos tokens com top_p massa de probabilidade. Portanto, 0,1 significa que apenas os tokens que compõem o top 10% massa de probabilidade são considerados.

Geralmente recomendamos alterar isto ou temperature , mas não ambos.
No 1
utilizador cadeia (de caracteres) Um identificador único que representa o seu utilizador final, que pode ajudar a monitorizar e detetar abusos.
No

createCompletionResponse

Representa uma resposta de conclusão da API. Nota: tanto os objetos de resposta transmitidos como os não transmitidos partilham a mesma forma (ao contrário do endpoint do chat).

Name Tipo Description Obrigatório Predefinição
choices matriz A lista de escolhas de conclusão que o modelo gerou para o prompt de entrada. Yes
criado número inteiro O carimbo temporal do Unix (em segundos) de quando a conclusão foi criada. Yes
id cadeia (de caracteres) Um identificador único para a completação. Yes
modelo cadeia (de caracteres) O modelo utilizado para a conclusão. Yes
objecto enumeração O tipo de objeto, que é sempre "text_completion"
Valores possíveis: text_completion
Yes
prompt_filter_results promptFilterResults Filtrar conteúdo resulta em zero ou mais prompts no pedido. Num pedido de streaming, os resultados de diferentes prompts podem chegar em horários distintos ou em ordens distintas. No
system_fingerprint cadeia (de caracteres) Esta impressão digital representa a configuração do backend com que o modelo corre.

Pode ser usado em conjunto com o seed parâmetro de pedido para perceber quando foram feitas alterações no backend que possam afetar o determinismo.
No
utilização conclusãoUso Estatísticas de utilização para o pedido de conclusão. No

criarPedidoDeConclusãoDeChat

Name Tipo Description Obrigatório Predefinição
Áudio objecto Parâmetros para saída de áudio. É obrigatório quando a saída de áudio é solicitada com modalities: ["audio"]. No
└─ formato enumeração Especifica o formato de áudio de saída. Deve ser um dos wav, mp3, flac, opus, ou pcm16.

Valores possíveis: wav, mp3, flac, opus, pcm16
No
└─ voz enumeração Especifica o tipo de voz. As vozes suportadas são alloy, echo, fable, onyx, nova, e shimmer.

Valores possíveis: alloy, echo, fable, onyx, nova, shimmer
No
data_sources matriz As entradas de configuração para as extensões de chat do Azure OpenAI que as utilizam.
Esta especificação adicional é compatível apenas com o Azure OpenAI.
No
penalização de frequência number Número entre -2.0 e 2.0. Valores positivos penalizam novos tokens com base na sua frequência existente no texto até agora, diminuindo a probabilidade do modelo repetir a mesma frase literalmente.
No 0
function_call string ou chatCompletionFunctionCallOption Descontinuado em favor de tool_choice.

Controla qual (se existe) função é chamada pelo modelo.
none significa que o modelo não chama uma função e, em vez disso, gera uma mensagem.
auto significa que o modelo pode escolher entre gerar uma mensagem ou chamar uma função.
Especificar uma função particular via {"name": "my_function"} obriga o modelo a chamar essa função.

none é o padrão quando não há funções presentes. auto é o padrão se as funções estiverem presentes.
No
functions matriz Descontinuado em favor de tools.

Uma lista de funções para as quais o modelo pode gerar entradas JSON.
No
logit_bias objecto Modificar a probabilidade de tokens especificados aparecerem na conclusão.

Aceita um objeto JSON que mapeia os tokens (especificados pelo seu ID de token no tokenizador) para um valor de viés associado de -100 a 100. Matematicamente, o viés é adicionado aos logits gerados pelo modelo antes da amostragem. O efeito exato varia consoante o modelo, mas valores entre -1 e 1 devem diminuir ou aumentar a probabilidade de seleção; valores como -100 ou 100 devem resultar numa proibição ou na seleção exclusiva do token relevante.
No None
Logprobs boolean Se deve devolver as probabilidades logarítmicas dos tokens de saída ou não. Se for verdadeiro, devolve as probabilidades logarítmicas de cada token de saída devolvido no content de message. No Falso
max_completion_tokens número inteiro Um limite superior para o número de tokens que podem ser gerados para uma conclusão, incluindo tokens de saída visíveis e tokens de raciocínio. No
máximo de tokens número inteiro O número máximo de tokens que podem ser gerados na conclusão do chat.

O comprimento total dos tokens de entrada e dos tokens gerados é limitado pelo comprimento de contexto do modelo.
No
Mensagens matriz Uma lista de mensagens que compõem a conversa até agora. Exemplo Python código. Yes
metadados objecto Etiquetas e valores definidos pelo programador usados para filtrar completações no painel de completações armazenadas. No
Modalidades ChatCompletionModalities Tipos de saída que gostaria que o modelo gerasse para este pedido.
A maioria dos modelos é capaz de gerar texto, que é o padrão:

["text"]

O gpt-4o-audio-preview modelo também pode ser usado para gerar áudio. Para solicitar que este modelo gere tanto respostas de texto como áudio, pode usar:

["text", "audio"]
No
n número inteiro Quantas opções de conclusão de chat gerar para cada mensagem de entrada. Note que será cobrado com base no número de tokens gerados em todas as opções. Mantenha-se n para 1 minimizar custos. No 1
chamadas_de_ferramentas_em_paralelo ParallelToolCalls Se deve ativar a chamada paralela de funções durante a utilização da ferramenta. No Verdade
predição PredictionContent Configuração para uma Saída Prevista, que pode melhorar significativamente os tempos de resposta quando grandes partes da resposta do modelo são conhecidas antecipadamente. Isto é mais comum quando se está a regenerar um ficheiro com apenas pequenas alterações na maior parte do conteúdo. No
presence_penalty number Número entre -2.0 e 2.0. Valores positivos penalizam novos tokens com base em que aparecem ou não no texto até agora, aumentando a probabilidade do modelo de falar sobre novos temas.
No 0
esforço de raciocínio enumeração Apenas modelos O1

Limita o esforço de raciocínio para modelos de raciocínio.

Os valores atualmente suportados são low, medium, e high. Reduzir o esforço de raciocínio pode resultar em respostas mais rápidas e menos tokens usados no raciocínio numa resposta.
Valores possíveis: low, medium, high
No
formato_de_resposta ResponseFormatText ou ResponseFormatJsonObject ou ResponseFormatJsonSchema Um objeto que especifica o formato que o modelo deve gerar. Compatível com GPT-4o, GPT-4o mini, GPT-4 Turbo e todos os modelos GPT-3.5 Turbo mais recentes do que gpt-3.5-turbo-1106.

A definição para { "type": "json_schema", "json_schema": {...} } ativa ativa Saídas Estruturadas que garantem que o modelo corresponde ao seu esquema JSON fornecido.

A definição para { "type": "json_object" } ativa o modo JSON, que garante que a mensagem gerada pelo modelo é JSON válida.

Importante: ao usar o modo JSON, deve também instruir o modelo a produzir JSON por si próprio através de uma mensagem do sistema ou do utilizador. Sem isto, o modelo pode gerar um fluxo interminável de espaços em branco até que a geração atinja o limite dos tokens, resultando num pedido de longa duração e aparentemente "preso". Note também que o conteúdo da mensagem pode ser parcialmente cortado se finish_reason="length", o que indica que a geração excedeu max_tokens ou a conversa excedeu o comprimento máximo do contexto.
No
seed número inteiro Esta funcionalidade está em Beta.
Se especificado, o nosso sistema faz o melhor esforço para amostrar deterministicamente, de modo que pedidos repetidos com os mesmos seed parâmetros e devolvam o mesmo resultado.
O determinismo não é garantido, e deves consultar o system_fingerprint parâmetro de resposta para monitorizar as alterações no backend.
No
pare String ou array Até 4 sequências em que a API deixa de gerar mais tokens.
No
armazenar boolean Se devemos ou não armazenar a saída deste pedido de conclusão de chat para uso nos nossos produtos de destilação ou avaliação de modelos. No
fluxo boolean Se definido, são enviados deltas parciais da mensagem, como no ChatGPT. Os tokens são enviados apenas como eventos de dados enviados pelo servidor à medida que ficam disponíveis, com o fluxo terminado por uma data: [DONE] mensagem. Exemplo Python código.
No Falso
stream_options chatCompletionStreamOptions Opções para resposta ao streaming. Só define isto quando defines stream: true.
No None
Temperatura number Que temperatura de amostragem usar, entre 0 e 2. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 tornam-na mais focada e determinística.

Geralmente recomendamos alterar isto ou top_p , mas não ambos.
No 1
tool_choice chatCompletionToolChoiceOption Controla qual (se houver) ferramenta chamada pelo modelo. none significa que o modelo não chama nenhuma ferramenta e, em vez disso, gera uma mensagem. auto significa que o modelo pode escolher entre gerar uma mensagem ou chamar uma ou mais ferramentas. required significa que o modelo tem de chamar uma ou mais ferramentas. Especificar uma ferramenta específica obriga {"type": "function", "function": {"name": "my_function"}} o modelo a chamar essa ferramenta. none é o padrão quando não há ferramentas presentes. auto é o padrão se houver ferramentas presentes. No
tools matriz Uma lista de ferramentas que o modelo pode chamar. Atualmente, apenas funções são suportadas como ferramenta. Use isto para fornecer uma lista de funções para as quais o modelo pode gerar entradas JSON. São suportadas um máximo de 128 funções.
No
top_logprobs número inteiro Um número inteiro entre 0 e 20 que especifica o número de tokens mais prováveis a serem retornados em cada posição do token, cada um com uma probabilidade logarítmica associada. logprobs deve ser definido para true se este parâmetro for utilizado. No
top_p number Uma alternativa à amostragem com temperatura, chamada amostragem de núcleo, onde o modelo considera os resultados dos tokens com top_p massa de probabilidade. Portanto, 0,1 significa que apenas os tokens que compõem o top 10% massa de probabilidade são considerados.

Geralmente recomendamos alterar isto ou temperature , mas não ambos.
No 1
utilizador cadeia (de caracteres) Um identificador único que representa o seu utilizador final, que pode ajudar a monitorizar e detetar abusos.
No
user_security_context userSecurityContext O contexto de segurança do utilizador contém vários parâmetros que descrevem a própria aplicação de IA e o utilizador final que interage com a aplicação de IA. Estes campos ajudam as suas equipas de operações de segurança a investigar e mitigar incidentes de segurança, fornecendo uma abordagem abrangente para proteger as suas aplicações de IA. Saiba mais sobre como proteger aplicações de IA usando Microsoft Defender para a Cloud. No

userSecurityContext

O contexto de segurança do utilizador contém vários parâmetros que descrevem a própria aplicação de IA e o utilizador final que interage com a aplicação de IA. Estes campos ajudam as suas equipas de operações de segurança a investigar e mitigar incidentes de segurança, fornecendo uma abordagem abrangente para proteger as suas aplicações de IA. Saiba mais sobre como proteger aplicações de IA usando Microsoft Defender para a Cloud.

Name Tipo Description Obrigatório Predefinição
application_name cadeia (de caracteres) O nome da candidatura. Informações pessoais sensíveis não devem ser incluídas neste campo. No
end_user_id cadeia (de caracteres) Este identificador é o Microsoft Entra ID (anteriormente Azure Active Directory), ID de objeto de utilizador, usado para autenticar utilizadores finais dentro da aplicação de IA generativa. Informações pessoais sensíveis não devem ser incluídas neste campo. No
end_user_tenant_id cadeia (de caracteres) O ID de tenant da Microsoft 365 a que o utilizador final pertence. É obrigatório quando a aplicação de IA generativa é multi-inquilino. No
source_ip cadeia (de caracteres) Captura o endereço IP original do cliente, aceitando tanto os formatos IPv4 como IPv6. No

Funções de Conclusão de Chat

Name Tipo Description Obrigatório Predefinição
description cadeia (de caracteres) Uma descrição do que a função faz, usada pelo modelo para escolher quando e como chamar a função. No
nome cadeia (de caracteres) O nome da função a ser chamada. Devem ser de a z, de A a Z, de 0 a 9, ou conter sublinhados e traços, com um comprimento máximo de 64. Yes
parameters FunctionParameters Os parâmetros que a função aceita, descritos como um objeto de Esquema JSON. Consulte o guia para exemplos e a referência do Esquema JSON para documentação sobre o formato.

Omitir parameters define uma função com uma lista de parâmetros vazia.
No

Opção de chamada de função do chatCompletion

Especificar uma função particular via {"name": "my_function"} obriga o modelo a chamar essa função.

Name Tipo Description Obrigatório Predefinição
nome cadeia (de caracteres) O nome da função a chamar. Yes

chatCompletionFunctionParameters

Os parâmetros que a função aceita, descritos como um objeto de Esquema JSON. Consulte o guia para exemplos e a referência do Esquema JSON para documentação sobre o formato.

Nenhuma propriedade definida para este componente.

mensagemDeSolicitaçãoDeConclusãoDoChat

Este componente pode ser um dos seguintes:

ChatCompletionRequestDeveloperMessage

Instruções fornecidas pelo programador que o modelo deve seguir, independentemente das mensagens enviadas pelo utilizador. Nos modelos O1 e mais recentes, developer as mensagens substituem as anteriores system .

Name Tipo Description Obrigatório Predefinição
conteúdo String ou array O conteúdo da mensagem do programador. Yes
nome cadeia (de caracteres) Um nome opcional para o participante. Fornece a informação do modelo para diferenciar entre participantes do mesmo papel. No
função enumeração O papel do autor das mensagens, neste caso developer.
Valores possíveis: developer
Yes

MensagemDoSistemaDeSolicitaçãoDeConclusãoDoChat

Name Tipo Description Obrigatório Predefinição
conteúdo String ou array O conteúdo da mensagem do sistema. Yes
nome cadeia (de caracteres) Um nome opcional para o participante. Fornece a informação do modelo para diferenciar entre participantes do mesmo papel. No
função enumeração O papel do autor das mensagens, neste caso system.
Valores possíveis: system
Yes

chatCompletionRequestUserMessage

Name Tipo Description Obrigatório Predefinição
conteúdo String ou array O conteúdo da mensagem do utilizador.
Yes
nome cadeia (de caracteres) Um nome opcional para o participante. Fornece a informação do modelo para diferenciar entre participantes do mesmo papel. No
função enumeração O papel do autor das mensagens, neste caso user.
Valores possíveis: user
Yes

chatCompletionRequestAssistantMessage

Name Tipo Description Obrigatório Predefinição
conteúdo String ou array O conteúdo da mensagem do assistente. Obrigatório, a menos que tool_calls seja especificado ou function_call especificado.
No
function_call objecto Descontinuado e substituído por tool_calls. O nome e os argumentos de uma função que deve ser chamada, tal como gerada pelo modelo. No
└─ argumentos cadeia (de caracteres) Os argumentos para chamar a função com, conforme gerado pelo modelo em formato JSON. Note que o modelo nem sempre gera JSON válido e pode alucinar parâmetros não definidos pelo seu esquema de funções. Valida os argumentos no teu código antes de chamar a tua função. No
└─ nome cadeia (de caracteres) O nome da função a chamar. No
nome cadeia (de caracteres) Um nome opcional para o participante. Fornece a informação do modelo para diferenciar entre participantes do mesmo papel. No
refusal cadeia (de caracteres) A mensagem de recusa do assistente. No
função enumeração O papel do autor das mensagens, neste caso assistant.
Valores possíveis: assistant
Yes
tool_calls chatCompletionMessageToolCalls As chamadas de ferramenta geradas pelo modelo, como chamadas de funções. No

chatCompletionRequestToolMessage

Name Tipo Description Obrigatório Predefinição
conteúdo String ou array O conteúdo da mensagem da ferramenta. Yes
função enumeração O papel do autor das mensagens, neste caso tool.
Valores possíveis: tool
Yes
tool_call_id cadeia (de caracteres) Chamada de ferramenta à qual esta mensagem está a responder. Yes

chatCompletionRequestFunctionMessage

Name Tipo Description Obrigatório Predefinição
conteúdo cadeia (de caracteres) O conteúdo da mensagem funcional. Yes
nome cadeia (de caracteres) O nome da função a chamar. Yes
função enumeração O papel do autor das mensagens, neste caso function.
Valores possíveis: function
Yes

chatCompletionRequestDeveloperMessageContentPart

Este componente pode ser um dos seguintes:

parteDeConteúdoDaMensagemDeSistemaDePedidoDeConclusãoDeChat

Este componente pode ser um dos seguintes:

ParteDoConteúdoDaMensagemDoUsuárioChatCompletionRequest

Este componente pode ser um dos seguintes:

ParteDoConteúdoDaMensagemDoAssistenteDeSolicitaçãoDeConclusãoDoChat

Este componente pode ser um dos seguintes:

mensagemDeConteúdoFerramentaPedidoDeConclusãoChat

Este componente pode ser um dos seguintes:

chatCompletionRequestMessageContentPartText

Name Tipo Description Obrigatório Predefinição
enviar SMS cadeia (de caracteres) O conteúdo do texto. Yes
tipo enumeração A parte do tipo de conteúdo.
Valores possíveis: text
Yes

chatCompletionRequestMessageContentPartAudio

Name Tipo Description Obrigatório Predefinição
input_audio objecto Yes
└─ dados cadeia (de caracteres) Dados de áudio codificados em Base64. No
└─ formato enumeração O formato dos dados de áudio codificados. Atualmente suporta "wav" e "mp3".

Valores possíveis: wav, mp3
No
tipo enumeração A parte do tipo de conteúdo. Sempre input_audio.
Valores possíveis: input_audio
Yes

chatCompletionRequestMessageContentPartImage

Name Tipo Description Obrigatório Predefinição
image_url objecto Yes
└─ detalhe enumeração Especifica o nível de detalhe da imagem. Saiba mais no guia Visão.
Valores possíveis: auto, low, high
No
└─ URL cadeia (de caracteres) Ou uma URL da imagem ou os dados da imagem codificada base64. No
tipo enumeração A parte do tipo de conteúdo.
Valores possíveis: image_url
Yes

chatCompletionRequestMessageContentPartRefusal

Name Tipo Description Obrigatório Predefinição
refusal cadeia (de caracteres) A mensagem de recusa gerada pelo modelo. Yes
tipo enumeração A parte do tipo de conteúdo.
Valores possíveis: refusal
Yes

Configuração de Extensão do Azure Chat

Uma representação dos dados de configuração para uma única extensão de chat do Azure OpenAI. Isto será usado por um pedido de conclusão de chat que deverá usar extensões de chat do Azure OpenAI para aumentar o comportamento de resposta. A utilização desta configuração é compatível apenas com o Azure OpenAI.

###Discriminator para "azureChatExtensionConfiguration"

Este componente utiliza a propriedade type para discriminar entre diferentes tipos:

Valor do tipo Schema
azure_search azureSearchChatExtensionConfiguration
azure_cosmos_db azureCosmosDBChatExtensionConfiguration
elasticsearch elasticsearchChatExtensionConfiguration
mongo_db mongoDBChatExtensionConfiguration
pinecone pineconeChatExtensionConfiguration
Name Tipo Description Obrigatório Predefinição
tipo azureChatExtensionType Uma representação dos dados de configuração para uma única extensão de chat do Azure OpenAI. Isto será usado por um pedido de conclusão de chat que deverá usar extensões de chat do Azure OpenAI para aumentar o comportamento de resposta.
A utilização desta configuração é compatível apenas com o Azure OpenAI.
Yes

azureChatExtensionType

Uma representação dos dados de configuração para uma única extensão de chat do Azure OpenAI. Isto será usado por um pedido de conclusão de chat que deverá usar extensões de chat do Azure OpenAI para aumentar o comportamento de resposta. A utilização desta configuração é compatível apenas com o Azure OpenAI.

Propriedade valor
Description Uma representação dos dados de configuração para uma única extensão de chat do Azure OpenAI. Isto será usado por um pedido de conclusão de chat que deverá usar extensões de chat do Azure OpenAI para aumentar o comportamento de resposta.
A utilização desta configuração é compatível apenas com o Azure OpenAI.
Type cadeia (de caracteres)
Valores azure_search
azure_cosmos_db
elasticsearch
mongo_db
pinecone

azureSearchChatExtensionConfiguration

Uma representação específica de opções configuráveis para o Azure Search quando o usa como uma extensão de chat do Azure OpenAI.

Name Tipo Description Obrigatório Predefinição
parameters azureSearchChatExtensionParameters (Parâmetros de Extensão de Chat da Pesquisa Azure) Parâmetros para Azure Search quando usados como uma extensão de chat do Azure OpenAI. No
tipo azureChatExtensionType Uma representação dos dados de configuração para uma única extensão de chat do Azure OpenAI. Isto será usado por um pedido de conclusão de chat que deverá usar extensões de chat do Azure OpenAI para aumentar o comportamento de resposta.
A utilização desta configuração é compatível apenas com o Azure OpenAI.
Yes

azureSearchChatExtensionParameters (Parâmetros de Extensão de Chat da Pesquisa Azure)

Parâmetros para Azure Search quando usados como uma extensão de chat do Azure OpenAI.

Name Tipo Description Obrigatório Predefinição
allow_partial_result boolean Se especificado como verdadeiro, o sistema permitirá a utilização de resultados parciais de pesquisa e o pedido falha se todas as consultas falharem. Se não for especificado ou especificado como falso, o pedido falhará se qualquer consulta de pesquisa falhar. No Falso
autenticação onYourDataApiKeyAuthenticationOptions ou onYourDataSystemAssignedManagedIdentityAuthenticationOptions ou onYourDataUserAssignedManaged IdentityAuthenticationOptions ou onYourDataAccessTokenAuthenticationOptions Yes
incorporar_dependência onYourDataEndpointVectorizationSource ou onYourDataDeploymentNameVectorizationSource ou onYourDataIntegratedVectorizationSource No
ponto final cadeia (de caracteres) O caminho de endpoint absoluto para o recurso do Azure Search usar. Yes
mapeamento_de_campos Opções de Mapeamento de Campo do Índice de Pesquisa Azure Definições opcionais para controlar como os campos são processados ao usar um recurso de Pesquisa do Azure configurado. No
filtro cadeia (de caracteres) Filtro de pesquisa. No
em_escopo boolean Se as consultas devem ser restringidas ao uso de dados indexados. No
include_contexts matriz As propriedades incluídas do contexto de saída. Se não especificado, o valor padrão é citations e intent. No
nome_do_índice cadeia (de caracteres) O nome do índice a usar está disponível no recurso Azure Search referenciado. Yes
max_search_queries número inteiro O número máximo de consultas reescritas deve ser enviado ao fornecedor de pesquisa para uma mensagem de utilizador. Se não for especificado, o sistema decidirá o número de consultas a enviar. No
tipo_de_consulta azureSearchQueryType O tipo de consulta de recuperação do Azure Search que deve ser executada ao utilizá-lo como uma extensão de chat do Azure OpenAI. No
configuração semântica cadeia (de caracteres) A configuração semântica adicional para a consulta. No
rigor número inteiro A rigidez configurada do filtro de relevância de pesquisa. Quanto maior a rigor, maior a precisão mas menor a recordação da resposta. No
melhores_n_documentos número inteiro O número superior configurado de documentos a apresentar para a consulta configurada. No

Opções de Mapeamento de Campo do Índice de Pesquisa Azure

Definições opcionais para controlar como os campos são processados ao usar um recurso de Pesquisa do Azure configurado.

Name Tipo Description Obrigatório Predefinição
campos_de_conteúdo matriz Os nomes dos campos de índice que devem ser tratados como conteúdo. No
separador_de_campos_de_conteúdo cadeia (de caracteres) O padrão separador que os campos de conteúdo devem usar. No
campo_caminho_do_ficheiro cadeia (de caracteres) O nome do campo índice a usar como caminho de ficheiro. No
image_vector_fields matriz Os nomes dos campos que representam dados vetoriais de imagem. No
campo_título cadeia (de caracteres) O nome do campo índice a usar como título. No
campo_url cadeia (de caracteres) O nome do campo índice a usar como URL. No
campos vetoriais matriz Os nomes dos campos que representam dados vetoriais. No

azureSearchQueryType

O tipo de consulta de recuperação do Azure Search que deve ser executada ao utilizá-lo como uma extensão de chat do Azure OpenAI.

Propriedade valor
Description O tipo de consulta de recuperação do Azure Search que deve ser executada ao utilizá-lo como uma extensão de chat do Azure OpenAI.
Type cadeia (de caracteres)
Valores simple
semantic
vector
vector_simple_hybrid
vector_semantic_hybrid

Configuração de Extensão de Chat do Azure Cosmos DB

Uma representação específica de opções configuráveis para Azure Cosmos DB quando o usas como uma extensão de chat do Azure OpenAI.

Name Tipo Description Obrigatório Predefinição
parameters azureCosmosDBChatExtensionParameters Parâmetros a usar ao configurar extensões de chat do Azure OpenAI On Your Data ao utilizar o Azure Cosmos DB para MongoDB vCore. No
tipo azureChatExtensionType Uma representação dos dados de configuração para uma única extensão de chat do Azure OpenAI. Isto será usado por um pedido de conclusão de chat que deverá usar extensões de chat do Azure OpenAI para aumentar o comportamento de resposta.
A utilização desta configuração é compatível apenas com o Azure OpenAI.
Yes

azureCosmosDBChatExtensionParameters

Parâmetros a usar ao configurar extensões de chat do Azure OpenAI On Your Data ao utilizar o Azure Cosmos DB para MongoDB vCore.

Name Tipo Description Obrigatório Predefinição
allow_partial_result boolean Se especificado como verdadeiro, o sistema permitirá a utilização de resultados parciais de pesquisa e o pedido falha se todas as consultas falharem. Se não for especificado ou especificado como falso, o pedido falhará se qualquer consulta de pesquisa falhar. No Falso
autenticação nasOpçõesDeAutenticaçãoDaStringDeConexãoDeDados As opções de autenticação do Azure OpenAI On Your Data ao usar uma cadeia de ligação. Yes
nome_do_conteiner cadeia (de caracteres) O nome do contentor de recursos do Azure Cosmos DB. Yes
nome_da_base_de_dados cadeia (de caracteres) O nome da base de dados MongoDB vCore para usar com o Azure Cosmos DB. Yes
incorporar_dependência onYourDataEndpointVectorizationSource ou onYourDataDeploymentNameVectorizationSource Yes
mapeamento_de_campos azureCosmosDBFieldMappingOptions Definições opcionais para controlar como os campos são processados ao usar um recurso Azure Cosmos DB configurado. Yes
em_escopo boolean Se as consultas devem ser restringidas ao uso de dados indexados. No
include_contexts matriz As propriedades incluídas do contexto de saída. Se não especificado, o valor padrão é citations e intent. No
nome_do_índice cadeia (de caracteres) O nome do índice MongoDB vCore para usar com Azure Cosmos DB. Yes
max_search_queries número inteiro O número máximo de consultas reescritas deve ser enviado ao fornecedor de pesquisa para uma mensagem de utilizador. Se não for especificado, o sistema decidirá o número de consultas a enviar. No
rigor número inteiro A rigidez configurada do filtro de relevância de pesquisa. Quanto maior a rigor, maior a precisão mas menor a recordação da resposta. No
melhores_n_documentos número inteiro O número superior configurado de documentos a apresentar para a consulta configurada. No

Opções de Mapeamento de Campos do azureCosmosDB

Definições opcionais para controlar como os campos são processados ao usar um recurso Azure Cosmos DB configurado.

Name Tipo Description Obrigatório Predefinição
campos_de_conteúdo matriz Os nomes dos campos de índice que devem ser tratados como conteúdo. Yes
separador_de_campos_de_conteúdo cadeia (de caracteres) O padrão separador que os campos de conteúdo devem usar. No
campo_caminho_do_ficheiro cadeia (de caracteres) O nome do campo índice a usar como caminho de ficheiro. No
campo_título cadeia (de caracteres) O nome do campo índice a usar como título. No
campo_url cadeia (de caracteres) O nome do campo índice a usar como URL. No
campos vetoriais matriz Os nomes dos campos que representam dados vetoriais. Yes

elasticsearchChatExtensionConfiguration

Uma representação específica de opções configuráveis para o Elasticsearch quando usado como uma extensão de chat do Azure OpenAI.

Name Tipo Description Obrigatório Predefinição
parameters elasticsearchChatExtensionParameters Parâmetros a usar ao configurar o Elasticsearch® como uma extensão de chat do Azure OpenAI. No
tipo azureChatExtensionType Uma representação dos dados de configuração para uma única extensão de chat do Azure OpenAI. Isto será usado por um pedido de conclusão de chat que deverá usar extensões de chat do Azure OpenAI para aumentar o comportamento de resposta.
A utilização desta configuração é compatível apenas com o Azure OpenAI.
Yes

elasticsearchChatExtensionParameters

Parâmetros a usar ao configurar o Elasticsearch® como uma extensão de chat do Azure OpenAI.

Name Tipo Description Obrigatório Predefinição
allow_partial_result boolean Se especificado como verdadeiro, o sistema permitirá a utilização de resultados parciais de pesquisa e o pedido falha se todas as consultas falharem. Se não for especificado ou especificado como falso, o pedido falhará se qualquer consulta de pesquisa falhar. No Falso
autenticação onYourDataKeyAndKeyIdAuthenticationOptions ou onYourDataEncodedApiKeyAuthenticationOptions Yes
incorporar_dependência onYourDataEndpointVectorizationSource ou onYourDataDeploymentNameVectorizationSource ou onYourDataModelIdVectorizationSource No
ponto final cadeia (de caracteres) O ponto final do Elasticsearch®. Yes
mapeamento_de_campos elasticsearchIndexFieldMappingOptions Definições opcionais para controlar como os campos são processados ao usar um recurso Elasticsearch® configurado. No
em_escopo boolean Se as consultas devem ser restringidas ao uso de dados indexados. No
include_contexts matriz As propriedades incluídas do contexto de saída. Se não especificado, o valor padrão é citations e intent. No
nome_do_índice cadeia (de caracteres) O nome do índice Elasticsearch®. Yes
max_search_queries número inteiro O número máximo de consultas reescritas deve ser enviado ao fornecedor de pesquisa para uma mensagem de utilizador. Se não for especificado, o sistema decidirá o número de consultas a enviar. No
tipo_de_consulta elasticsearchQueryType O tipo de consulta de recuperação do Elasticsearch® que deve ser executada ao utilizá-la como uma extensão de chat do Azure OpenAI. No
rigor número inteiro A rigidez configurada do filtro de relevância de pesquisa. Quanto maior a rigor, maior a precisão mas menor a recordação da resposta. No
melhores_n_documentos número inteiro O número superior configurado de documentos a apresentar para a consulta configurada. No

elasticsearchIndexFieldMappingOptions

Definições opcionais para controlar como os campos são processados ao usar um recurso Elasticsearch® configurado.

Name Tipo Description Obrigatório Predefinição
campos_de_conteúdo matriz Os nomes dos campos de índice que devem ser tratados como conteúdo. No
separador_de_campos_de_conteúdo cadeia (de caracteres) O padrão separador que os campos de conteúdo devem usar. No
campo_caminho_do_ficheiro cadeia (de caracteres) O nome do campo índice a usar como caminho de ficheiro. No
campo_título cadeia (de caracteres) O nome do campo índice a usar como título. No
campo_url cadeia (de caracteres) O nome do campo índice a usar como URL. No
campos vetoriais matriz Os nomes dos campos que representam dados vetoriais. No

elasticsearchQueryType

O tipo de consulta de recuperação do Elasticsearch® que deve ser executada ao utilizá-la como uma extensão de chat do Azure OpenAI.

Propriedade valor
Description O tipo de consulta de recuperação do Elasticsearch® que deve ser executada ao utilizá-la como uma extensão de chat do Azure OpenAI.
Type cadeia (de caracteres)
Valores simple
vector

mongoDBChatExtensionConfiguration

Uma representação específica das opções configuráveis para o Mongo DB ao usá-lo como uma extensão de chat do Azure OpenAI.

Name Tipo Description Obrigatório Predefinição
parameters mongoDBChatExtensionParameters Parâmetros a usar ao configurar extensões de chat do Azure OpenAI On Your Data ao usar a base de dados Mongo. No
tipo azureChatExtensionType Uma representação dos dados de configuração para uma única extensão de chat do Azure OpenAI. Isto será usado por um pedido de conclusão de chat que deverá usar extensões de chat do Azure OpenAI para aumentar o comportamento de resposta.
A utilização desta configuração é compatível apenas com o Azure OpenAI.
Yes

mongoDBChatExtensionParameters

Parâmetros a usar ao configurar extensões de chat do Azure OpenAI On Your Data ao usar a base de dados Mongo.

Name Tipo Description Obrigatório Predefinição
allow_partial_result boolean Se especificado como verdadeiro, o sistema permitirá a utilização de resultados parciais de pesquisa e o pedido falha se todas as consultas falharem. Se não for especificado ou especificado como falso, o pedido falhará se qualquer consulta de pesquisa falhar. No Falso
app_name cadeia (de caracteres) O nome da Aplicação de Base de Dados Mongo. Yes
autenticação onYourDataUsernameAndPasswordAuthenticationOptions As opções de autenticação para Azure OpenAI On Your Data ao usar um nome de utilizador e uma palavra-passe. Yes
collection_name cadeia (de caracteres) O nome da Coleção Mongo DB. Yes
nome_da_base_de_dados cadeia (de caracteres) O nome da base de dados Mongo. Yes
incorporar_dependência onYourDataEndpointVectorizationSource ou onYourDataDeploymentNameVectorizationSource Yes
ponto final cadeia (de caracteres) O nome do endpoint do cluster Mongo DB. Yes
mapeamento_de_campos mongoDBFieldMappingOptions Definições opcionais para controlar como os campos são processados ao usar um recurso de base de dados Mongo configurado. Yes
em_escopo boolean Se as consultas devem ser restringidas ao uso de dados indexados. No
include_contexts matriz As propriedades incluídas do contexto de saída. Se não especificado, o valor padrão é citations e intent. No
nome_do_índice cadeia (de caracteres) O nome do índice da base de dados Mongo. Yes
max_search_queries número inteiro O número máximo de consultas reescritas deve ser enviado ao fornecedor de pesquisa para uma mensagem de utilizador. Se não for especificado, o sistema decidirá o número de consultas a enviar. No
rigor número inteiro A rigidez configurada do filtro de relevância de pesquisa. Quanto maior a rigor, maior a precisão mas menor a recordação da resposta. No
melhores_n_documentos número inteiro O número superior configurado de documentos a apresentar para a consulta configurada. No

mongoDBFieldMappingOptions

Definições opcionais para controlar como os campos são processados ao usar um recurso de base de dados Mongo configurado.

Name Tipo Description Obrigatório Predefinição
campos_de_conteúdo matriz Os nomes dos campos de índice que devem ser tratados como conteúdo. Yes
separador_de_campos_de_conteúdo cadeia (de caracteres) O padrão separador que os campos de conteúdo devem usar. No
campo_caminho_do_ficheiro cadeia (de caracteres) O nome do campo índice a usar como caminho de ficheiro. No
campo_título cadeia (de caracteres) O nome do campo índice a usar como título. No
campo_url cadeia (de caracteres) O nome do campo índice a usar como URL. No
campos vetoriais matriz Os nomes dos campos que representam dados vetoriais. Yes

pineconeChatExtensionConfiguration

Uma representação específica das opções configuráveis para o Pinecone quando o usam como uma extensão de chat do Azure OpenAI.

Name Tipo Description Obrigatório Predefinição
parameters pineconeChatExtensionParameters Parâmetros para configurar extensões de chat Azure OpenAI Pinecone. No
tipo azureChatExtensionType Uma representação dos dados de configuração para uma única extensão de chat do Azure OpenAI. Isto será usado por um pedido de conclusão de chat que deverá usar extensões de chat do Azure OpenAI para aumentar o comportamento de resposta.
A utilização desta configuração é compatível apenas com o Azure OpenAI.
Yes

pineconeChatExtensionParameters

Parâmetros para configurar extensões de chat Azure OpenAI Pinecone.

Name Tipo Description Obrigatório Predefinição
allow_partial_result boolean Se especificado como verdadeiro, o sistema permitirá a utilização de resultados parciais de pesquisa e o pedido falha se todas as consultas falharem. Se não for especificado ou especificado como falso, o pedido falhará se qualquer consulta de pesquisa falhar. No Falso
autenticação onYourDataOpçõesDeAutenticaçãoDeChaveApi As opções de autenticação para Azure OpenAI On Your Data ao usar uma chave API. Yes
incorporar_dependência onYourDataDeploymentNameVectorizationSource Os detalhes de uma fonte de vetorização, usada pelo Azure OpenAI On Your Data ao aplicar pesquisa vetorial, que se baseia num nome de implementação de um modelo interno de embeddings no mesmo recurso Azure OpenAI. Yes
ambiente cadeia (de caracteres) O nome ambiental de Pinecone. Yes
mapeamento_de_campos pineconeFieldMappingOptions Definições opcionais para controlar como os campos são processados ao usar um recurso Pinecone configurado. Yes
em_escopo boolean Se as consultas devem ser restringidas ao uso de dados indexados. No
include_contexts matriz As propriedades incluídas do contexto de saída. Se não especificado, o valor padrão é citations e intent. No
nome_do_índice cadeia (de caracteres) O nome do índice da base de dados Pinecone. Yes
max_search_queries número inteiro O número máximo de consultas reescritas deve ser enviado ao fornecedor de pesquisa para uma mensagem de utilizador. Se não for especificado, o sistema decidirá o número de consultas a enviar. No
rigor número inteiro A rigidez configurada do filtro de relevância de pesquisa. Quanto maior a rigor, maior a precisão mas menor a recordação da resposta. No
melhores_n_documentos número inteiro O número superior configurado de documentos a apresentar para a consulta configurada. No

pineconeFieldMappingOptions

Definições opcionais para controlar como os campos são processados ao usar um recurso Pinecone configurado.

Name Tipo Description Obrigatório Predefinição
campos_de_conteúdo matriz Os nomes dos campos de índice que devem ser tratados como conteúdo. Yes
separador_de_campos_de_conteúdo cadeia (de caracteres) O padrão separador que os campos de conteúdo devem usar. No
campo_caminho_do_ficheiro cadeia (de caracteres) O nome do campo índice a usar como caminho de ficheiro. No
campo_título cadeia (de caracteres) O nome do campo índice a usar como título. No
campo_url cadeia (de caracteres) O nome do campo índice a usar como URL. No

opçõesDeAutenticaçãoDeDados

As opções de autenticação para Azure OpenAI nos seus dados.

Discriminador para onYourDataAuthenticationOptions

Este componente utiliza a propriedade type para discriminar entre diferentes tipos:

Valor do tipo Schema
api_key onYourDataOpçõesDeAutenticaçãoDeChaveApi
connection_string nasOpçõesDeAutenticaçãoDaStringDeConexãoDeDados
key_and_key_id onYourDataKeyAndKeyIdAuthenticationOptions
encoded_api_key onYourDataEncodedApiKeyAuthenticationOptions
access_token onYourDataAccessTokenAuthenticationOptions
system_assigned_managed_identity onYourDataSystemAssignedManagedIdentityAuthenticationOptions
user_assigned_managed_identity onYourDataUserAssignedManagedIdentityAuthenticationOptions
username_and_password onYourDataUsernameAndPasswordAuthenticationOptions
Name Tipo Description Obrigatório Predefinição
tipo tipoDeAutenticaçãoNosDados Os tipos de autenticação suportados pelo Azure OpenAI On Your Data. Yes

onYourDataContextProperty

A propriedade de contexto.

Propriedade valor
Description A propriedade de contexto.
Type cadeia (de caracteres)
Valores citations
intent
all_retrieved_documents

TipoDeAutenticaçãoDosSeusDados

Os tipos de autenticação suportados pelo Azure OpenAI On Your Data.

Propriedade valor
Description Os tipos de autenticação suportados pelo Azure OpenAI On Your Data.
Type cadeia (de caracteres)
Valores api_key
connection_string
key_and_key_id
encoded_api_key
access_token
system_assigned_managed_identity
user_assigned_managed_identity
username_and_password

sobreOpçõesDeAutenticaçãoChaveAPIDosSeusDados

As opções de autenticação para Azure OpenAI On Your Data ao usar uma chave API.

Name Tipo Description Obrigatório Predefinição
chave cadeia (de caracteres) A chave da API a usar para autenticação. No
tipo tipoDeAutenticaçãoNosDados Os tipos de autenticação suportados pelo Azure OpenAI On Your Data. Yes

nasOpçõesDeAutenticaçãoDaStringDeConexãoDeDados

As opções de autenticação do Azure OpenAI On Your Data ao usar uma cadeia de ligação.

Name Tipo Description Obrigatório Predefinição
connection_string cadeia (de caracteres) A cadeia de ligação a usar para autenticação. No
tipo tipoDeAutenticaçãoNosDados Os tipos de autenticação suportados pelo Azure OpenAI On Your Data. Yes

onYourDataKeyAndKeyIdAuthenticationOptions

As opções de autenticação do Azure OpenAI nos Seus Dados ao usar um par de chave e ID de chave do Elasticsearch.

Name Tipo Description Obrigatório Predefinição
chave cadeia (de caracteres) A chave Elasticsearch para usar na autenticação. No
key_id cadeia (de caracteres) O ID da chave Elasticsearch para usar na autenticação. No
tipo tipoDeAutenticaçãoNosDados Os tipos de autenticação suportados pelo Azure OpenAI On Your Data. Yes

onYourDataEncodedApiKeyAuthenticationOptions

As opções de autenticação para Azure OpenAI On Your Data ao usar uma chave API codificada em Elasticsearch.

Name Tipo Description Obrigatório Predefinição
encoded_api_key cadeia (de caracteres) A chave API codificada pelo Elasticsearch para usar na autenticação. No
tipo tipoDeAutenticaçãoNosDados Os tipos de autenticação suportados pelo Azure OpenAI On Your Data. Yes

onYourDataAccessTokenAuthenticationOptions

As opções de autenticação para Azure OpenAI nos Seus Dados ao usar o token de acesso.

Name Tipo Description Obrigatório Predefinição
access_token cadeia (de caracteres) O token de acesso a usar para autenticação. No
tipo tipoDeAutenticaçãoNosDados Os tipos de autenticação suportados pelo Azure OpenAI On Your Data. Yes

onYourDataSystemAssignedManagedIdentityAuthenticationOptions

As opções de autenticação para Azure OpenAI On Your Data ao utilizar uma identidade gerida atribuída pelo sistema.

Name Tipo Description Obrigatório Predefinição
tipo tipoDeAutenticaçãoNosDados Os tipos de autenticação suportados pelo Azure OpenAI On Your Data. Yes

onYourDataUserAssignedManagedIdentityAuthenticationOptions

As opções de autenticação para Azure OpenAI On Your Data ao usar uma identidade gerida atribuída pelo utilizador.

Name Tipo Description Obrigatório Predefinição
managed_identity_resource_id cadeia (de caracteres) O ID de recurso da identidade gerida atribuída pelo utilizador a usar para autenticação. No
tipo tipoDeAutenticaçãoNosDados Os tipos de autenticação suportados pelo Azure OpenAI On Your Data. Yes

onYourDataUsernameAndPasswordAuthenticationOptions

As opções de autenticação para Azure OpenAI On Your Data ao usar um nome de utilizador e uma palavra-passe.

Name Tipo Description Obrigatório Predefinição
palavra-passe cadeia (de caracteres) A senha. para usar para autenticação. No
tipo tipoDeAutenticaçãoNosDados Os tipos de autenticação suportados pelo Azure OpenAI On Your Data. Yes
nome de utilizador cadeia (de caracteres) O nome de utilizador a usar para autenticação. No

emSeuFonteDeVectorizaçãoDosDados

Uma representação abstrata de uma fonte de vetorização para Azure OpenAI On Your Data com pesquisa vetorial.

Este componente utiliza a propriedade type para discriminar entre diferentes tipos:

Valor do tipo Schema
endpoint onYourDataEndpointVectorizationSource
deployment_name onYourDataDeploymentNameVectorizationSource
integrated onYourDataIntegratedVectorizationSource
model_id onYourDataModelIdVectorizationSource
Name Tipo Description Obrigatório Predefinição
tipo emOSeuTipoDeFonteDeVectorizaçãoDeDados Representa as fontes disponíveis que o Azure OpenAI On Your Data pode usar para configurar a vetorização dos dados para pesquisa vetorial. Yes

emOSeuTipoDeFonteDeVectorizaçãoDeDados

Representa as fontes disponíveis que o Azure OpenAI On Your Data pode usar para configurar a vetorização dos dados para pesquisa vetorial.

Propriedade valor
Description Representa as fontes disponíveis que o Azure OpenAI On Your Data pode usar para configurar a vetorização dos dados para pesquisa vetorial.
Type cadeia (de caracteres)
Valores endpoint
deployment_name
integrated
model_id

naFonteDeVetorizaçãoDoSeuEndpointDeDados

Os detalhes de uma fonte de vetorização, usada pelo Azure OpenAI On Your Data ao aplicar pesquisa vetorial, que se baseia numa chamada pública de endpoint Azure OpenAI para embeddings.

Name Tipo Description Obrigatório Predefinição
autenticação onYourDataApiKeyAuthenticationOptions ou onYourDataAccessTokenAuthenticationOptions No
dimensões número inteiro O número de dimensões que os embeddings devem ter. Só suportado em text-embedding-3 modelos e modelos posteriores. No
ponto final cadeia (de caracteres) Especifica a URL do endpoint de recurso a partir da qual os embeddings devem ser recuperados. Deve estar no formato de https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings. O parâmetro de consulta versão da API não é permitido. No
tipo emOSeuTipoDeFonteDeVectorizaçãoDeDados Representa as fontes disponíveis que o Azure OpenAI On Your Data pode usar para configurar a vetorização dos dados para pesquisa vetorial. Yes

onYourDataDeploymentNameVectorizationSource

Os detalhes de uma fonte de vetorização, usada pelo Azure OpenAI On Your Data ao aplicar pesquisa vetorial, que se baseia num nome de implementação de modelo interno de embeddings no mesmo recurso Azure OpenAI.

Name Tipo Description Obrigatório Predefinição
nome_da_implementação cadeia (de caracteres) Especifica o nome da implementação do modelo a usar para vetorização. Esta implementação do modelo deve ser feita no mesmo recurso Azure OpenAI, mas a On Your Data irá usar esta implementação do modelo através de uma chamada interna em vez de pública, o que permite a pesquisa vetorial mesmo em redes privadas. No
dimensões número inteiro O número de dimensões que os embeddings devem ter. Só suportado em text-embedding-3 modelos e modelos posteriores. No
tipo emOSeuTipoDeFonteDeVectorizaçãoDeDados Representa as fontes disponíveis que o Azure OpenAI On Your Data pode usar para configurar a vetorização dos dados para pesquisa vetorial. Yes

onYourDataIntegratedVectorizationSource

Representa o vetorizador integrado definido dentro do recurso de pesquisa.

Name Tipo Description Obrigatório Predefinição
tipo emOSeuTipoDeFonteDeVectorizaçãoDeDados Representa as fontes disponíveis que o Azure OpenAI On Your Data pode usar para configurar a vetorização dos dados para pesquisa vetorial. Yes

onYourDataModelIdVectorizationSource

Os detalhes de uma fonte de vetorização, usada pelo Azure OpenAI On Your Data ao aplicar pesquisa vetorial, baseia-se num ID de modelo de serviço de pesquisa. Atualmente apenas suportado pelo Elasticsearch®.

Name Tipo Description Obrigatório Predefinição
model_id cadeia (de caracteres) Especifica o ID do modelo a usar para vetorização. Este ID de modelo deve ser definido no serviço de pesquisa. No
tipo emOSeuTipoDeFonteDeVectorizaçãoDeDados Representa as fontes disponíveis que o Azure OpenAI On Your Data pode usar para configurar a vetorização dos dados para pesquisa vetorial. Yes

azureChatExtensionsContextoMensagem

Uma representação da informação adicional de contexto disponível quando extensões de chat do Azure OpenAI estão envolvidas na geração de uma resposta correspondente de conclusão de chat. Esta informação de contexto só é preenchida quando se utiliza um pedido OpenAI do Azure configurado para usar uma extensão correspondente.

Name Tipo Description Obrigatório Predefinição
all_retrieved_documents matriz Todos os documentos recuperados. No
citations matriz O resultado da recuperação da fonte de dados, usado para gerar a mensagem do assistente na resposta. No
intenção cadeia (de caracteres) A intenção detetada do histórico da conversa, usada para passar para o turno seguinte para manter o contexto. No

citação

Informação de citação para uma mensagem de resposta de conclusão de chat.

Name Tipo Description Obrigatório Predefinição
chunk_id cadeia (de caracteres) A identificação do bloco da citação. No
conteúdo cadeia (de caracteres) O conteúdo da citação. Yes
caminho do arquivo cadeia (de caracteres) O caminho do ficheiro da citação. No
rerank_score number A pontuação de reclassificação do documento recuperado. No
título cadeia (de caracteres) O título da citação. No
url cadeia (de caracteres) O URL da citação. No

consultadoDocumento

O documento recuperado.

Name Tipo Description Obrigatório Predefinição
chunk_id cadeia (de caracteres) A identificação do bloco da citação. No
conteúdo cadeia (de caracteres) O conteúdo da citação. Yes
data_source_index número inteiro O índice da fonte de dados. No
caminho do arquivo cadeia (de caracteres) O caminho do ficheiro da citação. No
filter_reason filterReason A razão de filtragem do documento recuperado. No
original_search_score number A pontuação original da pesquisa do documento recuperado. No
rerank_score number A pontuação de reclassificação do documento recuperado. No
search_queries matriz As consultas de pesquisa usadas para recuperar o documento. No
título cadeia (de caracteres) O título da citação. No
url cadeia (de caracteres) O URL da citação. No

filterReason

A razão de filtragem do documento recuperado.

Propriedade valor
Description A razão de filtragem do documento recuperado.
Type cadeia (de caracteres)
Valores score
rerank

Chamada da Ferramenta de Mensagem de Conclusão de Chat

Name Tipo Description Obrigatório Predefinição
função objecto A função que o modelo chamou. Yes
└─ argumentos cadeia (de caracteres) Os argumentos para chamar a função com, conforme gerado pelo modelo em formato JSON. Note que o modelo nem sempre gera JSON válido e pode alucinar parâmetros não definidos pelo seu esquema de funções. Valida os argumentos no teu código antes de chamar a tua função. No
└─ nome cadeia (de caracteres) O nome da função a chamar. No
id cadeia (de caracteres) O ID da chamada de ferramenta. Yes
tipo toolCallType O tipo de chamada da ferramenta, neste caso function. Yes

toolCallType

O tipo de chamada da ferramenta, neste caso function.

Propriedade valor
Description O tipo de chamada da ferramenta, neste caso function.
Type cadeia (de caracteres)
Valores function

Ferramenta de Mensagem de Pedido de Conclusão de Chat

Name Tipo Description Obrigatório Predefinição
conteúdo cadeia (de caracteres) O conteúdo da mensagem. No
tool_call_id cadeia (de caracteres) Chamada de ferramenta à qual esta mensagem está a responder. No

funçãoDeMensagemDePedidoDeConclusãoDoChat

Name Tipo Description Obrigatório Predefinição
conteúdo cadeia (de caracteres) O conteúdo da mensagem. No
nome cadeia (de caracteres) O conteúdo da mensagem. No
função enumeração O papel do autor das mensagens, neste caso function.
Valores possíveis: function
No

createChatCompletionResponse

Representa uma resposta de conclusão de chat devolvida pelo modelo, com base na entrada fornecida.

Name Tipo Description Obrigatório Predefinição
choices matriz Uma lista de opções para completar o chat. Pode ser mais do que um se n for maior que 1. Yes
criado número inteiro O carimbo temporal do Unix (em segundos) de quando a conclusão do chat foi criada. Yes
id cadeia (de caracteres) Um identificador único para a conclusão da conversa. Yes
modelo cadeia (de caracteres) O modelo usado para completar o chat. Yes
objecto enumeração O tipo de objeto, que é sempre chat.completion.
Valores possíveis: chat.completion
Yes
prompt_filter_results promptFilterResults Filtrar conteúdo resulta em zero ou mais prompts no pedido. Num pedido de streaming, os resultados de diferentes prompts podem chegar em horários distintos ou em ordens distintas. No
system_fingerprint cadeia (de caracteres) Esta impressão digital representa a configuração do backend com que o modelo corre.

Pode ser usado em conjunto com o seed parâmetro de pedido para perceber quando foram feitas alterações no backend que possam afetar o determinismo.
No
utilização conclusãoUso Estatísticas de utilização para o pedido de conclusão. No

createChatCompletionStreamResponse

Representa um segmento transmitido de uma resposta de conclusão de chat devolvida pelo modelo, com base na entrada fornecida.

Name Tipo Description Obrigatório Predefinição
choices matriz Uma lista de opções para completar o chat. Pode conter mais do que um elemento se n for maior que 1.
Yes
criado número inteiro O carimbo temporal do Unix (em segundos) de quando a conclusão do chat foi criada. Cada bloco tem o mesmo carimbo temporal. Yes
id cadeia (de caracteres) Um identificador único para a conclusão da conversa. Cada bloco tem o mesmo ID. Yes
modelo cadeia (de caracteres) O modelo para gerar a completude. Yes
objecto enumeração O tipo de objeto, que é sempre chat.completion.chunk.
Valores possíveis: chat.completion.chunk
Yes
system_fingerprint cadeia (de caracteres) Esta impressão digital representa a configuração do backend com que o modelo corre.
Pode ser usado em conjunto com o seed parâmetro de pedido para perceber quando foram feitas alterações no backend que possam afetar o determinismo.
No

chatCompletionStreamResponseDelta

Um delta de conclusão do chat gerado pelas respostas do modelo em streaming.

Name Tipo Description Obrigatório Predefinição
conteúdo cadeia (de caracteres) O conteúdo da mensagem do bloco. No
function_call objecto Descontinuado e substituído por tool_calls. O nome e os argumentos de uma função que deve ser chamada, tal como gerada pelo modelo. No
└─ argumentos cadeia (de caracteres) Os argumentos para chamar a função com, conforme gerado pelo modelo em formato JSON. Note que o modelo nem sempre gera JSON válido e pode alucinar parâmetros não definidos pelo seu esquema de funções. Valida os argumentos no teu código antes de chamar a tua função. No
└─ nome cadeia (de caracteres) O nome da função a chamar. No
refusal cadeia (de caracteres) A mensagem de recusa gerada pelo modelo. No
função enumeração O papel do autor desta mensagem.
Valores possíveis: system, user, assistant, tool
No
tool_calls matriz No

FragmentoChamadaFerramentaMensagemConclusãoChat

Name Tipo Description Obrigatório Predefinição
função objecto No
└─ argumentos cadeia (de caracteres) Os argumentos para chamar a função com, conforme gerado pelo modelo em formato JSON. Note que o modelo nem sempre gera JSON válido e pode alucinar parâmetros não definidos pelo seu esquema de funções. Valida os argumentos no teu código antes de chamar a tua função. No
└─ nome cadeia (de caracteres) O nome da função a chamar. No
id cadeia (de caracteres) O ID da chamada de ferramenta. No
indexar número inteiro Yes
tipo enumeração O tipo da ferramenta. Atualmente, só function é suportado.
Valores possíveis: function
No

chatCompletionStreamOptions

Opções para resposta ao streaming. Só define isto quando defines stream: true.

Name Tipo Description Obrigatório Predefinição
include_usage boolean Se ativado, um segmento adicional será transmitido antes da data: [DONE] mensagem. O usage campo neste bloco mostra as estatísticas de utilização do token para todo o pedido, e o choices campo será sempre um array vazio. Todos os outros chunks também incluirão um usage campo, mas com valor nulo.
No

chatCompletionChoiceLogProbs

Regista a informação de probabilidade da escolha.

Name Tipo Description Obrigatório Predefinição
conteúdo matriz Uma lista de tokens de conteúdo de mensagens com informação de probabilidade logarítmica. Yes
refusal matriz Uma lista de tokens de recusa de mensagens com informação de probabilidade logarítmica. No

chatCompletionTokenLogprob

Name Tipo Description Obrigatório Predefinição
bytes matriz Uma lista de inteiros que representa a representação UTF-8 bytes do token. Útil em casos em que os caracteres são representados por múltiplos tokens e as suas representações em bytes têm de ser combinadas para gerar a representação correta do texto. Pode ser null se não houver representação em bytes para o token. Yes
logprob number A probabilidade logarítmica deste token. Yes
token cadeia (de caracteres) O token. Yes
top_logprobs matriz Lista dos tokens mais prováveis e a sua probabilidade logarítmica, nesta posição do token. Em casos raros, pode haver menos do que o número de pedidos top_logprobs devolvidos. Yes

MensagemDeRespostaDeConclusãoDeChat (chatCompletionResponseMessage)

Uma mensagem de conclusão do chat gerada pelo modelo.

Name Tipo Description Obrigatório Predefinição
Áudio objecto Se a modalidade de saída de áudio for solicitada, este objeto contém dados sobre a resposta áudio do modelo. No
└─ dados cadeia (de caracteres) Bytes de áudio codificados em Base64 gerados pelo modelo, no formato especificado no pedido.
No
└─ expira_em número inteiro O carimbo temporal do Unix (em segundos) para quando esta resposta áudio deixará de estar acessível no servidor para uso em conversas com múltiplos turnos.
No
└─ ID cadeia (de caracteres) Identificador único para esta resposta áudio. No
└─ Transcrição cadeia (de caracteres) Transcrição do áudio gerado pelo modelo. No
conteúdo cadeia (de caracteres) O conteúdo da mensagem. Yes
contexto azureChatExtensionsMessageContext Uma representação da informação adicional de contexto disponível quando extensões de chat do Azure OpenAI estão envolvidas na geração de uma resposta correspondente de conclusão de chat. Esta informação de contexto só é preenchida quando se utiliza um pedido OpenAI do Azure configurado para usar uma extensão correspondente. No
function_call chatCompletionFunctionCall Descontinuado e substituído por tool_calls. O nome e os argumentos de uma função que deve ser chamada, tal como gerada pelo modelo. No
refusal cadeia (de caracteres) A mensagem de recusa gerada pelo modelo. Yes
função RoleDaMensagemDeConclusãoDoChat O papel do autor da mensagem de resposta. Yes
tool_calls matriz As chamadas de ferramenta geradas pelo modelo, como chamadas de funções. No

RoleDaMensagemDeConclusãoDoChat

O papel do autor da mensagem de resposta.

Propriedade valor
Description O papel do autor da mensagem de resposta.
Type cadeia (de caracteres)
Valores assistant

chatCompletionToolChoiceOption

Controla qual (se houver) ferramenta chamada pelo modelo. none significa que o modelo não chama nenhuma ferramenta e, em vez disso, gera uma mensagem. auto significa que o modelo pode escolher entre gerar uma mensagem ou chamar uma ou mais ferramentas. required significa que o modelo tem de chamar uma ou mais ferramentas. Especificar uma ferramenta específica obriga {"type": "function", "function": {"name": "my_function"}} o modelo a chamar essa ferramenta. none é o padrão quando não há ferramentas presentes. auto é o padrão se houver ferramentas presentes.

Este componente pode ser um dos seguintes:

chatCompletionNamedToolChoice

Especifica uma ferramenta que o modelo deve usar. Use para forçar o modelo a chamar uma função específica.

Name Tipo Description Obrigatório Predefinição
função objecto Yes
└─ nome cadeia (de caracteres) O nome da função a chamar. No
tipo enumeração O tipo da ferramenta. Atualmente, só function é suportado.
Valores possíveis: function
Yes

ParallelToolCalls

Se deve ativar a chamada paralela de funções durante a utilização da ferramenta.

Nenhuma propriedade definida para este componente.

Conteúdo de Previsão

Conteúdo de saída estático previsto, como o conteúdo de um ficheiro de texto que está a ser regenerado.

Name Tipo Description Obrigatório Predefinição
conteúdo String ou array O conteúdo que deve ser correspondido ao gerar uma resposta de modelo. Se os tokens gerados corresponderem a este conteúdo, toda a resposta do modelo pode ser devolvida muito mais rapidamente. Yes
tipo enumeração O tipo de conteúdo previsto que quer fornecer. Este tipo é atualmente sempre content.
Valores possíveis: content
Yes

chatCompletionMessageToolCalls

As chamadas de ferramenta geradas pelo modelo, como chamadas de funções.

Nenhuma propriedade definida para este componente.

ChatCompletionModalities

Tipos de saída que gostaria que o modelo gerasse para este pedido. A maioria dos modelos é capaz de gerar texto, que é o padrão:

["text"]

O gpt-4o-audio-preview modelo também pode ser usado para gerar áudio. Para solicitar que este modelo gere tanto respostas de texto como áudio, pode usar:

["text", "audio"]

Nenhuma propriedade definida para este componente.

chatCompletionFunctionCall

Descontinuado e substituído por tool_calls. O nome e os argumentos de uma função que deve ser chamada, tal como gerada pelo modelo.

Name Tipo Description Obrigatório Predefinição
arguments cadeia (de caracteres) Os argumentos para chamar a função com, conforme gerado pelo modelo em formato JSON. Note que o modelo nem sempre gera JSON válido e pode alucinar parâmetros não definidos pelo seu esquema de funções. Valida os argumentos no teu código antes de chamar a tua função. Yes
nome cadeia (de caracteres) O nome da função a chamar. Yes

conclusãoUso

Estatísticas de utilização para o pedido de conclusão.

Name Tipo Description Obrigatório Predefinição
completion_tokens número inteiro Número de tokens na conclusão gerada. Yes
completion_tokens_details objecto Divisão dos tokens usados numa conclusão. No
└─ tokens_de_previsão_aceites número inteiro Ao usar Saídas Previstas, o número de tokens na previsão que apareceu na completação. No
└─ fichas_de_áudio número inteiro Tokens de entrada de áudio gerados pelo modelo. No
└─ tokens de raciocínio número inteiro Tokens gerados pelo modelo para raciocínio. No
└─ tokens_de_previsão_rejeitados número inteiro Ao usar Saídas Previstas, o número de tokens na previsão que não apareceram na conclusão. No entanto, tal como os tokens de raciocínio, estes tokens continuam a ser contados no total de tokens de conclusão para efeitos de faturação, saída e limites de janela de contexto. No
prompt_tokens número inteiro Número de tokens no prompt. Yes
prompt_tokens_details objecto Detalhes dos tokens do prompt. No
└─ fichas_de_áudio número inteiro Tokens de entrada de áudio presentes no prompt. No
└─ tokens em cache número inteiro O número de tokens de prompt em cache. No
total_tokens número inteiro Número total de tokens usados no pedido (prompt + conclusão). Yes

Ferramenta de Conclusão de Chat

Name Tipo Description Obrigatório Predefinição
função FunctionObject Yes
tipo enumeração O tipo da ferramenta. Atualmente, só function é suportado.
Valores possíveis: function
Yes

FunctionParameters

Os parâmetros que a função aceita, descritos como um objeto de Esquema JSON. Consulte o guia para exemplos e a referência do Esquema JSON para documentação sobre o formato.

Omitir parameters define uma função com uma lista de parâmetros vazia.

Nenhuma propriedade definida para este componente.

FunctionObject

Name Tipo Description Obrigatório Predefinição
description cadeia (de caracteres) Uma descrição do que a função faz, usada pelo modelo para escolher quando e como chamar a função. No
nome cadeia (de caracteres) O nome da função a ser chamada. Devem ser de a z, de A a Z, de 0 a 9, ou conter sublinhados e traços, com um comprimento máximo de 64. Yes
parameters FunctionParameters Os parâmetros que a função aceita, descritos como um objeto de Esquema JSON. Consulte o guia para exemplos e a referência do Esquema JSON para documentação sobre o formato.

Omitir parameters define uma função com uma lista de parâmetros vazia.
No
rigoroso boolean Se deve permitir a adesão estrita ao esquema ao gerar a chamada de função. Se definido como verdadeiro, o modelo seguirá exatamente o esquema definido no parameters campo. Apenas um subconjunto do esquema JSON é suportado quando strict é true. No Falso

FormatoDoTextoDeResposta

Name Tipo Description Obrigatório Predefinição
tipo enumeração O tipo de formato de resposta definido: text
Valores possíveis: text
Yes

FormatoDeRespostaObjetoJson

Name Tipo Description Obrigatório Predefinição
tipo enumeração O tipo de formato de resposta definido: json_object
Valores possíveis: json_object
Yes

ResponseFormatJsonSchemaSchema

O esquema para o formato de resposta, descrito como um objeto de Esquema JSON.

Nenhuma propriedade definida para este componente.

FormatoDeRespostaEsquemaJson

Name Tipo Description Obrigatório Predefinição
esquema_json objecto Yes
└─ Descrição cadeia (de caracteres) Uma descrição do que serve o formato de resposta, usada pelo modelo para determinar como responder nesse formato. No
└─ nome cadeia (de caracteres) O nome do formato da resposta. Devem ser de a z, de A a Z, de 0 a 9, ou conter sublinhados e traços, com um comprimento máximo de 64. No
└─ esquema ResponseFormatJsonSchemaSchema O esquema para o formato de resposta, descrito como um objeto de Esquema JSON. No
└─ rigoroso boolean Se deve ativar a adesão estrita ao esquema ao gerar a saída. Se definido como verdadeiro, o modelo seguirá sempre o esquema exato definido no schema campo. Apenas um subconjunto do esquema JSON é suportado quando strict é true. No Falso
tipo enumeração O tipo de formato de resposta definido: json_schema
Valores possíveis: json_schema
Yes

OpçãoComumDeConclusãoDeChat

Name Tipo Description Obrigatório Predefinição
motivo_de_finalização cadeia (de caracteres) No
indexar número inteiro No

criarPedidoDeTradução

Pedido de tradução.

Name Tipo Description Obrigatório Predefinição
ficheiro cadeia (de caracteres) O ficheiro de áudio para traduzir. Yes
avisar cadeia (de caracteres) Um texto opcional para guiar o estilo do modelo ou continuar um segmento áudio anterior. O enunciado deve estar em inglês. No
formato_de_resposta audioResponseFormat Define o formato da saída. No
Temperatura number A temperatura de amostragem, entre 0 e 1. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 tornam-na mais focada e determinística. Se definido para 0, o modelo usa a probabilidade logarítmica para aumentar automaticamente a temperatura até que certos limiares sejam atingidos. No 0

Resposta de Áudio

Resposta de tradução ou transcrição quando response_format era json

Name Tipo Description Obrigatório Predefinição
enviar SMS cadeia (de caracteres) Texto traduzido ou transcrito. Yes

audioVerboseResponse

Resposta de tradução ou transcrição quando response_format foi verbose_json

Name Tipo Description Obrigatório Predefinição
duration number Duração. No
linguagem cadeia (de caracteres) Language. No
segments matriz No
tarefa cadeia (de caracteres) Tipo de tarefa áudio. No
enviar SMS cadeia (de caracteres) Texto traduzido ou transcrito. Yes
Palavras matriz No

audioResponseFormat

Define o formato da saída.

Propriedade valor
Description Define o formato da saída.
Type cadeia (de caracteres)
Valores json
text
srt
verbose_json
vtt

criarPedidoDeTranscrição

Pedido de transcrição.

Name Tipo Description Obrigatório Predefinição
ficheiro cadeia (de caracteres) O objeto do ficheiro áudio para transcrever. Yes
linguagem cadeia (de caracteres) A linguagem do áudio de entrada. Fornecer a linguagem de entrada no formato ISO-639-1 melhora a precisão e a latência. No
avisar cadeia (de caracteres) Um texto opcional para guiar o estilo do modelo ou continuar um segmento áudio anterior. O prompt deve corresponder à linguagem do áudio. No
formato_de_resposta audioResponseFormat Define o formato da saída. No
Temperatura number A temperatura de amostragem, entre 0 e 1. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 tornam-na mais focada e determinística. Se definido para 0, o modelo usa a probabilidade logarítmica para aumentar automaticamente a temperatura até que certos limiares sejam atingidos. No 0
timestamp_granularities[] matriz As granularidades do carimbo temporal para preencher esta transcrição. response_format deve ser definido verbose_json para usar granularidades de carimbo temporal. Uma ou ambas estas opções são suportadas: word, ou segment. Nota: Não existe latência adicional para carimbos temporais de segmentos, mas gerar carimbos temporais de palavra implica latência adicional. No ['segmento']

segmento de áudio

Segmento de transcrição ou tradução.

Name Tipo Description Obrigatório Predefinição
avg_logprob number Probabilidade logarítmica média. No
compression_ratio number Taxa de compressão. No
fim number Deslocamento no final do segmento. No
id número inteiro Identificador de segmento. No
no_speech_prob number Probabilidade de 'não falar'. No
seek number Deslocamento do segmento. No
start number Início do segmento deslocado. No
Temperatura number Temperatura. No
enviar SMS cadeia (de caracteres) Segmentar o texto. No
tokens matriz Símbolos do texto. No

audioWord

Palavra de transcrição ou tradução.

Name Tipo Description Obrigatório Predefinição
fim number Word end offset. No
start number Word start offset. No
word cadeia (de caracteres) Microsoft Word No

createSpeechRequest

Pedido de discurso.

Name Tipo Description Obrigatório Predefinição
dados introduzidos cadeia (de caracteres) O texto para sintetizar áudio. O comprimento máximo é de 4.096 caracteres. Yes
formato_de_resposta enumeração O formato para sintetizar o áudio.
Valores possíveis: mp3, opus, aac, flac, wav, pcm
No
Velocidade number A velocidade do áudio sintetizado. Selecione um valor de 0.25 para 4.0. 1.0 é o padrão. No 1.0
Voz enumeração A voz a usar para síntese de voz.
Valores possíveis: alloy, echo, fable, onyx, nova, shimmer
Yes

qualidade de imagem

A qualidade da imagem que será gerada.

Propriedade valor
Description A qualidade da imagem que será gerada.
Type cadeia (de caracteres)
Predefinição automóvel
Valores auto
high
medium
low
hd
standard

imagesResponseFormat

O formato em que as imagens geradas são devolvidas.

Propriedade valor
Description O formato em que as imagens geradas são devolvidas.
Type cadeia (de caracteres)
Predefinição url
Valores url
b64_json

imagesOutputFormat

O formato de ficheiro no qual as imagens geradas são devolvidas. Só é suportado para modelos em série.

Propriedade valor
Description O formato de ficheiro no qual as imagens geradas são devolvidas. Apenas suportado para modelos da série gpt-image-1.
Type cadeia (de caracteres)
Predefinição png
Valores png
jpeg

imageSize

O tamanho das imagens geradas.

Propriedade valor
Description O tamanho das imagens geradas.
Type cadeia (de caracteres)
Predefinição automóvel
Valores auto
1792x1024
1024x1792
1024x1024
1024x1536
1536x1024

imageStyle

O estilo das imagens geradas. Só é suportado para DALL-E-3.

Propriedade valor
Description O estilo das imagens geradas. Só é suportado para DALL-E-3.
Type cadeia (de caracteres)
Predefinição vívido
Valores vivid
natural

imageBackground

Permite definir transparência para o fundo da(s) imagem(s) gerada(s). Este parâmetro é apenas suportado para modelos da série gpt-image-1.

Propriedade valor
Description Permite definir transparência para o fundo da(s) imagem(s) gerada(s). Este parâmetro é apenas suportado para modelos da série gpt-image-1.
Type cadeia (de caracteres)
Predefinição automóvel
Valores transparent
opaque
auto

pedidoDeGeraçõesDeImagem

Name Tipo Description Obrigatório Predefinição
em segundo plano imageBackground Permite definir transparência para o fundo da(s) imagem(s) gerada(s). Este parâmetro é apenas suportado para modelos da série gpt-image-1. No automóvel
n número inteiro O número de imagens a gerar. Para dall-e-3, apenas n=1 é suportado. No 1
compressão_de_saída número inteiro O nível de compressão (0-100%) para as imagens geradas. Este parâmetro é suportado apenas para modelos da série gpt-image-1 com o formato de saída jpeg. No 100
formato_de_saida imagesOutputFormat O formato de ficheiro no qual as imagens geradas são devolvidas. Apenas suportado para modelos da série gpt-image-1. No png
avisar cadeia (de caracteres) Uma descrição em texto da(s) imagem(ões) desejada(s). O comprimento máximo é de 32000 caracteres para modelos da série gpt-image-1 e 4000 caracteres para dall-e-3 Yes
qualidade qualidade de imagem A qualidade da imagem que será gerada. No automóvel
formato_de_resposta imagesResponseFormat O formato em que as imagens geradas são devolvidas. Só é suportado para DALL-E-3. No url
size imageSize O tamanho das imagens geradas. No automóvel
Estilo imageStyle O estilo das imagens geradas. Só é suportado para DALL-E-3. No vívido
utilizador cadeia (de caracteres) Um identificador único que representa o seu utilizador final, que pode ajudar a monitorizar e detetar abusos. No

imageEditsRequest

Name Tipo Description Obrigatório Predefinição
imagem String ou array A(s) imagem(s) a editar. Deve ser um ficheiro de imagem suportado ou um array de imagens. Cada imagem deve ser um ficheiro png ou jpg com menos de 25MB. Yes
máscara cadeia (de caracteres) Uma imagem adicional cujas áreas totalmente transparentes (por exemplo, onde alfa é zero) indica onde a imagem deve ser editada. Se forem fornecidas várias imagens, a máscara será aplicada à primeira imagem. Deve ser um ficheiro PNG válido, com menos de 4MB, e ter as mesmas dimensões da imagem. No
n número inteiro O número de imagens a gerar. No 1
avisar cadeia (de caracteres) Uma descrição em texto da(s) imagem(ões) desejada(s). O comprimento máximo é de 32000 caracteres. Yes
qualidade qualidade de imagem A qualidade da imagem que será gerada. No automóvel
formato_de_resposta imagesResponseFormat O formato em que as imagens geradas são devolvidas. No url
size imageSize O tamanho das imagens geradas. No automóvel
utilizador cadeia (de caracteres) Um identificador único que representa o seu utilizador final, que pode ajudar a monitorizar e detetar abusos. No

generateImagesResponse

Name Tipo Description Obrigatório Predefinição
criado número inteiro O carimbo temporal do unix quando a operação foi criada. Yes
dados matriz Os dados de resultado da operação, se bem-sucedidos Yes
utilização imageGenerationsUsage Representa detalhes de utilização de tokens para pedidos de geração de imagens. Apenas para modelos da série GPT-image-1. No

resultadoImagem

O URL da imagem ou imagem codificada se for bem-sucedido, e um erro caso contrário.

Name Tipo Description Obrigatório Predefinição
b64_json cadeia (de caracteres) A imagem codificada base64 No
content_filter_results dalleContentFilterResults Informação sobre os resultados do filtro de conteúdo. No
prompt_filter_results dalleFilterResults Informação sobre a categoria de filtragem de conteúdos (ódio, sexual, violência, self_harm), se foi detetada, bem como o nível de gravidade (escala very_low, baixa, média, alta que determina a intensidade e o nível de risco do conteúdo nocivo) e se foi filtrada ou não. Informação sobre conteúdos de jailbreak e palavrões, se foram detetados e se foram filtrados ou não. E informação sobre a lista de bloqueio de clientes, se foi filtrada e o seu ID. No
Proposta de Melhorias: - Certificar-se de que as frases e termos são traduzidos corretamente para refletir o mesmo significado do texto de origem. - Adaptar quaisquer termos em inglês que possam ser traduzidos naturalmente para português, preservando o seu significado. - Corrigir quaisquer questões gramaticais para aumentar a fluência e a legibilidade em português. - Usar a estrutura de frases em português natural para que a tradução soe nativa. - Verificar o uso apropriado de pontuação e registro para o português. cadeia (de caracteres) O prompt que foi usado para gerar a imagem, caso tenha havido alguma revisão ao prompt. No
url cadeia (de caracteres) O URL da imagem. No

imageGenerationsUsage

Representa detalhes de utilização de tokens para pedidos de geração de imagens. Apenas para modelos da série GPT-image-1.

Name Tipo Description Obrigatório Predefinição
input_tokens número inteiro O número de tokens de entrada. No
input_tokens_details objecto Uma análise detalhada dos tokens de entrada. No
└─ image_tokens número inteiro O número de tokens de imagem. No
└─ text_tokens número inteiro O número de tokens de texto. No
output_tokens número inteiro O número de tokens de saída. No
total_tokens número inteiro O número total de fichas usadas. No

linha

Um objeto linha de conteúdo constituído por uma sequência adjacente de elementos de conteúdo, como palavras e marcas de seleção.

Name Tipo Description Obrigatório Predefinição
Vãos matriz Um array de spans que representam objetos detetados e a sua informação da caixa delimitadora. Yes
enviar SMS cadeia (de caracteres) Yes

Vão

Um objeto span que representa um objeto detetado e a sua informação da caixa delimitadora.

Name Tipo Description Obrigatório Predefinição
length número inteiro O comprimento do espaço em caracteres, medido em pontos de código Unicode. Yes
offset número inteiro O deslocamento do carácter dentro do texto onde o espaço começa. Este deslocamento é definido como a posição do primeiro carácter do espaço, contando a partir do início do texto como pontos de código Unicode. Yes
polygon matriz Um array de objetos que representa pontos no polígono que envolve o objeto detetado. Yes
enviar SMS cadeia (de caracteres) O conteúdo textual do espaço que representa o objeto detetado. Yes

runCompletionUsage

Estatísticas de utilização relacionadas com a corrida. Este valor será null se a execução não estiver num estado terminal (ou seja, in_progress, queued, etc.).

Name Tipo Description Obrigatório Predefinição
completion_tokens número inteiro Número de fichas de conclusão usadas ao longo da corrida. Yes
prompt_tokens número inteiro Número de tokens de prompt usados ao longo da corrida. Yes
total_tokens número inteiro Número total de tokens usados (prompt + completion). Yes

runStepCompletionUsage

Estatísticas de utilização relacionadas com o passo de corrida. Este valor será null enquanto o estado do passo de corrida for in_progress.

Name Tipo Description Obrigatório Predefinição
completion_tokens número inteiro Número de tokens de conclusão usados ao longo do passo de corrida. Yes
prompt_tokens número inteiro Número de tokens de prompt usados ao longo do passo de corrida. Yes
total_tokens número inteiro Número total de tokens usados (prompt + completion). Yes

assistentesApiRespostaFormatoOpção

Especifica o formato que o modelo deve produzir. Compatível com GPT-4o, GPT-4 Turbo e todos os modelos GPT-3.5 Turbo desde gpt-3.5-turbo-1106então.

Definir para { "type": "json_schema", "json_schema": {...} } ativa ativa Structured Outputs que garantem que o modelo corresponde ao esquema JSON fornecido. Saiba mais no guia de Saídas Estruturadas.

A definição para { "type": "json_object" } ativa o modo JSON, que garante que a mensagem gerada pelo modelo é JSON válida.

Importante: ao usar o modo JSON, deve também instruir o modelo a produzir JSON por si próprio através de uma mensagem do sistema ou do utilizador. Sem isto, o modelo pode gerar um fluxo interminável de espaços em branco até que a geração atinja o limite dos tokens, resultando num pedido de longa duração e aparentemente "preso". Note também que o conteúdo da mensagem pode ser parcialmente cortado se finish_reason="length", o que indica que a geração excedeu max_tokens ou a conversa excedeu o comprimento máximo do contexto.

Este componente pode ser um dos seguintes:

assistentesApiResponseFormat

Um objeto que descreve a saída esperada do modelo. Se json_object apenas function o tipo tools for permitido ser passado para a Run. Se text o modelo conseguir devolver texto ou qualquer valor necessário.

Name Tipo Description Obrigatório Predefinição
tipo cadeia (de caracteres) Deve ser um dos text ou json_object. No enviar SMS

tipo Enum: AssistentesApiRespostaFormato

valor Description
enviar SMS
json_object

assistantObject

Representa um assistant que pode chamar o modelo e usar ferramentas.

Name Tipo Description Obrigatório Predefinição
criado_em número inteiro O carimbo temporal do Unix (em segundos) indica quando o assistente foi criado. Yes
description cadeia (de caracteres) A descrição do assistente. O comprimento máximo é de 512 caracteres.
Yes
id cadeia (de caracteres) O identificador, que pode ser referenciado nos endpoints da API. Yes
instructions cadeia (de caracteres) As instruções do sistema que o assistente utiliza. O comprimento máximo é de 256.000 caracteres.
Yes
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
Yes
modelo cadeia (de caracteres) ID do modelo a usar. Yes
nome cadeia (de caracteres) O nome do assistente. O comprimento máximo é de 256 caracteres.
Yes
objecto cadeia (de caracteres) O tipo de objeto, que é sempre assistant. Yes
formato_de_resposta assistantsApiResponseFormatOption Especifica o formato que o modelo deve produzir. Compatível com GPT-4o, GPT-4 Turbo e todos os modelos GPT-3.5 Turbo desde gpt-3.5-turbo-1106então.

Definir para { "type": "json_schema", "json_schema": {...} } ativa ativa Structured Outputs que garantem que o modelo corresponde ao esquema JSON fornecido. Saiba mais no guia de Saídas Estruturadas.

A definição para { "type": "json_object" } ativa o modo JSON, que garante que a mensagem gerada pelo modelo é JSON válida.

Importante: ao usar o modo JSON, deve também instruir o modelo a produzir JSON por si próprio através de uma mensagem do sistema ou do utilizador. Sem isto, o modelo pode gerar um fluxo interminável de espaços em branco até que a geração atinja o limite dos tokens, resultando num pedido de longa duração e aparentemente "preso". Note também que o conteúdo da mensagem pode ser parcialmente cortado se finish_reason="length", o que indica que a geração excedeu max_tokens ou a conversa excedeu o comprimento máximo do contexto.
No
Temperatura number Que temperatura de amostragem usar, entre 0 e 2. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 tornam-na mais focada e determinística.
No 1
tool_resources objecto Um conjunto de recursos usados pelas ferramentas do assistente. Os recursos são específicos para o tipo de ferramenta. Por exemplo, a code_interpreter ferramenta requer uma lista de IDs de ficheiros, enquanto file_search requer uma lista de IDs de armazenamento vetorial.
No
└─ interpretador_de_codigo objecto No
└─ identificadores_de_ficheiro matriz Uma lista de IDs de ficheiros disponibilizada à code_interpreter ferramenta. Pode haver um máximo de 20 ficheiros associados à ferramenta.
No []
└─ pesquisa_arquivo objecto No
└─ vector_store_ids matriz O ID do armazenamento vetorial associado a este assistente. Pode haver um máximo de 1 armazenamento vetorial associado ao assistente.
No
tools matriz Uma lista de ferramentas ativadas no assistente. Pode haver um máximo de 128 ferramentas por assistente. As ferramentas podem ser do tipo code_interpreter, file_search, ou function.
Yes []
top_p number Uma alternativa à amostragem com temperatura, chamada amostragem de núcleo, onde o modelo considera os resultados dos tokens com top_p massa de probabilidade. Portanto, 0,1 significa que apenas os tokens que compõem o top 10% massa de probabilidade são considerados.

Geralmente recomendamos alterar isto ou a temperatura, mas não ambos.
No 1

objeto Enum: AssistenteObjectTipo

valor Description
assistente O tipo de objeto, que é sempre assistente

createAssistantRequest

Name Tipo Description Obrigatório Predefinição
description cadeia (de caracteres) A descrição do assistente. O comprimento máximo é de 512 caracteres.
No
instructions cadeia (de caracteres) As instruções do sistema que o assistente utiliza. O comprimento máximo é de 256.000 caracteres.
No
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
No
modelo cadeia (de caracteres) Yes
nome cadeia (de caracteres) O nome do assistente. O comprimento máximo é de 256 caracteres.
No
formato_de_resposta assistantsApiResponseFormatOption Especifica o formato que o modelo deve produzir. Compatível com GPT-4o, GPT-4 Turbo e todos os modelos GPT-3.5 Turbo desde gpt-3.5-turbo-1106então.

Definir para { "type": "json_schema", "json_schema": {...} } ativa ativa Structured Outputs que garantem que o modelo corresponde ao esquema JSON fornecido. Saiba mais no guia de Saídas Estruturadas.

A definição para { "type": "json_object" } ativa o modo JSON, que garante que a mensagem gerada pelo modelo é JSON válida.

Importante: ao usar o modo JSON, deve também instruir o modelo a produzir JSON por si próprio através de uma mensagem do sistema ou do utilizador. Sem isto, o modelo pode gerar um fluxo interminável de espaços em branco até que a geração atinja o limite dos tokens, resultando num pedido de longa duração e aparentemente "preso". Note também que o conteúdo da mensagem pode ser parcialmente cortado se finish_reason="length", o que indica que a geração excedeu max_tokens ou a conversa excedeu o comprimento máximo do contexto.
No
Temperatura number Que temperatura de amostragem usar, entre 0 e 2. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 tornam-na mais focada e determinística.
No 1
tool_resources objecto Um conjunto de recursos usados pelas ferramentas do assistente. Os recursos são específicos para o tipo de ferramenta. Por exemplo, a code_interpreter ferramenta requer uma lista de IDs de ficheiros, enquanto file_search requer uma lista de IDs de armazenamento vetorial.
No
└─ interpretador_de_codigo objecto No
└─ identificadores_de_ficheiro matriz Uma lista de IDs de ficheiros disponibilizada à code_interpreter ferramenta. Pode haver um máximo de 20 ficheiros associados à ferramenta.
No []
└─ pesquisa_arquivo objecto No
└─ vector_store_ids matriz O armazenamento vetorial está ligado a este assistente. Pode haver um máximo de 1 armazenamento vetorial associado ao assistente.
No
└─ armazenamento_de_vetores matriz Um ajudante para criar um armazenamento vetorial com file_ids e anexá-lo a este assistente. Pode haver um máximo de 1 armazenamento vetorial associado ao assistente.
No
tools matriz Uma lista de ferramentas ativadas no assistente. Pode haver um máximo de 128 ferramentas por assistente. As ferramentas podem ser do tipo code_interpreter, retrieval, ou function.
No []
top_p number Uma alternativa à amostragem com temperatura, chamada amostragem de núcleo, onde o modelo considera os resultados dos tokens com top_p massa de probabilidade. Portanto, 0,1 significa que apenas os tokens que compõem o top 10% massa de probabilidade são considerados.

Geralmente recomendamos alterar isto ou a temperatura, mas não ambos.
No 1

modificaAssistentePedido

Name Tipo Description Obrigatório Predefinição
description cadeia (de caracteres) A descrição do assistente. O comprimento máximo é de 512 caracteres.
No
instructions cadeia (de caracteres) As instruções do sistema que o assistente utiliza. O comprimento máximo é de 32768 caracteres.
No
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
No
modelo cadeia (de caracteres) No
nome cadeia (de caracteres) O nome do assistente. O comprimento máximo é de 256 caracteres.
No
formato_de_resposta assistantsApiResponseFormatOption Especifica o formato que o modelo deve produzir. Compatível com GPT-4o, GPT-4 Turbo e todos os modelos GPT-3.5 Turbo desde gpt-3.5-turbo-1106então.

Definir para { "type": "json_schema", "json_schema": {...} } ativa ativa Structured Outputs que garantem que o modelo corresponde ao esquema JSON fornecido. Saiba mais no guia de Saídas Estruturadas.

A definição para { "type": "json_object" } ativa o modo JSON, que garante que a mensagem gerada pelo modelo é JSON válida.

Importante: ao usar o modo JSON, deve também instruir o modelo a produzir JSON por si próprio através de uma mensagem do sistema ou do utilizador. Sem isto, o modelo pode gerar um fluxo interminável de espaços em branco até que a geração atinja o limite dos tokens, resultando num pedido de longa duração e aparentemente "preso". Note também que o conteúdo da mensagem pode ser parcialmente cortado se finish_reason="length", o que indica que a geração excedeu max_tokens ou a conversa excedeu o comprimento máximo do contexto.
No
Temperatura number Que temperatura de amostragem usar, entre 0 e 2. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 tornam-na mais focada e determinística.
No 1
tool_resources objecto Um conjunto de recursos usados pelas ferramentas do assistente. Os recursos são específicos para o tipo de ferramenta. Por exemplo, a code_interpreter ferramenta requer uma lista de IDs de ficheiros, enquanto file_search requer uma lista de IDs de armazenamento vetorial.
No
└─ interpretador_de_codigo objecto No
└─ identificadores_de_ficheiro matriz Sobrepõe a lista de IDs de ficheiros disponibilizados à code_interpreter ferramenta. Pode haver um máximo de 20 ficheiros associados à ferramenta.
No []
└─ pesquisa_arquivo objecto No
└─ vector_store_ids matriz Sobrepõe o armazenamento vetorial associado a este assistente. Pode haver um máximo de 1 armazenamento vetorial associado ao assistente.
No
tools matriz Uma lista de ferramentas ativadas no assistente. Pode haver um máximo de 128 ferramentas por assistente. As ferramentas podem ser do tipo code_interpreter, retrieval, ou function.
No []
top_p number Uma alternativa à amostragem com temperatura, chamada amostragem de núcleo, onde o modelo considera os resultados dos tokens com top_p massa de probabilidade. Portanto, 0,1 significa que apenas os tokens que compõem o top 10% massa de probabilidade são considerados.

Geralmente recomendamos alterar isto ou a temperatura, mas não ambos.
No 1

deleteAssistantResponse

Name Tipo Description Obrigatório Predefinição
Suprimido boolean Yes
id cadeia (de caracteres) Yes
objecto cadeia (de caracteres) Yes

objeto Enum: DeleteAssistantResponseState

valor Description
assistente.eliminado

listAssistantsResponse

Name Tipo Description Obrigatório Predefinição
dados matriz Yes
first_id cadeia (de caracteres) Yes
tem_mais boolean Yes
last_id cadeia (de caracteres) Yes
objecto cadeia (de caracteres) Yes

assistantToolsCode

Name Tipo Description Obrigatório Predefinição
tipo cadeia (de caracteres) O tipo de ferramenta a definir: code_interpreter Yes

tipo Enum: assistenteToolsCodeType

valor Description
code_interpreter

assistantToolsFileSearch

Name Tipo Description Obrigatório Predefinição
file_search objecto Sobrescreve para a ferramenta de pesquisa de ficheiros. No
└─ número_máx_resultados número inteiro O número máximo de resultados que a ferramenta de pesquisa de ficheiros deve gerar. O padrão é 20 para modelos gpt-4* e 5 para gpt-3.5-turbo. Este número deve estar entre 1 e 50, inclusive.

Note que a ferramenta de pesquisa de ficheiros pode gerar menos resultados do que max_num_results os resultados.
No
tipo cadeia (de caracteres) O tipo de ferramenta a definir: file_search Yes

tipo Enum: assistenteFerramentasFicheiroPesquisaTipo

valor Description
file_search

assistantToolsFileSearchTypeOnly

Name Tipo Description Obrigatório Predefinição
tipo cadeia (de caracteres) O tipo de ferramenta a definir: file_search Yes

tipo Enum: assistenteFerramentasFicheiroPesquisaTipo

valor Description
file_search

assistantToolsFunction

Name Tipo Description Obrigatório Predefinição
função objecto A definição da função. Yes
└─ Descrição cadeia (de caracteres) Uma descrição do que a função faz, usada pelo modelo para escolher quando e como chamar a função. No
└─ nome cadeia (de caracteres) O nome da função a ser chamada. Devem ser de a z, de A a Z, de 0 a 9, ou conter sublinhados e traços, com um comprimento máximo de 64. No
└─ parâmetros chatCompletionFunctionParameters Os parâmetros que a função aceita, descritos como um objeto de Esquema JSON. Consulte o guia para exemplos e a referência do Esquema JSON para documentação sobre o formato. No
tipo cadeia (de caracteres) O tipo de ferramenta a definir: function Yes

tipo Enum: assistenteFerramentasFunção

valor Description
função

truncationObject

Controlos sobre como um thread será truncado antes da execução. Use isto para controlar a janela de contexto inicial da execução.

Name Tipo Description Obrigatório Predefinição
last_messages número inteiro O número de mensagens mais recentes da thread ao construir o contexto para a execução. No
tipo cadeia (de caracteres) A estratégia de truncamento a usar para a thread. O padrão é auto. Se definido para last_messages, o thread será truncado para as n mensagens mais recentes do thread. Quando definido para auto, mensagens no meio da thread serão descartadas para se ajustar ao comprimento contextual do modelo, max_prompt_tokens. Yes

tipo Enum: TruncationType

valor Description
automóvel
last_messages

assistentesApiToolChoiceOption

Controla qual (se houver) ferramenta chamada pelo modelo. none significa que o modelo não chamará nenhuma ferramenta e, em vez disso, gera uma mensagem. auto é o valor padrão e significa que o modelo pode escolher entre gerar uma mensagem ou chamar uma ferramenta. Especificar uma ferramenta específica, como {"type": "file_search"} ou {"type": "function", "function": {"name": "my_function"}} obriga o modelo a chamar essa ferramenta.

Este componente pode ser um dos seguintes:

assistentesEscolhaFerramentaNomeada

Especifica uma ferramenta que o modelo deve usar. Use para forçar o modelo a chamar uma ferramenta específica.

Name Tipo Description Obrigatório Predefinição
função objecto No
└─ nome cadeia (de caracteres) O nome da função a chamar. No
tipo cadeia (de caracteres) O tipo da ferramenta. Se o tipo for function, o nome da função deve ser definido Yes

tipo Enum: AssistentesNomeadoEscolhaFerramenta

valor Description
função
code_interpreter
file_search

runObject

Representa uma execução em threads.

Name Tipo Description Obrigatório Predefinição
assistant_id cadeia (de caracteres) O ID do assistente usado para a execução desta execução. Yes
cancelado_em número inteiro O carimbo de tempo do Unix (em segundos) indica quando a execução foi cancelada. Yes
concluído_em número inteiro O carimbo temporal do Unix (em segundos) indica quando a execução foi concluída. Yes
criado_em número inteiro O carimbo temporal do Unix (em segundos) indica quando a execução foi criada. Yes
expira_em número inteiro O carimbo temporal do Unix (em segundos) indica quando a execução expira. Yes
falhou_em número inteiro O carimbo temporal do Unix (em segundos) para quando a execução falhou. Yes
id cadeia (de caracteres) O identificador, que pode ser referenciado nos endpoints da API. Yes
incomplete_details objecto Detalhes sobre porque é que a série está incompleta. Vai ficar null se a corrida não estiver incompleta. Yes
└─ Justificação cadeia (de caracteres) A razão pela qual a série está incompleta. Isto indicará qual o limite específico de tokens atingido ao longo da corrida. No
instructions cadeia (de caracteres) As instruções que o assistente usou para esta corrida. Yes
último_erro objecto O último erro associado a esta corrida. Será null se não houver erros. Yes
└─ código cadeia (de caracteres) Um de server_error ou rate_limit_exceeded. No
└─ mensagem cadeia (de caracteres) Uma descrição legível para humanos do erro. No
max_completion_tokens número inteiro O número máximo de tokens de conclusão especificados para terem sido usados ao longo da corrida.
Yes
max_prompt_tokens número inteiro O número máximo de tokens de prompt especificados a serem usados ao longo da execução.
Yes
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
Yes
modelo cadeia (de caracteres) O modelo que o assistente usou nesta corrida. Yes
objecto cadeia (de caracteres) O tipo de objeto, que é sempre thread.run. Yes
chamadas_de_ferramentas_em_paralelo ParallelToolCalls Se deve ativar a chamada paralela de funções durante a utilização da ferramenta. No Verdade
required_action objecto Detalhes sobre a ação necessária para continuar a corrida. Será null se não for necessária qualquer ação. Yes
submeter_saídas_de_ferramenta objecto Detalhes sobre as saídas das ferramentas necessárias para que esta corrida continue. No
└─ tool_calls matriz Uma lista das chamadas de ferramentas relevantes. No
└─ tipo enumeração Por agora, isto é sempre submit_tool_outputs.
Valores possíveis: submit_tool_outputs
No
formato_de_resposta assistantsApiResponseFormatOption Especifica o formato que o modelo deve produzir. Compatível com GPT-4o, GPT-4 Turbo e todos os modelos GPT-3.5 Turbo desde gpt-3.5-turbo-1106então.

Definir para { "type": "json_schema", "json_schema": {...} } ativa ativa Structured Outputs que garantem que o modelo corresponde ao esquema JSON fornecido. Saiba mais no guia de Saídas Estruturadas.

A definição para { "type": "json_object" } ativa o modo JSON, que garante que a mensagem gerada pelo modelo é JSON válida.

Importante: ao usar o modo JSON, deve também instruir o modelo a produzir JSON por si próprio através de uma mensagem do sistema ou do utilizador. Sem isto, o modelo pode gerar um fluxo interminável de espaços em branco até que a geração atinja o limite dos tokens, resultando num pedido de longa duração e aparentemente "preso". Note também que o conteúdo da mensagem pode ser parcialmente cortado se finish_reason="length", o que indica que a geração excedeu max_tokens ou a conversa excedeu o comprimento máximo do contexto.
Yes
started_at número inteiro O carimbo temporal do Unix (em segundos) indica quando a execução foi iniciada. Yes
estado cadeia (de caracteres) O estado da sequência, que pode ser , queuedin_progress, requires_action, cancelling, cancelled, failed, completed, , ou expired. Yes
Temperatura number A temperatura de amostragem utilizada nesta corrida. Se não estiver definido, por defeito é 1. No
thread_id cadeia (de caracteres) O ID dos threads em que foi executado como parte desta execução. Yes
tool_choice assistantsApiToolChoiceOption Controla qual (se houver) ferramenta chamada pelo modelo.
none significa que o modelo não chamará nenhuma ferramenta e, em vez disso, gera uma mensagem.
auto é o valor padrão e significa que o modelo pode escolher entre gerar uma mensagem ou chamar uma ferramenta.
Especificar uma ferramenta específica, como {"type": "file_search"} ou {"type": "function", "function": {"name": "my_function"}} obriga o modelo a chamar essa ferramenta.
Yes
tools matriz A lista de ferramentas que o assistente usou nesta corrida. Yes []
top_p number O valor de amostragem do núcleo usado nesta corrida. Se não estiver definido, por defeito é 1. No
truncation_strategy truncationObject Controlos sobre como um thread será truncado antes da execução. Use isto para controlar a janela de contexto inicial da execução. Yes
utilização runCompletionUsage Estatísticas de utilização relacionadas com a corrida. Este valor será null se a execução não estiver num estado terminal (ou seja, in_progress, queued, etc.). Yes

objeto Enum: runObjectType

valor Description
thread.run O tipo de objeto run que é sempre thread.run

status Enum: RunObjectStatus

valor Description
em fila O estado em fila
in_progress O estado in_progress
requires_action O estado required_action
Cancelamento O estado de cancelamento
cancelled O estado extinto
com falhas O estado falhado
concluída O estado concluído
expirado O estado expirado

createRunRequest

Name Tipo Description Obrigatório Predefinição
additional_instructions cadeia (de caracteres) Acrescenta instruções adicionais no final das instruções para a corrida. Isto é útil para modificar o comportamento a cada execução sem sobrepor outras instruções. No
additional_messages matriz Adiciona mensagens adicionais ao tópico antes de criar a execução. No
assistant_id cadeia (de caracteres) O ID do assistente a usar para executar esta execução. Yes
instructions cadeia (de caracteres) Sobrescrita a mensagem de sistema padrão do assistente. Isto é útil para modificar o comportamento em cada execução. No
max_completion_tokens número inteiro O número máximo de tokens de conclusão que podem ser usados ao longo da corrida. A corrida faz o melhor esforço para usar apenas o número de fichas de conclusão especificado, ao longo de várias voltas da sequência. Se a sequência exceder o número de fichas de conclusão especificado, a sequência terminará com o estado incomplete. Consulte incomplete_details para mais informações.
No
max_prompt_tokens número inteiro O número máximo de tokens de prompt que podem ser usados ao longo da corrida. A corrida faz um esforço máximo para usar apenas o número de fichas de prompt especificado, ao longo de várias voltas da sequência. Se a sequência exceder o número de tokens de prompt especificados, a sequência termina com o estado incomplete. Consulte incomplete_details para mais informações.
No
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
No
modelo cadeia (de caracteres) O ID do Modelo a ser usado para executar esta execução. Se um valor for fornecido aqui, este irá sobrepor-se ao modelo associado ao assistente. Caso contrário, será utilizado o modelo associado ao assistente. No
chamadas_de_ferramentas_em_paralelo ParallelToolCalls Se deve ativar a chamada paralela de funções durante a utilização da ferramenta. No Verdade
formato_de_resposta assistantsApiResponseFormatOption Especifica o formato que o modelo deve produzir. Compatível com GPT-4o, GPT-4 Turbo e todos os modelos GPT-3.5 Turbo desde gpt-3.5-turbo-1106então.

Definir para { "type": "json_schema", "json_schema": {...} } ativa ativa Structured Outputs que garantem que o modelo corresponde ao esquema JSON fornecido. Saiba mais no guia de Saídas Estruturadas.

A definição para { "type": "json_object" } ativa o modo JSON, que garante que a mensagem gerada pelo modelo é JSON válida.

Importante: ao usar o modo JSON, deve também instruir o modelo a produzir JSON por si próprio através de uma mensagem do sistema ou do utilizador. Sem isto, o modelo pode gerar um fluxo interminável de espaços em branco até que a geração atinja o limite dos tokens, resultando num pedido de longa duração e aparentemente "preso". Note também que o conteúdo da mensagem pode ser parcialmente cortado se finish_reason="length", o que indica que a geração excedeu max_tokens ou a conversa excedeu o comprimento máximo do contexto.
No
fluxo boolean Se true, devolve um fluxo de eventos que ocorrem durante a Execução como eventos enviados pelo servidor, terminando quando a Execução entra num estado terminal com uma data: [DONE] mensagem.
No
Temperatura number Que temperatura de amostragem usar, entre 0 e 2. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 tornam-na mais focada e determinística.
No 1
tool_choice assistantsApiToolChoiceOption Controla qual (se houver) ferramenta chamada pelo modelo.
none significa que o modelo não chamará nenhuma ferramenta e, em vez disso, gera uma mensagem.
auto é o valor padrão e significa que o modelo pode escolher entre gerar uma mensagem ou chamar uma ferramenta.
Especificar uma ferramenta específica, como {"type": "file_search"} ou {"type": "function", "function": {"name": "my_function"}} obriga o modelo a chamar essa ferramenta.
No
tools matriz Anule as ferramentas que o assistente pode usar nesta corrida. Isto é útil para modificar o comportamento em cada execução. No
top_p number Uma alternativa à amostragem com temperatura, chamada amostragem de núcleo, onde o modelo considera os resultados dos tokens com top_p massa de probabilidade. Portanto, 0,1 significa que apenas os tokens que compõem o top 10% massa de probabilidade são considerados.

Geralmente recomendamos alterar isto ou a temperatura, mas não ambos.
No 1
truncation_strategy truncationObject Controlos sobre como um thread será truncado antes da execução. Use isto para controlar a janela de contexto inicial da execução. No

listRunsResponse

Name Tipo Description Obrigatório Predefinição
dados matriz Yes
first_id cadeia (de caracteres) Yes
tem_mais boolean Yes
last_id cadeia (de caracteres) Yes
objecto cadeia (de caracteres) Yes

modifyRunRequest

Name Tipo Description Obrigatório Predefinição
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
No

submitToolOutputsRunRequest

Name Tipo Description Obrigatório Predefinição
fluxo boolean Se true, devolve um fluxo de eventos que ocorrem durante a Execução como eventos enviados pelo servidor, terminando quando a Execução entra num estado terminal com uma data: [DONE] mensagem.
No
tool_outputs matriz Uma lista das ferramentas para as quais os resultados estão a ser submetidos. Yes

runToolCallObject

Chamadas de objetos de ferramenta

Name Tipo Description Obrigatório Predefinição
função objecto A definição da função. Yes
└─ argumentos cadeia (de caracteres) Os argumentos que o modelo espera que passes à função. No
└─ nome cadeia (de caracteres) O nome da função. No
id cadeia (de caracteres) O ID da chamada de ferramenta. Este ID deve ser referenciado quando submeter as saídas da ferramenta usando as saídas da ferramenta para executar o endpointendpoint. Yes
tipo cadeia (de caracteres) O tipo de chamada de ferramenta para a qual a saída é necessária. Por agora, isto é sempre function. Yes

tipo Enum: RunToolCallObjectType

valor Description
função

createThreadAndRunRequest

Name Tipo Description Obrigatório Predefinição
assistant_id cadeia (de caracteres) O ID do assistente a usar para executar esta execução. Yes
instructions cadeia (de caracteres) Sobrescrita a mensagem de sistema padrão do assistente. Isto é útil para modificar o comportamento em cada execução. No
max_completion_tokens número inteiro O número máximo de tokens de conclusão que podem ser usados ao longo da corrida. A corrida faz o melhor esforço para usar apenas o número de fichas de conclusão especificado, ao longo de várias voltas da sequência. Se a sequência exceder o número de fichas de conclusão especificado, a sequência terminará com o estado incomplete. Consulte incomplete_details para mais informações.
No
max_prompt_tokens número inteiro O número máximo de tokens de prompt que podem ser usados ao longo da corrida. A corrida faz um esforço máximo para usar apenas o número de fichas de prompt especificado, ao longo de várias voltas da sequência. Se a sequência exceder o número de tokens de prompt especificados, a sequência termina com o estado incomplete. Consulte incomplete_details para mais informações.
No
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
No
modelo cadeia (de caracteres) O ID dos modelos a serem usados para executar esta execução. Se um valor for fornecido aqui, este irá sobrepor-se ao modelo associado ao assistente. Caso contrário, será utilizado o modelo associado ao assistente. No
chamadas_de_ferramentas_em_paralelo ParallelToolCalls Se deve ativar a chamada paralela de funções durante a utilização da ferramenta. No Verdade
formato_de_resposta assistantsApiResponseFormatOption Especifica o formato que o modelo deve produzir. Compatível com GPT-4o, GPT-4 Turbo e todos os modelos GPT-3.5 Turbo desde gpt-3.5-turbo-1106então.

Definir para { "type": "json_schema", "json_schema": {...} } ativa ativa Structured Outputs que garantem que o modelo corresponde ao esquema JSON fornecido. Saiba mais no guia de Saídas Estruturadas.

A definição para { "type": "json_object" } ativa o modo JSON, que garante que a mensagem gerada pelo modelo é JSON válida.

Importante: ao usar o modo JSON, deve também instruir o modelo a produzir JSON por si próprio através de uma mensagem do sistema ou do utilizador. Sem isto, o modelo pode gerar um fluxo interminável de espaços em branco até que a geração atinja o limite dos tokens, resultando num pedido de longa duração e aparentemente "preso". Note também que o conteúdo da mensagem pode ser parcialmente cortado se finish_reason="length", o que indica que a geração excedeu max_tokens ou a conversa excedeu o comprimento máximo do contexto.
No
fluxo boolean Se true, devolve um fluxo de eventos que ocorrem durante a Execução como eventos enviados pelo servidor, terminando quando a Execução entra num estado terminal com uma data: [DONE] mensagem.
No
stream_options chatCompletionStreamOptions Opções para resposta ao streaming. Só define isto quando defines stream: true.
No None
Temperatura number Que temperatura de amostragem usar, entre 0 e 2. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 tornam-na mais focada e determinística.
No 1
conversa createThreadRequest No
tool_choice assistantsApiToolChoiceOption Controla qual (se houver) ferramenta chamada pelo modelo.
none significa que o modelo não chamará nenhuma ferramenta e, em vez disso, gera uma mensagem.
auto é o valor padrão e significa que o modelo pode escolher entre gerar uma mensagem ou chamar uma ferramenta.
Especificar uma ferramenta específica, como {"type": "file_search"} ou {"type": "function", "function": {"name": "my_function"}} obriga o modelo a chamar essa ferramenta.
No
tool_resources objecto Um conjunto de recursos usados pelas ferramentas do assistente. Os recursos são específicos para o tipo de ferramenta. Por exemplo, a code_interpreter ferramenta requer uma lista de IDs de ficheiros, enquanto file_search requer uma lista de IDs de armazenamento vetorial.
No
└─ interpretador_de_codigo objecto No
└─ identificadores_de_ficheiro matriz Uma lista de IDs de ficheiros disponibilizada à code_interpreter ferramenta. Pode haver um máximo de 20 ficheiros associados à ferramenta.
No []
└─ pesquisa_arquivo objecto No
└─ vector_store_ids matriz O ID do armazenamento vetorial associado a este assistente. Pode haver um máximo de 1 armazenamento vetorial associado ao assistente.
No
tools matriz Anule as ferramentas que o assistente pode usar nesta corrida. Isto é útil para modificar o comportamento em cada execução. No
top_p number Uma alternativa à amostragem com temperatura, chamada amostragem de núcleo, onde o modelo considera os resultados dos tokens com top_p massa de probabilidade. Portanto, 0,1 significa que apenas os tokens que compõem o top 10% massa de probabilidade são considerados.

Geralmente recomendamos alterar isto ou a temperatura, mas não ambos.
No 1
truncation_strategy truncationObject Controlos sobre como um thread será truncado antes da execução. Use isto para controlar a janela de contexto inicial da execução. No

threadObject

Representa um fio que contém mensagens.

Name Tipo Description Obrigatório Predefinição
criado_em número inteiro O timestamp do Unix (em segundos) indica quando a thread foi criada. Yes
id cadeia (de caracteres) O identificador, que pode ser referenciado nos endpoints da API. Yes
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
Yes
objecto cadeia (de caracteres) O tipo de objeto, que é sempre thread. Yes
tool_resources objecto Um conjunto de recursos disponibilizados às ferramentas do assistente neste tópico. Os recursos são específicos para o tipo de ferramenta. Por exemplo, a code_interpreter ferramenta requer uma lista de IDs de ficheiros, enquanto file_search requer uma lista de IDs de armazenamento vetorial.
Yes
└─ interpretador_de_codigo objecto No
└─ identificadores_de_ficheiro matriz Uma lista de IDs de ficheiros disponibilizada à code_interpreter ferramenta. Pode haver um máximo de 20 ficheiros associados à ferramenta.
No []
└─ pesquisa_arquivo objecto No
└─ vector_store_ids matriz O armazenamento vetorial está ligado a este tópico. Pode haver um máximo de 1 armazenamento vetorial ligado à thread.
No

objeto Enum: ThreadObjectType

valor Description
conversa O tipo de objeto thread que é sempre thread

createThreadRequest

Name Tipo Description Obrigatório Predefinição
Mensagens matriz Uma lista de mensagens para começar o tópico. No
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
No
tool_resources objecto Um conjunto de recursos disponibilizados às ferramentas do assistente neste tópico. Os recursos são específicos para o tipo de ferramenta. Por exemplo, a code_interpreter ferramenta requer uma lista de IDs de ficheiros, enquanto file_search requer uma lista de IDs de armazenamento vetorial.
No
└─ interpretador_de_codigo objecto No
└─ identificadores_de_ficheiro matriz Uma lista de IDs de ficheiros disponibilizada à code_interpreter ferramenta. Pode haver um máximo de 20 ficheiros associados à ferramenta.
No []
└─ pesquisa_arquivo objecto No
└─ vector_store_ids matriz O armazenamento vetorial está ligado a este tópico. Pode haver um máximo de 1 armazenamento vetorial ligado à thread.
No
└─ armazenamento_de_vetores matriz Um ajudante para criar um armazenamento vetorial com file_ids e anexá-lo a este fio. Pode haver um máximo de 1 armazenamento vetorial ligado à thread.
No

ModificaThreadRequest

Name Tipo Description Obrigatório Predefinição
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
No
tool_resources objecto Um conjunto de recursos disponibilizados às ferramentas do assistente neste tópico. Os recursos são específicos para o tipo de ferramenta. Por exemplo, a code_interpreter ferramenta requer uma lista de IDs de ficheiros, enquanto file_search requer uma lista de IDs de armazenamento vetorial.
No
└─ interpretador_de_codigo objecto No
└─ identificadores_de_ficheiro matriz Uma lista de IDs de ficheiro disponibilizada à code_interpreter ferramenta. Pode haver um máximo de 20 ficheiros associados à ferramenta.
No []
└─ pesquisa_arquivo objecto No
└─ vector_store_ids matriz O armazenamento vetorial está ligado a este tópico. Pode haver um máximo de 1 armazenamento vetorial ligado à thread.
No

deleteThreadResponse

Name Tipo Description Obrigatório Predefinição
Suprimido boolean Yes
id cadeia (de caracteres) Yes
objecto cadeia (de caracteres) Yes

objeto Enum: DeleteThreadResponseObjectState

valor Description
thread.deleted O estado do objeto delete thread response que é thread.deleted

listThreadsResponse

Name Tipo Description Obrigatório Predefinição
dados matriz Yes
first_id cadeia (de caracteres) Yes
tem_mais boolean Yes
last_id cadeia (de caracteres) Yes
objecto cadeia (de caracteres) Yes

messageObject

Representa uma mensagem dentro de um thread.

Name Tipo Description Obrigatório Predefinição
assistant_id cadeia (de caracteres) Se aplicável, o ID do assistente que redigiu esta mensagem. Yes
Anexos matriz Uma lista de ficheiros anexados à mensagem e as ferramentas a que foram adicionados. Yes
concluído_em número inteiro O carimbo temporal do Unix (em segundos) indica quando a mensagem foi concluída. Yes
conteúdo matriz O conteúdo da mensagem em conjunto de texto e/ou imagens. Yes
criado_em número inteiro O carimbo temporal do Unix (em segundos) indica quando a mensagem foi criada. Yes
id cadeia (de caracteres) O identificador, que pode ser referenciado nos endpoints da API. Yes
incomplete_at número inteiro O carimbo temporal do Unix (em segundos) indicava quando a mensagem era marcada como incompleta. Yes
incomplete_details objecto Numa mensagem incompleta, detalhes sobre o motivo pelo qual a mensagem está incompleta. Yes
└─ Justificação cadeia (de caracteres) A razão pela qual a mensagem está incompleta. No
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
Yes
objecto cadeia (de caracteres) O tipo de objeto, que é sempre thread.message. Yes
função cadeia (de caracteres) A entidade que produziu a mensagem. Um de user ou assistant. Yes
run_id cadeia (de caracteres) Se aplicável, o ID da execução associada à autoria desta mensagem. Yes
estado cadeia (de caracteres) O estado da mensagem, que pode ser , in_progressincomplete, ou completed. Yes
thread_id cadeia (de caracteres) O ID da thread a que esta mensagem pertence. Yes

objeto Enum: MessageObjectType

valor Description
thread.message O tipo de objeto mensagem, que é thread.message

Enumerador de status: MessageObjectStatus

valor Description
in_progress
incompleto
concluída

função Enum: MessageObjectRole

valor Description
utilizador
assistente

messageDeltaObject

Representa um delta de mensagem, ou seja, quaisquer campos alterados numa mensagem durante o streaming.

Name Tipo Description Obrigatório Predefinição
delta objecto O delta que contém os campos que mudaram na Mensagem. Yes
└─ conteúdo matriz O conteúdo da mensagem em conjunto de texto e/ou imagens. No
└─ função cadeia (de caracteres) A entidade que produziu a mensagem. Um de user ou assistant. No
id cadeia (de caracteres) O identificador da mensagem, que pode ser referenciado nos endpoints da API. Yes
objecto cadeia (de caracteres) O tipo de objeto, que é sempre thread.message.delta. Yes

objeto Enum: MessageDeltaObjectType

valor Description
thread.message.delta

createMessageRequest

Name Tipo Description Obrigatório Predefinição
Anexos matriz Uma lista de ficheiros anexados à mensagem e as ferramentas a que devem ser adicionados. No
conteúdo cadeia (de caracteres) O conteúdo da mensagem. Yes
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
No
função cadeia (de caracteres) O papel da entidade que está a criar a mensagem. Os valores permitidos incluem:
- user: Indica que a mensagem foi enviada por um utilizador real e deve ser usada na maioria dos casos para representar mensagens geradas pelo utilizador.
- assistant: Indica que a mensagem é gerada pelo assistente. Use este valor para inserir mensagens do assistente na conversa.
Yes

Enum da função: CreateMessageRequestRole

valor Description
utilizador
assistente

ModifyMessageRequest

Name Tipo Description Obrigatório Predefinição
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
No

deleteMessageResponse

Name Tipo Description Obrigatório Predefinição
Suprimido boolean Yes
id cadeia (de caracteres) Yes
objecto cadeia (de caracteres) Yes

objeto Enum: DeleteMessageResponseObject

valor Description
thread.message.deleted O estado do objeto delete message response

listMessagesResponse

Name Tipo Description Obrigatório Predefinição
dados matriz Yes
first_id cadeia (de caracteres) Yes
tem_mais boolean Yes
last_id cadeia (de caracteres) Yes
objecto cadeia (de caracteres) Yes

messageContentImageFileObject

Faz referência a um ficheiro de imagem no conteúdo de uma mensagem.

Name Tipo Description Obrigatório Predefinição
image_file objecto Yes
└─ id_do_arquivo cadeia (de caracteres) O ID do ficheiro da imagem no conteúdo da mensagem. No
tipo cadeia (de caracteres) Sempre image_file. Yes

tipo Enum: MessageContentImageFileObjectType

valor Description
image_file O tipo de ficheiro de imagem de conteúdo da mensagem

messageContentTextObject

O conteúdo textual que faz parte de uma mensagem.

Name Tipo Description Obrigatório Predefinição
enviar SMS objecto Yes
└─ anotações matriz No
└─ valor cadeia (de caracteres) Os dados que compõem o texto. No
tipo cadeia (de caracteres) Sempre text. Yes

tipo Enum: mensagemConteúdoTextoObjetoType

valor Description
enviar SMS O conteúdo da mensagem texto Tipo de objeto

messageContentTextAnnotationsFileCitationObject

Uma citação dentro da mensagem que aponta para uma citação específica de um ficheiro específico associado ao assistente ou à mensagem. Gerado quando o assistente usa a ferramenta de "recuperação" para pesquisar ficheiros.

Name Tipo Description Obrigatório Predefinição
end_index número inteiro Yes
file_citation objecto Yes
└─ id_do_arquivo cadeia (de caracteres) O ID do ficheiro específico de onde a citação provém. No
start_index número inteiro Yes
enviar SMS cadeia (de caracteres) O texto na mensagem é o conteúdo que precisa de ser substituído. Yes
tipo cadeia (de caracteres) Sempre file_citation. Yes

tipo Enum: FileCitationObjectType

valor Description
file_citation O tipo de objeto de citação do ficheiro

messageContentTextAnnotationsFilePathObject

Um URL para o ficheiro que é gerado quando o assistente usa a code_interpreter ferramenta para gerar um ficheiro.

Name Tipo Description Obrigatório Predefinição
end_index número inteiro Yes
file_path objecto Yes
└─ id_do_arquivo cadeia (de caracteres) O ID do ficheiro que foi gerado. No
start_index número inteiro Yes
enviar SMS cadeia (de caracteres) O texto na mensagem é o conteúdo que precisa de ser substituído. Yes
tipo cadeia (de caracteres) Sempre file_path. Yes

tipo Enum: FilePathObjectType

valor Description
file_path O tipo de objeto path do ficheiro

messageDeltaContentImageFileObject

Faz referência a um ficheiro de imagem no conteúdo de uma mensagem.

Name Tipo Description Obrigatório Predefinição
image_file objecto No
└─ id_do_arquivo cadeia (de caracteres) O ID do ficheiro da imagem no conteúdo da mensagem. No
indexar número inteiro O índice da parte de conteúdo na mensagem. Yes
tipo cadeia (de caracteres) Sempre image_file. Yes

tipo Enum: MessageDeltaContentImageFileObjectType

valor Description
image_file

messageDeltaContentTextObject

O conteúdo textual que faz parte de uma mensagem.

Name Tipo Description Obrigatório Predefinição
indexar número inteiro O índice da parte de conteúdo na mensagem. Yes
enviar SMS objecto No
└─ anotações matriz No
└─ valor cadeia (de caracteres) Os dados que compõem o texto. No
tipo cadeia (de caracteres) Sempre text. Yes

tipo Enum: MessageDeltaContentTextObjectType

valor Description
enviar SMS

messageDeltaContentTextAnnotationsFileCitationObject

Uma citação dentro da mensagem que aponta para uma citação específica de um ficheiro específico associado ao assistente ou à mensagem. Gerado quando o assistente usa a ferramenta "file_search" para pesquisar ficheiros.

Name Tipo Description Obrigatório Predefinição
end_index número inteiro No
file_citation objecto No
└─ id_do_arquivo cadeia (de caracteres) O ID do ficheiro específico de onde a citação provém. No
└─ citação cadeia (de caracteres) A citação específica no processo. No
indexar número inteiro O índice da anotação na parte do conteúdo do texto. Yes
start_index número inteiro No
enviar SMS cadeia (de caracteres) O texto na mensagem é o conteúdo que precisa de ser substituído. No
tipo cadeia (de caracteres) Sempre file_citation. Yes

tipo Enum: MensagemDeltaConteúdoTextoAnotaçõesFicheiroCitaçãoObjetoType

valor Description
file_citation

messageDeltaContentTextAnnotationsFilePathObject

Um URL para o ficheiro que é gerado quando o assistente usa a code_interpreter ferramenta para gerar um ficheiro.

Name Tipo Description Obrigatório Predefinição
end_index número inteiro No
file_path objecto No
└─ id_do_arquivo cadeia (de caracteres) O ID do ficheiro que foi gerado. No
indexar número inteiro O índice da anotação na parte do conteúdo do texto. Yes
start_index número inteiro No
enviar SMS cadeia (de caracteres) O texto na mensagem é o conteúdo que precisa de ser substituído. No
tipo cadeia (de caracteres) Sempre file_path. Yes

tipo Enum: MessageDeltaContentTextAnnotationsFilePathObjectType

valor Description
file_path

runStepObject

Representa um passo na execução de uma sequência.

Name Tipo Description Obrigatório Predefinição
assistant_id cadeia (de caracteres) O ID do assistente associado ao passo de corrida. Yes
cancelado_em número inteiro O carimbo temporal do Unix (em segundos) indicava quando o passo de execução era cancelado. Yes
concluído_em número inteiro O carimbo temporal do Unix (em segundos) indica quando o passo de execução terminou. Yes
criado_em número inteiro O carimbo temporal do Unix (em segundos) indica quando o passo de execução foi criado. Yes
expirou_em número inteiro O timestamp do Unix (em segundos) indica quando o passo de execução expirou. Um passo é considerado expirado se a corrida principal estiver expirada. Yes
falhou_em número inteiro O carimbo temporal do Unix (em segundos) para quando o passo de execução falhou. Yes
id cadeia (de caracteres) O identificador do passo de execução, que pode ser referenciado nos endpoints da API. Yes
último_erro objecto O último erro associado a este passo de corrida. Será null se não houver erros. Yes
└─ código cadeia (de caracteres) Um de server_error ou rate_limit_exceeded. No
└─ mensagem cadeia (de caracteres) Uma descrição legível para humanos do erro. No
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
Yes
objecto cadeia (de caracteres) O tipo de objeto, que é sempre assistant.run.step. Yes
run_id cadeia (de caracteres) O ID da execução da qual este passo faz parte. Yes
estado cadeia (de caracteres) O estado da sequência, que pode ser , in_progresscancelled, failed, completed, ou expired. Yes
step_details runStepDetailsMessageCreationObject ou runStepDetailsToolCallsObject Os detalhes do passo de corrida. Yes
thread_id cadeia (de caracteres) O ID dos tópicos que foram executados. Yes
tipo cadeia (de caracteres) O tipo de passo de corrida, que pode ser ou message_creationtool_calls. Yes

objeto Enum: RunStepObjectType

valor Description
assistente.corre.passo O tipo de objeto, que é sempre assistant.run.step

tipo Enum: RunStepObjectType

valor Description
message_creation O passo message_creation corrida
tool_calls O passo tool_calls corrida

status Enum: RunStepObjectStatus

valor Description
in_progress O estado da in_progress corrida
cancelled O estado da corrida cancelada
com falhas O estado da corrida cancelada
concluída O estado da corrida cancelada
expirado O estado da corrida cancelada

runStepDeltaObject

Representa um delta de run step, ou seja, quaisquer campos alterados num run step durante o streaming.

Name Tipo Description Obrigatório Predefinição
delta objecto O delta que contém os campos que mudaram no passo de corrida. Yes
└─ detalhes_do_passo runStepDeltaStepDetailsMessageCreationObject ou runStepDeltaStepDetailsToolCallsObject Os detalhes do passo de corrida. No
id cadeia (de caracteres) O identificador do passo de execução, que pode ser referenciado nos endpoints da API. Yes
objecto cadeia (de caracteres) O tipo de objeto, que é sempre thread.run.step.delta. Yes

objeto Enum: RunStepDeltaObjectType

valor Description
thread.run.step.delta

listRunStepsResponse

Name Tipo Description Obrigatório Predefinição
dados matriz Yes
first_id cadeia (de caracteres) Yes
tem_mais boolean Yes
last_id cadeia (de caracteres) Yes
objecto cadeia (de caracteres) Yes

runStepDetailsMessageCreationObject

Detalhes da criação da mensagem pelo passo de execução.

Name Tipo Description Obrigatório Predefinição
message_creation objecto Yes
└─ id_da_mensagem cadeia (de caracteres) O ID da mensagem criada por este passo de execução. No
tipo cadeia (de caracteres) Sempre message_creation. Yes

tipo Enum: RunStepDetailsMessageCreationObjectType

valor Description
message_creation

runStepDeltaStepDetailsMessageCreationObject

Detalhes da criação da mensagem pelo passo de execução.

Name Tipo Description Obrigatório Predefinição
message_creation objecto No
└─ id_da_mensagem cadeia (de caracteres) O ID da mensagem criada por este passo de execução. No
tipo cadeia (de caracteres) Sempre message_creation. Yes

tipo Enum: RunStepDeltaStepDetailsMessageCreationObjectType

valor Description
message_creation

runStepDetailsToolCallsObject

Detalhes da chamada à ferramenta.

Name Tipo Description Obrigatório Predefinição
tool_calls matriz Uma série de chamadas de ferramenta em que o passo de execução estava envolvido. Estas podem estar associadas a um de três tipos de ferramentas: code_interpreter, retrieval ou function.
Yes
tipo cadeia (de caracteres) Sempre tool_calls. Yes

tipo Enum: RunStepDetailsToolCallsObjectType

valor Description
tool_calls

runStepDeltaStepDetailsToolCallsObject

Detalhes da chamada à ferramenta.

Name Tipo Description Obrigatório Predefinição
tool_calls matriz Uma série de chamadas de ferramenta em que o passo de execução estava envolvido. Estas podem estar associadas a um de três tipos de ferramentas: code_interpreter, file_search ou function.
No
tipo cadeia (de caracteres) Sempre tool_calls. Yes

tipo Enum: RunStepDeltaStepsToolsCallsObjectType

valor Description
tool_calls

runStepDetailsToolCallsCodeObject

Os detalhes da ferramenta Code Interpreter chamam o passo de execução em que estavam envolvidos.

Name Tipo Description Obrigatório Predefinição
code_interpreter objecto A definição da ferramenta de Interpretador de Código. Yes
└─ entrada cadeia (de caracteres) A entrada para a ferramenta Code Interpreter chama. No
└─ saídas matriz As saídas da ferramenta Code Interpreter chamam. O Interpretador de Código pode gerar um ou mais itens, incluindo texto (logs) ou imagens (image). Cada um destes é representado por um tipo de objeto diferente. No
id cadeia (de caracteres) O ID da chamada de ferramenta. Yes
tipo cadeia (de caracteres) O tipo de chamada de ferramenta. Isto vai ser code_interpreter sempre para este tipo de chamada de ferramenta. Yes

tipo Enum: RunStepDetailsToolCallsCodeObjectType

valor Description
code_interpreter

runStepDeltaStepDetailsToolCallsCodeObject

Os detalhes da ferramenta Code Interpreter chamam o passo de execução em que estavam envolvidos.

Name Tipo Description Obrigatório Predefinição
code_interpreter objecto A definição da ferramenta de Interpretador de Código. No
└─ entrada cadeia (de caracteres) A entrada para a ferramenta Code Interpreter chama. No
└─ saídas matriz As saídas da ferramenta Code Interpreter chamam. O Interpretador de Código pode gerar um ou mais itens, incluindo texto (logs) ou imagens (image). Cada um destes é representado por um tipo de objeto diferente. No
id cadeia (de caracteres) O ID da chamada de ferramenta. No
indexar número inteiro O índice da chamada de ferramenta no array de chamadas de ferramenta. Yes
tipo cadeia (de caracteres) O tipo de chamada de ferramenta. Isto vai ser code_interpreter sempre para este tipo de chamada de ferramenta. Yes

tipo Enum: RunStepDeltaStepsToolCallsCodeObjectType

valor Description
code_interpreter

runStepDetailsToolCallsCodeOutputLogsObject

A saída de texto da ferramenta Code Interpreter chama como parte de um passo de execução.

Name Tipo Description Obrigatório Predefinição
registos cadeia (de caracteres) A saída de texto da ferramenta Code Interpreter chama. Yes
tipo cadeia (de caracteres) Sempre logs. Yes

tipo Enum: RunStepDetailsToolCallsCodeOutputLogsObjectType

valor Description
registos

runStepDeltaStepDetailsToolCallsCodeOutputLogsObject

A saída de texto da ferramenta Code Interpreter chama como parte de um passo de execução.

Name Tipo Description Obrigatório Predefinição
indexar número inteiro O índice da saída no array de saídas. Yes
registos cadeia (de caracteres) A saída de texto da ferramenta Code Interpreter chama. No
tipo cadeia (de caracteres) Sempre logs. Yes

tipo Enum: RunStepDeltaStepDetalhesFerramentaChamadasCodeOutputLogsObjectType

valor Description
registos

runStepDetailsToolCallsCodeOutputImageObject

Name Tipo Description Obrigatório Predefinição
imagem objecto Yes
└─ id_do_arquivo cadeia (de caracteres) O ID do ficheiro da imagem. No
tipo cadeia (de caracteres) Sempre image. Yes

tipo Enum: RunStepDetailsToolCallsCodeOutputImageObjectType

valor Description
imagem

runStepDeltaStepDetailsToolCallsCodeOutputImageObject

Name Tipo Description Obrigatório Predefinição
imagem objecto No
└─ id_do_arquivo cadeia (de caracteres) O ID do ficheiro da imagem. No
indexar número inteiro O índice da saída no array de saídas. Yes
tipo cadeia (de caracteres) Sempre image. Yes

tipo Enum: RunStepDeltaDetalhesFerramentaChamadasCodeImageOutputImageObject

valor Description
imagem

runStepDetailsToolCallsFileSearchObject

Name Tipo Description Obrigatório Predefinição
file_search objecto Por agora, isto vai ser sempre um objeto vazio. Yes
└─ Resultados matriz Os resultados da pesquisa no ficheiro. No
id cadeia (de caracteres) O ID da ferramenta chama objeto. Yes
tipo cadeia (de caracteres) O tipo de chamada de ferramenta. Isto vai ser file_search sempre para este tipo de chamada de ferramenta. Yes

tipo Enum: RunStepDetailsToolCallsFileSearchObjectType

valor Description
file_search

runStepDetailsToolCallsFileSearchResultObject

Uma instância de resultado da pesquisa de ficheiros.

Name Tipo Description Obrigatório Predefinição
conteúdo matriz O conteúdo do resultado que foi encontrado. O conteúdo só é incluído se solicitado através do parâmetro de consulta de inclusão. No
identificação_de_ficheiro cadeia (de caracteres) O ID do ficheiro onde esse resultado foi encontrado. Yes
nome_do_ficheiro cadeia (de caracteres) O nome do ficheiro onde o resultado foi encontrado. Yes
classificação number A pontuação do resultado. Todos os valores devem ser um número de ponto flutuante entre 0 e 1. Yes

runStepDeltaStepDetailsToolCallsFileSearchObject

Name Tipo Description Obrigatório Predefinição
file_search objecto Por agora, isto vai ser sempre um objeto vazio. Yes
id cadeia (de caracteres) O ID da ferramenta chama objeto. No
indexar número inteiro O índice da chamada de ferramenta no array de chamadas de ferramenta. Yes
tipo cadeia (de caracteres) O tipo de chamada de ferramenta. Isto vai ser retrieval sempre para este tipo de chamada de ferramenta. Yes

tipo Enum: RunStepDeltaStepsToolsCallsFileSearchObjectType

valor Description
file_search

runStepDetailsToolCallsFunctionObject

Name Tipo Description Obrigatório Predefinição
função objecto A definição da função que foi chamada. Yes
└─ argumentos cadeia (de caracteres) Os argumentos passaram para a função. No
└─ nome cadeia (de caracteres) O nome da função. No
└─ saída cadeia (de caracteres) A saída da função. Isto acontecerá null se os resultados ainda não tiverem sido submetidos. No
id cadeia (de caracteres) O ID da ferramenta chama objeto. Yes
tipo cadeia (de caracteres) O tipo de chamada de ferramenta. Isto vai ser function sempre para este tipo de chamada de ferramenta. Yes

tipo Enum: RunStepDetailsToolcallsFunctionObjectType

valor Description
função

runStepDeltaStepDetailsToolCallsFunctionObject

Name Tipo Description Obrigatório Predefinição
função objecto A definição da função que foi chamada. No
└─ argumentos cadeia (de caracteres) Os argumentos passaram para a função. No
└─ nome cadeia (de caracteres) O nome da função. No
└─ saída cadeia (de caracteres) A saída da função. Isto acontecerá null se os resultados ainda não tiverem sido submetidos. No
id cadeia (de caracteres) O ID da ferramenta chama objeto. No
indexar número inteiro O índice da chamada de ferramenta no array de chamadas de ferramenta. Yes
tipo cadeia (de caracteres) O tipo de chamada de ferramenta. Isto vai ser function sempre para este tipo de chamada de ferramenta. Yes

tipo Enum: RunStepDetailsToolcallsFunctionObjectType

valor Description
função

vectorStoreExpirationAfter

A política de expiração para uma loja vetorial.

Name Tipo Description Obrigatório Predefinição
âncora cadeia (de caracteres) Carimbo temporal da âncora, após o qual se aplica a apólice de validade. Âncoras suportadas: last_active_at. Yes
Dias número inteiro O número de dias após o tempo de ancoragem em que o armazenamento vetorial expirará. Yes

âncora Enum: VectorStoreExpirationAfterAnchor

valor Description
última_atividade_em O carimbo temporal da âncora após o qual se aplica a apólice de validade.

vectorStoreObject

Um armazenamento vetorial é uma coleção de ficheiros processados que podem ser usados pela file_search ferramenta.

Name Tipo Description Obrigatório Predefinição
criado_em número inteiro O carimbo de tempo Unix (em segundos) para quando a memória vetorial foi criada. Yes
expira após vectorStoreExpirationAfter A política de expiração para uma loja vetorial. No
expira_em número inteiro O carimbo temporal do Unix (em segundos) indica quando a loja vetorial expira. No
contagem_de_ficheiros objecto Yes
└─ Cancelado número inteiro O número de ficheiros que foram cancelados. No
└─ concluída número inteiro O número de ficheiros que foram processados com sucesso. No
└─ não conseguiu número inteiro O número de ficheiros que não foram processados. No
└─ em progresso número inteiro O número de ficheiros que estão atualmente a ser processados. No
└─ total número inteiro O número total de ficheiros. No
id cadeia (de caracteres) O identificador, que pode ser referenciado nos endpoints da API. Yes
última_atividade_em número inteiro O carimbo temporal do Unix (em segundos) indica quando o armazenamento vetorial esteve ativo pela última vez. Yes
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
Yes
nome cadeia (de caracteres) O nome da loja vetorial. Yes
objecto enumeração O tipo de objeto, que é sempre vector_store.
Valores possíveis: vector_store
Yes
estado cadeia (de caracteres) O estado do armazenamento vetorial, que pode ser , expiredin_progress, ou completed. Um estado de completed indica que o armazenamento vetorial está pronto para uso. Yes
bytes de uso número inteiro O número total de bytes usados pelos ficheiros na loja vetorial. Yes

status Enum: VectorStoreObjectStatus

valor Description
expirado
in_progress
concluída

createVectorStoreRequest

Name Tipo Description Obrigatório Predefinição
chunking_strategy autoChunkingStrategyRequestParam ou staticChunkingStrategyRequestParam A estratégia de fragmentação usada para fragmentar o(s) ficheiro(s). Se não estiver definido, vou usar a auto estratégia. Só se aplica se file_ids estiver não vazio. No
expira após vectorStoreExpirationAfter A política de expiração para uma loja vetorial. No
identificadores_de_arquivo matriz Uma lista de IDs de ficheiros que o armazenamento vetorial deve usar. Útil para ferramentas que file_search permitem aceder a ficheiros. No
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
No
nome cadeia (de caracteres) O nome da loja vetorial. No

updateVectorStoreRequest

Name Tipo Description Obrigatório Predefinição
expira após vectorStoreExpirationAfter A política de expiração para uma loja vetorial. No
metadados objecto Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado. As chaves podem ter um máximo de 64 caracteres e os valores podem ter no máximo 512 caracteres.
No
nome cadeia (de caracteres) O nome da loja vetorial. No

listVectorStoresResponse

Name Tipo Description Obrigatório Predefinição
dados matriz Yes
first_id cadeia (de caracteres) Yes
tem_mais boolean Yes
last_id cadeia (de caracteres) Yes
objecto cadeia (de caracteres) Yes

deleteVectorStoreResponse

Name Tipo Description Obrigatório Predefinição
Suprimido boolean Yes
id cadeia (de caracteres) Yes
objecto cadeia (de caracteres) Yes

objeto Enum: DeleteVectorStoreResponseObject

valor Description
vector_store.deleted O estado do objeto de resposta armazenar o vetor delete

vectorStoreFileObject

Uma lista de ficheiros anexados a uma loja vetorial.

Name Tipo Description Obrigatório Predefinição
chunking_strategy autoChunkingStrategyRequestParam ou staticChunkingStrategyRequestParam A estratégia de fragmentação usada para fragmentar o(s) ficheiro(s). Se não estiver definido, vou usar a auto estratégia. Só se aplica se file_ids estiver não vazio. No
criado_em número inteiro O carimbo temporal do Unix (em segundos) para quando o ficheiro de armazenamento vetorial foi criado. Yes
id cadeia (de caracteres) O identificador, que pode ser referenciado nos endpoints da API. Yes
último_erro objecto O último erro associado a este ficheiro de armazenamento vetorial. Será null se não houver erros. Yes
└─ código cadeia (de caracteres) Um de server_error ou invalid_file ou unsupported_file. No
└─ mensagem cadeia (de caracteres) Uma descrição legível para humanos do erro. No
objecto cadeia (de caracteres) O tipo de objeto, que é sempre vector_store.file. Yes
estado cadeia (de caracteres) O estado do ficheiro de armazenamento vetorial, que pode ser , in_progresscompleted, cancelled, ou failed. O estado completed indica que o ficheiro de armazenamento vetorial está pronto para uso. Yes
bytes de uso número inteiro A utilização total de vetores armazena em bytes. Note que isto pode ser diferente do tamanho original do ficheiro. Yes
identificador_de_armazenamento_vetor cadeia (de caracteres) O ID do armazenamento vetorial a que o ficheiro está ligado. Yes

objeto Enum: VectorStoreFileObjectType

valor Description
vector_store.file

Status Enum: VectorStoreFileObjectStatus

valor Description
in_progress
concluída
cancelled
com falhas

otherChunkingStrategyResponseParam

Isto é devolvido quando a estratégia de fragmentação é desconhecida. Normalmente, isto deve-se ao facto de o ficheiro ter sido indexado antes de o chunking_strategy conceito ser introduzido na API.

Name Tipo Description Obrigatório Predefinição
tipo cadeia (de caracteres) Sempre other. Yes

tipo Enum: OtherChunkingStrategyResponseParamType

valor Description
outro

staticChunkingStrategyResponseParam

Name Tipo Description Obrigatório Predefinição
estático staticChunkingStrategy Yes
tipo cadeia (de caracteres) Sempre static. Yes

tipo Enum: StaticChunkingStrategyResponseParamType

valor Description
estático

staticChunkingStrategy

Name Tipo Description Obrigatório Predefinição
sobreposição_de_fragamentos_tokens número inteiro O número de tokens que se sobrepõem entre blocos. O valor padrão é 400.

Note-se que a sobreposição não deve exceder metade de max_chunk_size_tokens.
Yes
tamanho_máximo_porção_tokens número inteiro O número máximo de fichas em cada bloco. O valor padrão é 800. O valor mínimo é 100 e o valor máximo é 4096. Yes

autoChunkingStrategyRequestParam

A estratégia padrão. Esta estratégia utiliza atualmente um max_chunk_size_tokens de 800 e chunk_overlap_tokens de 400.

Name Tipo Description Obrigatório Predefinição
tipo enumeração Sempre auto.
Valores possíveis: auto
Yes

staticChunkingStrategyRequestParam

Name Tipo Description Obrigatório Predefinição
estático staticChunkingStrategy Yes
tipo enumeração Sempre static.
Valores possíveis: static
Yes

chunkingStrategyRequestParam

A estratégia de fragmentação usada para fragmentar o(s) ficheiro(s). Se não estiver definido, vou usar a auto estratégia.

Este componente pode ser um dos seguintes:

createVectorStoreFileRequest

Name Tipo Description Obrigatório Predefinição
chunking_strategy chunkingStrategyRequestParam A estratégia de fragmentação usada para fragmentar o(s) ficheiro(s). Se não estiver definido, vou usar a auto estratégia. No
identificação_de_ficheiro cadeia (de caracteres) Um ID de ficheiro que a loja vetorial deve usar. Útil para ferramentas que file_search permitem aceder a ficheiros. Yes

listVectorStoreFilesResponse

Name Tipo Description Obrigatório Predefinição
dados matriz Yes
first_id cadeia (de caracteres) Yes
tem_mais boolean Yes
last_id cadeia (de caracteres) Yes
objecto cadeia (de caracteres) Yes

deleteVectorStoreFileResponse

Name Tipo Description Obrigatório Predefinição
Suprimido boolean Yes
id cadeia (de caracteres) Yes
objecto cadeia (de caracteres) Yes

objeto Enum: DeleteVectorStoreFileResponseObject

valor Description
vector_store.file.deleted

vectorStoreFileBatchObject

Um lote de ficheiros ligados a um armazenamento vetorial.

Name Tipo Description Obrigatório Predefinição
criado_em número inteiro O timestamp Unix (em segundos) para quando os ficheiros de armazenamento vetorial foram criados em lote. Yes
contagem_de_ficheiros objecto Yes
└─ Cancelado número inteiro O número de ficheiros que foram cancelados. No
└─ concluída número inteiro O número de ficheiros que foram processados. No
└─ não conseguiu número inteiro O número de ficheiros que não foram processados. No
└─ em progresso número inteiro O número de ficheiros que estão atualmente a ser processados. No
└─ total número inteiro O número total de ficheiros. No
id cadeia (de caracteres) O identificador, que pode ser referenciado nos endpoints da API. Yes
objecto cadeia (de caracteres) O tipo de objeto, que é sempre vector_store.file_batch. Yes
estado cadeia (de caracteres) O estado dos ficheiros de armazenamento vetorial em lote, que pode ser , in_progresscompleted, cancelled ou failed. Yes
identificador_de_armazenamento_vetor cadeia (de caracteres) O ID da loja vetorial onde o ficheiro está ligado. Yes

objeto Enum: VectorStoreFileBatchObjectType

valor Description
vector_store.ficheiros_batch

status Enum: VectorStoreFileBatchObjectStatus

valor Description
in_progress
concluída
cancelled
com falhas

createVectorStoreFileBatchRequest

Name Tipo Description Obrigatório Predefinição
chunking_strategy chunkingStrategyRequestParam A estratégia de fragmentação usada para fragmentar o(s) ficheiro(s). Se não estiver definido, vou usar a auto estratégia. No
identificadores_de_arquivo matriz Uma lista de IDs de ficheiro que a loja vetorial deve usar. Útil para ferramentas que file_search permitem aceder a ficheiros. Yes

assistantStreamEvent

Representa um evento emitido ao transmitir uma Run.

Cada evento num fluxo de eventos enviado pelo servidor tem uma event propriedade e:data

event: thread.created
data: {"id": "thread_123", "object": "thread", ...}

Emitimos eventos sempre que um novo objeto é criado, transita para um novo estado ou está a ser transmitido em partes (deltas). Por exemplo, emitimos thread.run.created quando uma nova execução é criada, thread.run.completed quando uma execução termina, e assim sucessivamente. Quando um Assistente escolhe criar uma mensagem durante uma execução, emitimos um thread.message.created event, um thread.message.in_progress evento, muitos thread.message.delta eventos e, finalmente, um thread.message.completed evento.

Podemos adicionar eventos adicionais ao longo do tempo, por isso recomendamos gerir eventos desconhecidos de forma elegante no seu código.

Este componente pode ser um dos seguintes:

threadStreamEvent

Este componente pode ser um dos seguintes:

thread.created

Ocorre quando é criado um novo thread.

Name Tipo Description Obrigatório Predefinição
dados threadObject Representa um fio que contém mensagens. Yes
evento cadeia (de caracteres) Yes

Dados: threadObject

Enum do evento: ThreadStreamEventEnum

valor Description
thread.created O evento criado pelo fio

runStreamEvent

Este componente pode ser um dos seguintes:

thread.run.created

Ocorre quando uma nova sequência é criada.

Name Tipo Description Obrigatório Predefinição
dados runObject Representa uma execução em threads. Yes
evento cadeia (de caracteres) Yes

Dados: runObject

Enum do evento: RunStreamEventCreated

valor Description
thread.run.created

thread.run.queued

Ocorre quando uma sequência passa para um queued estado.

Name Tipo Description Obrigatório Predefinição
dados runObject Representa uma execução em threads. Yes
evento cadeia (de caracteres) Yes

Dados: runObject

Enum do evento: RunStreamEventQueued

valor Description
thread.run.queued

thread.run.in_progress

Ocorre quando uma sequência passa para um in_progress estado.

Name Tipo Description Obrigatório Predefinição
dados runObject Representa uma execução em threads. Yes
evento cadeia (de caracteres) Yes

Dados: runObject

Enum do evento: RunStreamEventInProgress

valor Description
thread.run.in_progress

thread.run.requires_action

Ocorre quando uma sequência passa para um requires_action estado.

Name Tipo Description Obrigatório Predefinição
dados runObject Representa uma execução em threads. Yes
evento cadeia (de caracteres) Yes

Dados: runObject

Event Enum: RunStreamEventNecessitesAction

valor Description
thread.run.requires_action

thread.run.completed

Ocorre quando uma corrida é concluída.

Name Tipo Description Obrigatório Predefinição
dados runObject Representa uma execução em threads. Yes
evento cadeia (de caracteres) Yes

Dados: runObject

Evento Enum: RunStreamEventConcluído

valor Description
thread.run.completed

thread.run.failed

Ocorre quando uma corrida falha.

Name Tipo Description Obrigatório Predefinição
dados runObject Representa uma execução em threads. Yes
evento cadeia (de caracteres) Yes

Dados: runObject

Evento Enum: RunStreamEventFailed

valor Description
thread.run.failed

thread.run.cancelling

Ocorre quando uma sequência passa para um cancelling estado.

Name Tipo Description Obrigatório Predefinição
dados runObject Representa uma execução em threads. Yes
evento cadeia (de caracteres) Yes

Dados: runObject

Evento Enum: RunStreamEventCancelling

valor Description
thread.run.cancelling

thread.run.cancelled

Ocorre quando uma corrida é cancelada.

Name Tipo Description Obrigatório Predefinição
dados runObject Representa uma execução em threads. Yes
evento cadeia (de caracteres) Yes

Dados: runObject

Evento Enum: RunStreamEventCancelled

valor Description
thread.run.cancelled

thread.run.expired

Ocorre quando uma corrida termina.

Name Tipo Description Obrigatório Predefinição
dados runObject Representa uma execução em threads. Yes
evento cadeia (de caracteres) Yes

Dados: runObject

Evento Enum: RunStreamEventExpired

valor Description
thread.run.expired

runStepStreamEvent

Este componente pode ser um dos seguintes:

thread.run.step.created

Ocorre quando é criado um passo de corrida.

Name Tipo Description Obrigatório Predefinição
dados runStepObject Representa um passo na execução de uma sequência.
Yes
evento cadeia (de caracteres) Yes

Dados: runStepObject

Evento Enum: RunStepStreamEventCreated

valor Description
thread.run.step.created

thread.run.step.in_progress

Ocorre quando um passo de corrida passa para um in_progress estado.

Name Tipo Description Obrigatório Predefinição
dados runStepObject Representa um passo na execução de uma sequência.
Yes
evento cadeia (de caracteres) Yes

Dados: runStepObject

Evento Enum: RunStepStreamEventInProgress

valor Description
thread.run.step.in_progress

thread.run.step.delta

Ocorre quando partes de um passo de corrida estão a ser transmitidas em streaming.

Name Tipo Description Obrigatório Predefinição
dados runStepDeltaObject Representa um delta de run step, ou seja, quaisquer campos alterados num run step durante o streaming.
Yes
evento cadeia (de caracteres) Yes

Dados: runStepDeltaObject

Enum do evento: RunStepStreamEventDelta

valor Description
thread.run.step.delta

thread.run.step.completed

Ocorre quando um passo de corrida é concluído.

Name Tipo Description Obrigatório Predefinição
dados runStepObject Representa um passo na execução de uma sequência.
Yes
evento cadeia (de caracteres) Yes

Dados: runStepObject

Evento Enum: RunStepStreamEventConcluído

valor Description
thread.run.step.completed

thread.run.step.failed

Ocorre quando um passo de corrida falha.

Name Tipo Description Obrigatório Predefinição
dados runStepObject Representa um passo na execução de uma sequência.
Yes
evento cadeia (de caracteres) Yes

Dados: runStepObject

Evento Enum: RunStepStreamEventFailed

valor Description
thread.run.step.failed

thread.run.step.cancelled

Ocorre quando um passo de corrida é cancelado.

Name Tipo Description Obrigatório Predefinição
dados runStepObject Representa um passo na execução de uma sequência.
Yes
evento cadeia (de caracteres) Yes

Dados: runStepObject

Evento Enum: RunStepStreamEventCancelled

valor Description
thread.run.step.cancelled

thread.run.step.expired

Ocorre quando um passo de corrida expira.

Name Tipo Description Obrigatório Predefinição
dados runStepObject Representa um passo na execução de uma sequência.
Yes
evento cadeia (de caracteres) Yes

Dados: runStepObject

Evento Enum: RunStepStreamEventExpired

valor Description
thread.run.step.expired

messageStreamEvent

Este componente pode ser um dos seguintes:

thread.message.created

Ocorre quando uma mensagem é criada.

Name Tipo Description Obrigatório Predefinição
dados messageObject Representa uma mensagem dentro de um thread. Yes
evento cadeia (de caracteres) Yes

Dados: messageObject

Enum do evento: MessageStreamEventCreated

valor Description
thread.message.created

thread.message.in_progress

Ocorre quando uma mensagem passa para um in_progress estado.

Name Tipo Description Obrigatório Predefinição
dados messageObject Representa uma mensagem dentro de um thread. Yes
evento cadeia (de caracteres) Yes

Dados: messageObject

Enum do evento: MessageStreamEventInProgress

valor Description
thread.message.in_progress

thread.message.delta

Ocorre quando partes de uma mensagem estão a ser transmitidas em streaming.

Name Tipo Description Obrigatório Predefinição
dados messageDeltaObject Representa um delta de mensagem, ou seja, quaisquer campos alterados numa mensagem durante o streaming.
Yes
evento cadeia (de caracteres) Yes

Dados: messageDeltaObject

Enum do evento: MessageStreamEventDelta

valor Description
thread.message.delta

thread.message.completed

Ocorre quando uma mensagem é concluída.

Name Tipo Description Obrigatório Predefinição
dados messageObject Representa uma mensagem dentro de um thread. Yes
evento cadeia (de caracteres) Yes

Dados: messageObject

Enum do evento: MessageStreamEventCompleted

valor Description
thread.message.completed

thread.message.incomplete

Ocorre quando uma mensagem termina antes de ser concluída.

Name Tipo Description Obrigatório Predefinição
dados messageObject Representa uma mensagem dentro de um thread. Yes
evento cadeia (de caracteres) Yes

Dados: messageObject

Enum do evento: MessageStreamEventIncomplete

valor Description
thread.message.incomplete

Anotação

Este componente pode ser um dos seguintes:

Clique

Uma ação de clique.

Name Tipo Description Obrigatório Predefinição
botão enumeração Indica qual botão do rato foi pressionado durante o clique. Uma de left, right, wheel, back, ou forward.

Valores possíveis: left, right, wheel, back, forward
Yes
tipo enumeração Especifica o tipo de evento. Para uma ação de clique, esta propriedade é sempre definida para click.

Valores possíveis: click
Yes
x número inteiro A coordenada x onde ocorreu o clique.
Yes
y número inteiro A coordenada y onde ocorreu o clique.
Yes

CodeInterpreterFileOutput

A saída de uma ferramenta de interpretação de código chama que é um ficheiro.

Name Tipo Description Obrigatório Predefinição
files matriz Yes
tipo enumeração O tipo de saída do ficheiro do interpretador de código. Sempre files.

Valores possíveis: files
Yes

CodeInterpreterTextOutput

A saída de uma ferramenta interpretadora de código chamada que é texto.

Name Tipo Description Obrigatório Predefinição
registos cadeia (de caracteres) Os registos da ferramenta de interpretação de código chamam.
Yes
tipo enumeração O tipo de saída do texto do interpretador de código. Sempre logs.

Valores possíveis: logs
Yes

CodeInterpreterTool

Uma ferramenta que executa código.

Name Tipo Description Obrigatório Predefinição
identificadores_de_arquivo matriz Os IDs dos ficheiros para executar o código.
Yes
tipo enumeração O tipo da ferramenta interpretadora de código. Sempre code_interpreter.

Valores possíveis: code_interpreter
Yes

CodeInterpreterToolCall

Uma chamada de ferramenta para executar código.

Name Tipo Description Obrigatório Predefinição
código cadeia (de caracteres) O código a executar.
Yes
id cadeia (de caracteres) O ID único da ferramenta de interpretação de código chama.
Yes
results matriz Os resultados da chamada de ferramenta do interpretador de código.
Yes
estado enumeração O estado da ferramenta de interpretação de código chamada.

Valores possíveis: in_progress, interpreting, completed
Yes
tipo enumeração O tipo que a ferramenta interpretadora de código chama. Sempre code_interpreter_call.

Valores possíveis: code_interpreter_call
Yes

CodeInterpreterToolOutput

Este componente pode ser um dos seguintes:

ComparisonFilter

Um filtro usado para comparar uma chave de atributos especificada a um dado valor usando uma operação de comparação definida.

Name Tipo Description Obrigatório Predefinição
chave cadeia (de caracteres) A chave para comparar com o valor. Yes
tipo enumeração Especifica o operador de comparação: eq, ne, gt, gte, lt, lte.
- eq: igual a
- ne: não é igual
- gt: maior que
- gte: maior ou igual
- lt: menos que
- lte: menor ou igual

Valores possíveis: eq, ne, gt, gte, lt, lte
Yes
value string ou número ou booleano O valor a comparar com a chave de atributos; suporta tipos de string, número ou booleanos. Yes

CompoundFilter

Combine múltiplos filtros usando and ou or.

Name Tipo Description Obrigatório Predefinição
filters matriz Conjunto de filtros para combinar. Os itens podem ser ComparisonFilter ou CompoundFilter. Yes
tipo enumeração Tipo de operação: and ou or.
Valores possíveis: and, or
Yes

ComputerAction

Este componente pode ser um dos seguintes:

ComputerScreenshotImage

Uma imagem de captura de ecrã de computador usada com a ferramenta de uso do computador.

Name Tipo Description Obrigatório Predefinição
identificação_de_ficheiro cadeia (de caracteres) O identificador de um ficheiro carregado que contém a captura de ecrã. No
image_url cadeia (de caracteres) A URL da imagem de ecrã. No
tipo enumeração Especifica o tipo de evento. Para uma captura de ecrã de computador, esta propriedade está sempre definida como computer_screenshot.

Valores possíveis: computer_screenshot
Yes

ComputerTool

Uma ferramenta que controla um computador virtual.

Name Tipo Description Obrigatório Predefinição
altura do ecrã number A altura do ecrã do computador.
Yes
largura de exibição number A largura do ecrã do computador.
Yes
ambiente enumeração O tipo de ambiente informático a controlar.

Valores possíveis: mac, windows, ubuntu, browser
Yes
tipo enumeração O tipo de ferramenta de uso do computador. Sempre computer_use_preview.

Valores possíveis: computer-use-preview
Yes

ComputerToolCall

Uma chamada de ferramenta para uma ferramenta de uso de computador.

Name Tipo Description Obrigatório Predefinição
ação ComputerAction Yes
call_id cadeia (de caracteres) Um identificador usado ao responder à chamada de ferramenta com saída.
Yes
id cadeia (de caracteres) O ID único da chamada do computador. Yes
pending_safety_checks matriz As verificações de segurança pendentes para a chamada no computador.
Yes
estado enumeração O estado do item. Um de in_progress, completed, ou incomplete. Preenche quando os itens são devolvidos via API.

Valores possíveis: in_progress, completed, incomplete
Yes
tipo enumeração O tipo de chamada do computador. Sempre computer_call.
Valores possíveis: computer_call
Yes

ComputerToolCallOutput

A saída de uma chamada de ferramenta informática.

Name Tipo Description Obrigatório Predefinição
acknowledged_safety_checks matriz As verificações de segurança reportadas pela API que foram reconhecidas pelo programador.
No
call_id cadeia (de caracteres) O ID da chamada de ferramenta informática que produziu a saída.
Yes
id cadeia (de caracteres) O ID da saída da chamada da ferramenta informática.
No
saída ComputerScreenshotImage Uma imagem de captura de ecrã de computador usada com a ferramenta de uso do computador.
Yes
estado enumeração O estado da mensagem introduzida. Um de in_progress, completed, ou incomplete. Preenchido quando os itens de entrada são devolvidos via API.

Valores possíveis: in_progress, completed, incomplete
No
tipo enumeração O tipo de saída da chamada da ferramenta de computador. Sempre computer_call_output.

Valores possíveis: computer_call_output
Yes

ComputerToolCallOutputResource

Name Tipo Description Obrigatório Predefinição
acknowledged_safety_checks matriz As verificações de segurança reportadas pela API que foram reconhecidas pelo programador.
No
call_id cadeia (de caracteres) O ID da chamada de ferramenta informática que produziu a saída.
Yes
id cadeia (de caracteres) O ID único da saída da ferramenta de chamada do computador.
Yes
saída ComputerScreenshotImage Uma imagem de captura de ecrã de computador usada com a ferramenta de uso do computador.
Yes
estado enumeração O estado da mensagem introduzida. Um de in_progress, completed, ou incomplete. Preenchido quando os itens de entrada são devolvidos via API.

Valores possíveis: in_progress, completed, incomplete
No
tipo enumeração O tipo de saída da chamada da ferramenta de computador. Sempre computer_call_output.

Valores possíveis: computer_call_output
Yes

ComputerToolCallSafetyCheck

Uma verificação de segurança pendente para a chamada no computador.

Name Tipo Description Obrigatório Predefinição
código cadeia (de caracteres) O tipo de verificação de segurança pendente. Yes
id cadeia (de caracteres) A identificação da verificação de segurança pendente. Yes
mensagem cadeia (de caracteres) Detalhes sobre a verificação de segurança pendente. Yes

Conteúdo

Conteúdos de entrada e saída multimodais.

Este componente pode ser um dos seguintes:

Coordinate

Um par de coordenadas x/y, por exemplo, { x: 100, y: 200 }.

Name Tipo Description Obrigatório Predefinição
x número inteiro A coordenada x.
Yes
y número inteiro A coordenada y.
Yes

CreateModelResponseProperties

Name Tipo Description Obrigatório Predefinição
metadados Metadata Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado e para consultar objetos através da API ou do dashboard.

As teclas são cadeias com um comprimento máximo de 64 caracteres. Os valores são cadeias com um comprimento máximo de 512 caracteres.
No
modelo cadeia (de caracteres) Modelo usado para gerar as respostas. No
Temperatura number Que temperatura de amostragem usar, entre 0 e 2. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 tornam-na mais focada e determinística.
Geralmente recomendamos alterar isto ou top_p , mas não ambos.
No 1
top_p number Uma alternativa à amostragem com temperatura, chamada amostragem de núcleo, onde o modelo considera os resultados dos tokens com top_p massa de probabilidade. Portanto, 0,1 significa que apenas os tokens que compõem o top 10% massa de probabilidade são considerados.

Geralmente recomendamos alterar isto ou temperature , mas não ambos.
No 1
utilizador cadeia (de caracteres) Um identificador único que representa o seu utilizador final, que pode ajudar a OpenAI a monitorizar e detetar abusos. .
No

createResponse

Name Tipo Description Obrigatório Predefinição
include matriz {"$ref": "#/components/schemas/includable/description"} No
dados introduzidos String ou array Entradas de texto, imagem ou ficheiro para o modelo, usadas para gerar uma resposta. Yes
instructions cadeia (de caracteres) Insere uma mensagem do sistema (ou do desenvolvedor) como o primeiro elemento no contexto do modelo.

Ao usar junto com previous_response_id, as instruções de uma resposta anterior não serão transferidas para a resposta seguinte. Isto facilita a troca de mensagens do sistema (ou do programador) em novas respostas.
No
max_output_tokens número inteiro Um limite superior para o número de tokens que podem ser gerados para uma resposta, incluindo tokens de saída visíveis e tokens de raciocínio.
No
chamadas_de_ferramentas_em_paralelo boolean Se permitir que o modelo execute chamadas de ferramenta em paralelo.
No Verdade
previous_response_id cadeia (de caracteres) O ID único da resposta anterior ao modelo. Usa isto para criar conversas com vários turnos. No
reasoning Reasoning Opções de configuração para modelos de raciocínio. No
armazenar boolean Se deve armazenar a resposta gerada do modelo para recuperação posterior via API.
No Verdade
fluxo boolean Se definido como verdadeiro, os dados de resposta do modelo serão transmitidos para o cliente à medida que são gerados usando eventos enviados pelo servidor. No Falso
enviar SMS objecto Opções de configuração para uma resposta de texto do modelo. Pode ser texto simples ou dados JSON estruturados. Saiba mais:
- entradas e saídas de texto
- Saídas Estruturadas
No
└─ formato TextResponseFormatConfiguration Um objeto que especifica o formato que o modelo deve gerar.

Configurar { "type": "json_schema" } ativa o Structured Outputs, que garante que o modelo corresponde ao seu esquema JSON fornecido. O formato padrão é { "type": "text" } sem opções adicionais.

Não recomendado para gpt-4o e modelos mais recentes:

Configurar para { "type": "json_object" } ativar o modo JSON mais antigo, que garante que a mensagem gerada pelo modelo é JSON válida. O uso json_schema é preferido para modelos que o suportam.
No
tool_choice OpçõesDeEscolhaFerramenta ou TiposEscolhaFerramenta ou FunçãoDeEscolhaFerramenta Como o modelo deve escolher qual ferramenta (ou ferramentas) usar ao gerar uma resposta. Consulte o tools parâmetro para ver como especificar que ferramentas o modelo pode chamar.
No
tools matriz Um conjunto de ferramentas que o modelo pode invocar enquanto gera uma resposta. Podes especificar qual ferramenta usar definindo o tool_choice parâmetro.

As duas categorias de ferramentas que pode fornecer ao modelo são:

- Ferramentas incorporadas
No
truncation enumeração A estratégia de truncamento a usar para a resposta do modelo.
- auto: Se o contexto desta resposta e das anteriores exceder o tamanho da janela de contexto do modelo, o modelo truncará o
Resposta para se ajustar à janela de contexto, colocando itens de entrada no meio da conversa.
- disabled (padrão): Se uma resposta de modelo exceder o tamanho da janela de contexto para um modelo, o pedido falhará com um erro 400.

Valores possíveis: auto, disabled
No

DoubleClick

Uma ação de duplo clique.

Name Tipo Description Obrigatório Predefinição
tipo enumeração Especifica o tipo de evento. Para uma ação de duplo clique, esta propriedade está sempre definida como double_click.

Valores possíveis: double_click
Yes
x número inteiro A coordenada x onde ocorreu o duplo clique.
Yes
y número inteiro A coordenada y onde ocorreu o duplo clique.
Yes

Drag

Uma ação de arrasto.

Name Tipo Description Obrigatório Predefinição
caminho matriz Um conjunto de coordenadas que representam o caminho da ação de arrasto. As coordenadas aparecerão como um array de objetos, por exemplo[{ x: 100, y: 200 }, { x: 200, y: 300 }] Yes
tipo enumeração Especifica o tipo de evento. Para uma ação de arrasto, esta propriedade é sempre definida para drag.

Valores possíveis: drag
Yes

EasyInputMessage

Uma mensagem introduzida no modelo com um papel que indica a instrução seguindo a hierarquia. As instruções dadas com o developer papel ou system têm prioridade sobre as instruções dadas com o user papel. Presume-se que as mensagens com o assistant papel tenham sido geradas pelo modelo em interações anteriores.

Name Tipo Description Obrigatório Predefinição
conteúdo string ou InputMessageContentList Entrada de texto, imagem ou áudio para o modelo, usada para gerar uma resposta.
Pode também conter respostas anteriores de assistentes.
Yes
função enumeração O papel da entrada da mensagem. Um de user, assistant, system, ou developer.

Valores possíveis: user, assistant, system, developer
Yes
tipo enumeração O tipo de entrada da mensagem. Sempre message.

Valores possíveis: message
No

FileCitation

Uma citação para um ficheiro.

Name Tipo Description Obrigatório Predefinição
identificação_de_ficheiro cadeia (de caracteres) O ID do ficheiro.
Yes
indexar número inteiro O índice do ficheiro na lista de ficheiros.
Yes
tipo enumeração O tipo da citação do ficheiro. Sempre file_citation.

Valores possíveis: file_citation
Yes

FilePath

Um caminho para um ficheiro.

Name Tipo Description Obrigatório Predefinição
identificação_de_ficheiro cadeia (de caracteres) O ID do ficheiro.
Yes
indexar número inteiro O índice do ficheiro na lista de ficheiros.
Yes
tipo enumeração O tipo do caminho do ficheiro. Sempre file_path.

Valores possíveis: file_path
Yes

FileSearchRanker

O ranker a usar para a pesquisa de ficheiros. Se não for especificado, usará o auto classificador.

Propriedade valor
Description O ranker a usar para a pesquisa de ficheiros. Se não for especificado, usará o auto classificador.
Type cadeia (de caracteres)
Valores auto
default_2024_08_21

FileSearchTool

Uma ferramenta que procura conteúdos relevantes a partir de ficheiros carregados.

Name Tipo Description Obrigatório Predefinição
filters Filtro de Comparação ou Filtro Composto Um filtro a aplicar com base nos atributos do ficheiro. No
máximo_número_de_resultados número inteiro O número máximo de resultados a devolver. Este número deve estar entre 1 e 50, inclusive.
No
opções_de_classificação objecto Opções de classificação para pesquisa. No
└─ classificador enumeração O ranker a usar para a pesquisa de ficheiros.
Valores possíveis: auto, default-2024-11-15
No
└─ limiar_de_pontuação number O limiar de pontuação para a pesquisa de ficheiros, um número entre 0 e 1.
Números mais próximos de 1 tentarão devolver apenas os resultados mais relevantes, mas podem devolver menos resultados.
No 0
tipo enumeração O tipo da ferramenta de pesquisa de ficheiros. Sempre file_search.

Valores possíveis: file_search
Yes
identificadores_de_armazém_de_vectores matriz Os IDs do vetor armazenam-se para pesquisar.
Yes

FileSearchToolCall

Os resultados de uma chamada de ferramenta de pesquisa de ficheiros.

Name Tipo Description Obrigatório Predefinição
id cadeia (de caracteres) O ID único da ferramenta de pesquisa de ficheiros chama.
Yes
consultas matriz As consultas usadas para procurar ficheiros.
Yes
results matriz Os resultados da ferramenta de pesquisa de ficheiros chamam.
No
estado enumeração O estado da ferramenta de pesquisa de ficheiros chama. Um de in_progress, searching, incomplete ou failed,

Valores possíveis: in_progress, searching, completed, incomplete, failed
Yes
tipo enumeração O tipo de chamada da ferramenta de pesquisa de ficheiros. Sempre file_search_call.

Valores possíveis: file_search_call
Yes

FunctionTool

Define uma função no seu próprio código que o modelo pode escolher chamar.

Name Tipo Description Obrigatório Predefinição
description cadeia (de caracteres) Uma descrição da função. Usado pelo modelo para determinar se deve ou não chamar a função.
No
nome cadeia (de caracteres) O nome da função a chamar.
Yes
parameters objecto Um objeto de esquema JSON que descreve os parâmetros da função.
Yes
rigoroso boolean Se deve impor uma validação rigorosa dos parâmetros. Padrão true.
Yes
tipo enumeração O tipo da ferramenta funcional. Sempre function.

Valores possíveis: function
Yes

FunctionToolCall

Uma chamada de ferramenta para executar uma função.

Name Tipo Description Obrigatório Predefinição
arguments cadeia (de caracteres) Uma cadeia JSON dos argumentos para passar à função.
Yes
call_id cadeia (de caracteres) O ID único da chamada de ferramenta de função gerada pelo modelo.
Yes
id cadeia (de caracteres) O ID único da ferramenta de função chama.
Yes
nome cadeia (de caracteres) O nome da função a executar.
Yes
estado enumeração O estado do item. Um de in_progress, completed, ou incomplete. Preenche quando os itens são devolvidos via API.

Valores possíveis: in_progress, completed, incomplete
No
tipo enumeração O tipo de chamada da ferramenta funcional. Sempre function_call.

Valores possíveis: function_call
Yes

FunctionToolCallOutput

A saída de uma chamada de ferramenta funcional.

Name Tipo Description Obrigatório Predefinição
call_id cadeia (de caracteres) O ID único da chamada de ferramenta de função gerada pelo modelo.
Yes
id cadeia (de caracteres) O ID único da saída da chamada da ferramenta funcional. Preenchido quando este item é devolvido via API.
No
saída cadeia (de caracteres) Uma string JSON da saída da chamada à ferramenta de função.
Yes
estado enumeração O estado do item. Um de in_progress, completed, ou incomplete. Preenche quando os itens são devolvidos via API.

Valores possíveis: in_progress, completed, incomplete
No
tipo enumeração O tipo da ferramenta de função chama a saída. Sempre function_call_output.

Valores possíveis: function_call_output
Yes

FunctionToolCallOutputResource

Name Tipo Description Obrigatório Predefinição
call_id cadeia (de caracteres) O ID único da chamada de ferramenta de função gerada pelo modelo.
Yes
id cadeia (de caracteres) O ID único da saída da ferramenta de chamada de função.
Yes
saída cadeia (de caracteres) Uma string JSON da saída da chamada à ferramenta de função.
Yes
estado enumeração O estado do item. Um de in_progress, completed, ou incomplete. Preenche quando os itens são devolvidos via API.

Valores possíveis: in_progress, completed, incomplete
No
tipo enumeração O tipo da ferramenta de função chama a saída. Sempre function_call_output.

Valores possíveis: function_call_output
Yes

includable

Especifique dados de saída adicionais para incluir na resposta do modelo. Os valores atualmente suportados são:

  • file_search_call.results: Inclua os resultados de pesquisa da chamada da ferramenta de pesquisa de ficheiros.
  • message.input_image.image_url: Incluir URLs de imagem da mensagem de entrada.
  • computer_call_output.output.image_url: Incluir URLs de imagem da saída da chamada do computador.
Propriedade valor
Description Especifique dados de saída adicionais para incluir na resposta do modelo. Os valores atualmente suportados são:
- file_search_call.results: Inclua os resultados de pesquisa da chamada da ferramenta de pesquisa de ficheiros.
- message.input_image.image_url: Incluir URLs de imagem da mensagem de entrada.
- computer_call_output.output.image_url: Incluir URLs de imagem da saída da chamada do computador.
Type cadeia (de caracteres)
Valores file_search_call.results
message.input_image.image_url
computer_call_output.output.image_url

InputAudio

Uma entrada de áudio para o modelo.

Name Tipo Description Obrigatório Predefinição
dados cadeia (de caracteres) Dados de áudio codificados em base64.
Yes
format enumeração O formato dos dados de áudio. Os formatos atualmente suportados são mp3 e wav.

Valores possíveis: mp3, wav
Yes
tipo enumeração O tipo do item de entrada. Sempre input_audio.

Valores possíveis: input_audio
Yes

InputContent

Este componente pode ser um dos seguintes:

InputFile

Uma entrada de ficheiro para o modelo.

Name Tipo Description Obrigatório Predefinição
file_data cadeia (de caracteres) O conteúdo do ficheiro a ser enviado para o modelo.
No
identificação_de_ficheiro cadeia (de caracteres) O ID do ficheiro a ser enviado para o modelo.
No
filename cadeia (de caracteres) O nome do ficheiro a ser enviado ao modelo.
No
tipo enumeração O tipo do item de entrada. Sempre input_file.

Valores possíveis: input_file
Yes

InputImage

Uma entrada de imagem para o modelo.

Name Tipo Description Obrigatório Predefinição
detail enumeração O nível de detalhe da imagem a enviar ao modelo. Um de high, low, ou auto. Por defeito, é auto.

Valores possíveis: high, low, auto
Yes
identificação_de_ficheiro cadeia (de caracteres) O ID do ficheiro a ser enviado para o modelo.
No
image_url cadeia (de caracteres) O URL da imagem a ser enviada para o modelo. Uma URL totalmente qualificada ou imagem codificada base64 numa URL de dados.
No
tipo enumeração O tipo do item de entrada. Sempre input_image.

Valores possíveis: input_image
Yes

InputItem

Este componente pode ser um dos seguintes:

Mensagem de Entrada

Uma mensagem introduzida no modelo com um papel que indica a instrução seguindo a hierarquia. As instruções dadas com o developer papel ou system têm prioridade sobre as instruções dadas com o user papel.

Name Tipo Description Obrigatório Predefinição
conteúdo InputMessageContentList Uma lista de um ou vários itens de entrada para o modelo, contendo conteúdos diferentes
types.
Yes
função enumeração O papel da entrada da mensagem. Um de user, system, ou developer.

Valores possíveis: user, system, developer
Yes
estado enumeração O estado do item. Um de in_progress, completed, ou incomplete. Preenche quando os itens são devolvidos via API.

Valores possíveis: in_progress, completed, incomplete
No
tipo enumeração O tipo de entrada da mensagem. Sempre definido para message.

Valores possíveis: message
No

InputMessageContentList

Uma lista de um ou vários itens de entrada para o modelo, contendo diferentes tipos de conteúdo.

Nenhuma propriedade definida para este componente.

InputMessageResource

Name Tipo Description Obrigatório Predefinição
conteúdo InputMessageContentList Uma lista de um ou vários itens de entrada para o modelo, contendo conteúdos diferentes
types.
Yes
id cadeia (de caracteres) O ID único da entrada da mensagem.
Yes
função enumeração O papel da entrada da mensagem. Um de user, system, ou developer.

Valores possíveis: user, system, developer
Yes
estado enumeração O estado do item. Um de in_progress, completed, ou incomplete. Preenche quando os itens são devolvidos via API.

Valores possíveis: in_progress, completed, incomplete
No
tipo enumeração O tipo de entrada da mensagem. Sempre definido para message.

Valores possíveis: message
No

InputText

Uma entrada de texto para o modelo.

Name Tipo Description Obrigatório Predefinição
enviar SMS cadeia (de caracteres) O texto introduzido no modelo.
Yes
tipo enumeração O tipo do item de entrada. Sempre input_text.

Valores possíveis: input_text
Yes

Item

Item de conteúdo usado para gerar uma resposta.

Este componente pode ser um dos seguintes:

ItemReference

Um identificador interno para um item referenciar.

Name Tipo Description Obrigatório Predefinição
id cadeia (de caracteres) O ID do item para referência.
Yes
tipo enumeração O tipo de artigo a consultar. Sempre item_reference.

Valores possíveis: item_reference
Yes

ItemResource

Item de conteúdo usado para gerar uma resposta.

Este componente pode ser um dos seguintes:

KeyPress

Uma coleção de pressionamentos de teclas que o modelo gostaria de realizar.

Name Tipo Description Obrigatório Predefinição
keys matriz A combinação de teclas que o modelo pede para ser pressionada. Trata-se de um array de cadeias, cada uma representando uma tecla.
Yes
tipo enumeração Especifica o tipo de evento. Para uma ação de pressionar a tecla, esta propriedade é sempre definida para keypress.

Valores possíveis: keypress
Yes

Metadados

Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado e para consultar objetos através da API ou do dashboard.

As teclas são cadeias com um comprimento máximo de 64 caracteres. Os valores são cadeias com um comprimento máximo de 512 caracteres.

Nenhuma propriedade definida para este componente.

ModelResponseProperties

Name Tipo Description Obrigatório Predefinição
metadados Metadata Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado e para consultar objetos através da API ou do dashboard.

As teclas são cadeias com um comprimento máximo de 64 caracteres. Os valores são cadeias com um comprimento máximo de 512 caracteres.
No
modelo cadeia (de caracteres) Modelo usado para gerar as respostas. No
Temperatura number Que temperatura de amostragem usar, entre 0 e 2. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 tornam-na mais focada e determinística.
Geralmente recomendamos alterar isto ou top_p , mas não ambos.
No 1
top_p number Uma alternativa à amostragem com temperatura, chamada amostragem de núcleo, onde o modelo considera os resultados dos tokens com top_p massa de probabilidade. Portanto, 0,1 significa que apenas os tokens que compõem o top 10% massa de probabilidade são considerados.

Geralmente recomendamos alterar isto ou temperature , mas não ambos.
No 1
utilizador cadeia (de caracteres) Um identificador único que representa o seu utilizador final, que pode ajudar a OpenAI a monitorizar e detetar abusos. .
No

Mover

Uma ação de movimento de rato.

Name Tipo Description Obrigatório Predefinição
tipo enumeração Especifica o tipo de evento. Para uma ação de movimento, esta propriedade é sempre definida como move.

Valores possíveis: move
Yes
x número inteiro A coordenada x para onde se deve mover.
Yes
y número inteiro A coordenada Y para onde se deve mover.
Yes

OutputAudio

Uma saída de áudio do modelo.

Name Tipo Description Obrigatório Predefinição
dados cadeia (de caracteres) Dados de áudio codificados em Base64 do modelo.
Yes
transcrição cadeia (de caracteres) A transcrição dos dados áudio do modelo.
Yes
tipo enumeração O tipo de áudio de saída. Sempre output_audio.

Valores possíveis: output_audio
Yes

OutputContent

Este componente pode ser um dos seguintes:

OutputItem

Name Tipo Description Obrigatório Predefinição
ação ComputerAction Yes
arguments cadeia (de caracteres) Uma cadeia JSON dos argumentos para passar à função.
Yes
call_id cadeia (de caracteres) Um identificador usado ao responder à chamada de ferramenta com saída.
Yes
conteúdo matriz Raciocínio do conteúdo do texto.
Yes
id cadeia (de caracteres) O identificador único do conteúdo de raciocínio.
Yes
nome cadeia (de caracteres) O nome da função a executar.
Yes
pending_safety_checks matriz As verificações de segurança pendentes para a chamada no computador.
Yes
consultas matriz As consultas usadas para procurar ficheiros.
Yes
results matriz Os resultados da ferramenta de pesquisa de ficheiros chamam.
No
função enumeração O papel da mensagem de saída. Sempre assistant.

Valores possíveis: assistant
Yes
estado enumeração O estado do item. Um de in_progress, completed, ou incomplete. Preenche quando os itens são devolvidos via API.

Valores possíveis: in_progress, completed, incomplete
Yes
tipo enumeração O tipo do objeto. Sempre reasoning.

Valores possíveis: reasoning
Yes

OutputMessage

Uma mensagem de saída do modelo.

Name Tipo Description Obrigatório Predefinição
conteúdo matriz O conteúdo da mensagem de saída.
Yes
id cadeia (de caracteres) O ID único da mensagem de saída.
Yes
função enumeração O papel da mensagem de saída. Sempre assistant.

Valores possíveis: assistant
Yes
estado enumeração O estado da mensagem introduzida. Um de in_progress, completed, ou incomplete. Preenchido quando os itens de entrada são devolvidos via API.

Valores possíveis: in_progress, completed, incomplete
Yes
tipo enumeração O tipo da mensagem de saída. Sempre message.

Valores possíveis: message
Yes

OutputText

Uma saída de texto do modelo.

Name Tipo Description Obrigatório Predefinição
annotations matriz As anotações da saída do texto.
Yes
enviar SMS cadeia (de caracteres) A saída de texto do modelo.
Yes
tipo enumeração O tipo do texto de saída. Sempre output_text.

Valores possíveis: output_text
Yes

RealtimeSessionCreateRequest

Configuração de objetos de sessão em tempo real.

Name Tipo Description Obrigatório Predefinição
input_audio_format enumeração O formato do áudio de entrada. As opções são pcm16, g711_ulaw, ou g711_alaw.
Para pcm16, o áudio de entrada deve ser PCM de 16 bits a uma taxa de amostragem de 24kHz, ordem de um único canal (mono) e little-endian.

Valores possíveis: pcm16, g711_ulaw, g711_alaw
No
input_audio_noise_reduction objecto Configuração para redução de ruído de áudio de entrada. Isto pode ser configurado para null desligar.
A redução de ruído filtra o áudio adicionado ao buffer de áudio de entrada antes de ser enviado para o VAD e para o modelo.
Filtrar o áudio pode melhorar a precisão do VAD e da deteção de curvas (reduzindo falsos positivos) e o desempenho do modelo ao melhorar a perceção do áudio de entrada.
No
└─ tipo enumeração Tipo de redução de ruído. near_field é para microfones de conversa próxima, como auscultadores, é far_field para microfones de campo distante, como portáteis ou microfones de sala de conferências.

Valores possíveis: near_field, far_field
No
input_audio_transcription objecto Configuração para transcrição de áudio de entrada, por defeito desligado e pode ser definido para null desligar uma vez ligado. A transcrição de áudio de entrada não é nativa do modelo, pois o modelo consome áudio diretamente. A transcrição corre de forma assíncrona através do endpoint de Transcrições e deve ser tratada como orientação do conteúdo áudio de entrada, em vez do que exatamente o modelo ouviu. O cliente pode, opcionalmente, definir a linguagem e pedir para transcrição, que oferecem orientação adicional ao serviço de transcrição.
No
└─ língua cadeia (de caracteres) A linguagem do áudio de entrada. Fornecer a linguagem de entrada no formato ISO-639-1 (por exemplo, en) melhora a precisão e a latência.
No
└─ modelo cadeia (de caracteres) O modelo a usar para transcrição, as opções atuais são gpt-4o-transcribe, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15, e whisper-1.
No
└─ Prompt cadeia (de caracteres) Um texto opcional para guiar o estilo do modelo ou continuar um segmento áudio anterior.
Para whisper-1, o prompt é uma lista de palavras-chave.
Para gpt-4o-transcribe modelos, o prompt é uma cadeia de texto livre, por exemplo "espera palavras relacionadas com tecnologia".
No
instructions cadeia (de caracteres) As instruções padrão do sistema (ou seja, a mensagem do sistema) antecediam as chamadas de modelo. Este campo permite ao cliente orientar o modelo nas respostas desejadas. O modelo pode ser instruído sobre o conteúdo e o formato das respostas (por exemplo, "seja extremamente sucinto", "aja amigável", "aqui estão exemplos de boas respostas") e sobre o comportamento áudio (por exemplo, "fala depressa", "injeta emoção na tua voz", "ri frequentemente"). As instruções não são garantidas de serem seguidas pelo modelo, mas fornecem orientação ao modelo sobre o comportamento desejado.

Note que o servidor define instruções padrão que serão usadas se este campo não estiver definido e que são visíveis no session.created evento no início da sessão.
No
max_response_output_tokens inteiro ou cadeia Número máximo de tokens de saída para uma resposta de um único assistente, incluindo chamadas de ferramenta. Fornecer um número inteiro entre 1 e 4096 para limitar os tokens de saída, ou inf para o número máximo de tokens disponíveis para um dado modelo. Por defeito, é inf.
No
Modalidades O conjunto de modalidades com que o modelo pode responder. Para desativar o áudio, defina para ["texto"].
No
modelo cadeia (de caracteres) O nome da implantação usada para esta sessão.
No
output_audio_format enumeração O formato do áudio de saída. As opções são pcm16, g711_ulaw, ou g711_alaw.
Para pcm16, o áudio de saída é amostrado a uma taxa de 24kHz.

Valores possíveis: pcm16, g711_ulaw, g711_alaw
No
Temperatura number Temperatura de amostragem para o modelo, limitada a [0,6, 1,2]. Para modelos áudio, recomenda-se vivamente uma temperatura de 0,8 para melhor desempenho.
No 0.8
tool_choice cadeia (de caracteres) Como o modelo escolhe as ferramentas. As opções são auto, none, required, ou especificar uma função.
No automóvel
tools matriz Ferramentas (funções) disponíveis para o modelo. No
turn_detection objecto Configuração para deteção de turnos, ether Server VAD ou Semântic VAD. Isto pode ser definido para null desligar, caso em que o cliente terá de ativar manualmente a resposta do modelo.
O VAD do servidor significa que o modelo deteta o início e o fim da fala com base no volume do áudio e responde no final da fala do utilizador.
O VAD semântico é mais avançado e utiliza um modelo de deteção de curvas (em conjunto com o VAD) para estimar semanticamente se o utilizador terminou de falar, definindo depois dinamicamente um timeout com base nesta probabilidade. Por exemplo, se o áudio do utilizador se esmorecer com uhhm, o modelo terá uma baixa probabilidade de fim de turno e esperará mais tempo para que o utilizador continue a falar. Isto pode ser útil para conversas mais naturais, mas pode ter uma latência mais elevada.
No
└─ criar_resposta boolean Se deve ou não gerar automaticamente uma resposta quando ocorre um evento de paragem VAD.
No Verdade
└─ Entusiasmo enumeração Usado apenas para semantic_vad o modo. A vontade do modelo de responder. low Vai esperar mais tempo que o utilizador continue a falar, high vai responder mais rapidamente. auto é o padrão e é equivalente a medium.

Valores possíveis: low, medium, high, auto
No
└─ resposta_de_interrupção boolean Se deve ou não interromper automaticamente qualquer resposta em curso com saída para a conversa padrão (ou seja, conversation de auto) quando ocorre um evento de início VAD.
No Verdade
└─ preenchimento_prefixo_ms número inteiro Usado apenas para server_vad o modo. Quantidade de áudio a incluir antes do VAD detetar a fala (em milissegundos). Por defeito é 300ms.
No
└─ duração_do_silêncio_ms número inteiro Usado apenas para server_vad o modo. Duração do silêncio para detetar a paragem da fala (em milissegundos). Por defeito é 500ms. Com valores mais curtos, o modelo responderá mais rapidamente, mas pode entrar em pausas curtas do utilizador.
No
└─ limiar number Usado apenas para server_vad o modo. Limiar de ativação para VAD (0.0 a 1.0), este é por defeito 0.5. Um limiar mais elevado exigirá um áudio mais alto para ativar o modelo, podendo assim ter melhor desempenho em ambientes ruidosos.
No
└─ tipo enumeração Tipo de deteção de curva.

Valores possíveis: server_vad, semantic_vad
No
Voz VoiceIdsShared No

RealtimeSessionCreateResponse

Uma nova configuração de sessão em tempo real, com uma chave efémera. O TTL padrão para as chaves é de um minuto.

Name Tipo Description Obrigatório Predefinição
client_secret objecto Chave efémera devolvida pela API. Yes
└─ expira_em número inteiro Carimbo temporal para quando o token expira. Atualmente, todos os tokens expiram após um minuto.
No
└─ valor cadeia (de caracteres) Chave efémera utilizável em ambientes de cliente para autenticar ligações à API de Tempo Real. Use isto em ambientes do lado do cliente em vez de um token API padrão, que só deve ser usado do lado do servidor.
No
input_audio_format cadeia (de caracteres) O formato do áudio de entrada. As opções são pcm16, g711_ulaw, ou g711_alaw.
No
input_audio_transcription objecto Configuração para transcrição de áudio de entrada, por defeito desligado e pode ser definido para null desligar uma vez ligado. A transcrição de áudio de entrada não é nativa do modelo, pois o modelo consome áudio diretamente. A transcrição corre assíncrona através do Whisper e deve ser tratada como orientação aproximada, em vez da representação compreendida pelo modelo.
No
└─ modelo cadeia (de caracteres) O modelo a usar para transcrição whisper-1 é o único modelo atualmente suportado.
No
instructions cadeia (de caracteres) As instruções padrão do sistema (ou seja, a mensagem do sistema) antecediam as chamadas de modelo. Este campo permite ao cliente orientar o modelo nas respostas desejadas. O modelo pode ser instruído sobre o conteúdo e formato das respostas (por exemplo, "seja extremamente sucinto", "aja de forma amigável", "aqui estão exemplos de boas respostas") e sobre o comportamento áudio (por exemplo, "fala depressa", "injeta emoção na tua voz", "ri frequentemente"). As instruções não são garantidas de serem seguidas pelo modelo, mas fornecem orientação ao modelo sobre o comportamento desejado.
Note que o servidor define instruções padrão que serão usadas se este campo não estiver definido e que são visíveis no session.created evento no início da sessão.
No
max_response_output_tokens inteiro ou cadeia Número máximo de tokens de saída para uma resposta de um único assistente, incluindo chamadas de ferramenta. Fornecer um número inteiro entre 1 e 4096 para limitar os tokens de saída, ou inf para o número máximo de tokens disponíveis para um dado modelo. Por defeito, é inf.
No
Modalidades O conjunto de modalidades com que o modelo pode responder. Para desativar o áudio, defina para ["texto"].
No
output_audio_format cadeia (de caracteres) O formato do áudio de saída. As opções são pcm16, g711_ulaw, ou g711_alaw.
No
Temperatura number Temperatura de amostragem para o modelo, limitada a [0,6, 1,2]. Por defeito é 0,8.
No
tool_choice cadeia (de caracteres) Como o modelo escolhe as ferramentas. As opções são auto, none, required, ou especificar uma função.
No
tools matriz Ferramentas (funções) disponíveis para o modelo. No
turn_detection objecto Configuração para deteção de curvas. Pode ser definido para null desligar. O VAD do servidor significa que o modelo deteta o início e o fim da fala com base no volume do áudio e responde no final da fala do utilizador.
No
└─ preenchimento_prefixo_ms número inteiro Quantidade de áudio a incluir antes do VAD detetar a fala (em milissegundos). Por defeito é 300ms.
No
└─ duração_do_silêncio_ms número inteiro Duração do silêncio para detetar a paragem da fala (em milissegundos). Por defeito é 500ms. Com valores mais curtos, o modelo responderá mais rapidamente, mas pode entrar em pausas curtas do utilizador.
No
└─ limiar number Limiar de ativação para VAD (0.0 a 1.0), este é por defeito 0.5. Um limiar mais elevado exigirá um áudio mais alto para ativar o modelo, podendo assim ter melhor desempenho em ambientes ruidosos.
No
└─ tipo cadeia (de caracteres) Só o tipo de deteção de turno server_vad é atualmente suportado.
No
Voz VoiceIdsShared No

RealtimeTranscriptionSessionCreateRequest

Configuração em tempo real de objetos de sessão de transcrição.

Name Tipo Description Obrigatório Predefinição
include matriz O conjunto de itens a incluir na transcrição. Os itens atualmente disponíveis são:
- item.input_audio_transcription.logprobs
No
input_audio_format enumeração O formato do áudio de entrada. As opções são pcm16, g711_ulaw, ou g711_alaw.
Para pcm16, o áudio de entrada deve ser PCM de 16 bits a uma taxa de amostragem de 24kHz, ordem de um único canal (mono) e little-endian.

Valores possíveis: pcm16, g711_ulaw, g711_alaw
No
input_audio_noise_reduction objecto Configuração para redução de ruído de áudio de entrada. Isto pode ser configurado para null desligar.
A redução de ruído filtra o áudio adicionado ao buffer de áudio de entrada antes de ser enviado para o VAD e para o modelo.
Filtrar o áudio pode melhorar a precisão do VAD e da deteção de curvas (reduzindo falsos positivos) e o desempenho do modelo ao melhorar a perceção do áudio de entrada.
No
└─ tipo enumeração Tipo de redução de ruído. near_field é para microfones de conversa próxima, como auscultadores, é far_field para microfones de campo distante, como portáteis ou microfones de sala de conferências.

Valores possíveis: near_field, far_field
No
input_audio_transcription objecto Configuração para transcrição áudio de entrada. O cliente pode, opcionalmente, definir a linguagem e pedir para transcrição, que oferecem orientação adicional ao serviço de transcrição.
No
└─ língua cadeia (de caracteres) A linguagem do áudio de entrada. Fornecer a linguagem de entrada no formato ISO-639-1 (por exemplo, en) melhora a precisão e a latência.
No
└─ modelo enumeração O modelo a usar para transcrição, as opções atuais são gpt-4o-transcribe, gpt-4o-transcribe-diarize, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15, e whisper-1.

Valores possíveis: gpt-4o-transcribe, gpt-4o-transcribe-diarize, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15, whisper-1
No
└─ Prompt cadeia (de caracteres) Um texto opcional para guiar o estilo do modelo ou continuar um segmento áudio anterior.
Para whisper-1, o prompt é uma lista de palavras-chave.
Para gpt-4o-transcribe modelos, o prompt é uma cadeia de texto livre, por exemplo "espera palavras relacionadas com tecnologia".
No
Modalidades O conjunto de modalidades com que o modelo pode responder. Para desativar o áudio, defina para ["texto"].
No
turn_detection objecto Configuração para deteção de turnos, ether Server VAD ou Semântic VAD. Isto pode ser definido para null desligar, caso em que o cliente terá de ativar manualmente a resposta do modelo.
O VAD do servidor significa que o modelo deteta o início e o fim da fala com base no volume do áudio e responde no final da fala do utilizador.
O VAD semântico é mais avançado e utiliza um modelo de deteção de curvas (em conjunto com o VAD) para estimar semanticamente se o utilizador terminou de falar, definindo depois dinamicamente um timeout com base nesta probabilidade. Por exemplo, se o áudio do utilizador se esmorecer com uhhm, o modelo terá uma baixa probabilidade de fim de turno e esperará mais tempo para que o utilizador continue a falar. Isto pode ser útil para conversas mais naturais, mas pode ter uma latência mais elevada.
No
└─ criar_resposta boolean Se deve ou não gerar automaticamente uma resposta quando ocorre um evento de paragem VAD. Não disponível para sessões de transcrição.
No Verdade
└─ Entusiasmo enumeração Usado apenas para semantic_vad o modo. A vontade do modelo de responder. low Vai esperar mais tempo que o utilizador continue a falar, high vai responder mais rapidamente. auto é o padrão e é equivalente a medium.

Valores possíveis: low, medium, high, auto
No
└─ resposta_de_interrupção boolean Se deve ou não interromper automaticamente qualquer resposta em curso com saída para a conversa padrão (ou seja, conversation de auto) quando ocorre um evento de início VAD. Não disponível para sessões de transcrição.
No Verdade
└─ preenchimento_prefixo_ms número inteiro Usado apenas para server_vad o modo. Quantidade de áudio a incluir antes do VAD detetar a fala (em milissegundos). Por defeito é 300ms.
No
└─ duração_do_silêncio_ms número inteiro Usado apenas para server_vad o modo. Duração do silêncio para detetar a paragem da fala (em milissegundos). Por defeito é 500ms. Com valores mais curtos, o modelo responderá mais rapidamente, mas pode entrar em pausas curtas do utilizador.
No
└─ limiar number Usado apenas para server_vad o modo. Limiar de ativação para VAD (0.0 a 1.0), este é por defeito 0.5. Um limiar mais elevado exigirá um áudio mais alto para ativar o modelo, podendo assim ter melhor desempenho em ambientes ruidosos.
No
└─ tipo enumeração Tipo de deteção de curva.

Valores possíveis: server_vad, semantic_vad
No

RealtimeTranscriptionSessionCreateResponse

Uma nova configuração de sessão de transcrição em tempo real.

Quando uma sessão é criada no servidor através da API REST, o objeto de sessão contém também uma chave efémera. O TTL padrão para as chaves é de um minuto. Esta propriedade não está presente quando uma sessão é atualizada através da API WebSocket.

Name Tipo Description Obrigatório Predefinição
client_secret objecto Chave efémera devolvida pela API. Só está presente quando a sessão é criada no servidor via API REST.
Yes
└─ expira_em número inteiro Carimbo temporal para quando o token expira. Atualmente, todos os tokens expiram após um minuto.
No
└─ valor cadeia (de caracteres) Chave efémera utilizável em ambientes de cliente para autenticar ligações à API de Tempo Real. Use isto em ambientes do lado do cliente em vez de um token API padrão, que só deve ser usado do lado do servidor.
No
input_audio_format cadeia (de caracteres) O formato do áudio de entrada. As opções são pcm16, g711_ulaw, ou g711_alaw.
No
input_audio_transcription objecto Configuração do modelo de transcrição.
No
└─ língua cadeia (de caracteres) A linguagem do áudio de entrada. Fornecer a linguagem de entrada no formato ISO-639-1 (por exemplo, en) melhora a precisão e a latência.
No
└─ modelo enumeração O modelo a usar para transcrição. Pode ser gpt-4o-transcribe, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15, ou whisper-1.

Valores possíveis: gpt-4o-transcribe, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15, whisper-1
No
└─ Prompt cadeia (de caracteres) Um texto opcional para guiar o estilo do modelo ou continuar um segmento áudio anterior. O prompt deve corresponder à linguagem do áudio.
No
Modalidades O conjunto de modalidades com que o modelo pode responder. Para desativar o áudio, defina para ["texto"].
No
turn_detection objecto Configuração para deteção de curvas. Pode ser definido para null desligar. O VAD do servidor significa que o modelo deteta o início e o fim da fala com base no volume do áudio e responde no final da fala do utilizador.
No
└─ preenchimento_prefixo_ms número inteiro Quantidade de áudio a incluir antes do VAD detetar a fala (em milissegundos). Por defeito é 300ms.
No
└─ duração_do_silêncio_ms número inteiro Duração do silêncio para detetar a paragem da fala (em milissegundos). Por defeito é 500ms. Com valores mais curtos, o modelo responderá mais rapidamente, mas pode entrar em pausas curtas do utilizador.
No
└─ limiar number Limiar de ativação para VAD (0.0 a 1.0), este é por defeito 0.5. Um limiar mais elevado exigirá um áudio mais alto para ativar o modelo, podendo assim ter melhor desempenho em ambientes ruidosos.
No
└─ tipo cadeia (de caracteres) Só o tipo de deteção de turno server_vad é atualmente suportado.
No

Raciocínio

Opções de configuração para modelos de raciocínio.

Name Tipo Description Obrigatório Predefinição
effort ReasoningEffort Limita o esforço de raciocínio para modelos de raciocínio.
Os valores atualmente suportados são low, medium, e high. Reduzir o esforço de raciocínio pode resultar em respostas mais rápidas e menos tokens usados no raciocínio numa resposta.
Yes meio
resumo enumeração Um resumo do raciocínio realizado pelo modelo. Isto pode ser útil para depurar e compreender o processo de raciocínio do modelo.
Um de concise ou detailed.

Valores possíveis: concise, detailed
No

ReasoningItem

Uma descrição da cadeia de pensamento usada por um modelo de raciocínio ao gerar uma resposta.

Name Tipo Description Obrigatório Predefinição
conteúdo matriz Raciocínio do conteúdo do texto.
Yes
id cadeia (de caracteres) O identificador único do conteúdo de raciocínio.
Yes
estado enumeração O estado do item. Um de in_progress, completed, ou incomplete. Preenche quando os itens são devolvidos via API.

Valores possíveis: in_progress, completed, incomplete
No
tipo enumeração O tipo do objeto. Sempre reasoning.

Valores possíveis: reasoning
Yes

Refusal

Uma recusa da modelo.

Name Tipo Description Obrigatório Predefinição
refusal cadeia (de caracteres) A explicação da recusa do modelo.
Yes
tipo enumeração O tipo de recusa. Sempre refusal.

Valores possíveis: refusal
Yes

response

Name Tipo Description Obrigatório Predefinição
criado_em number Carimbo temporal do Unix (em segundos) de quando esta resposta foi criada.
Yes
erro ResponseError Um objeto de erro devolvido quando o modelo falha em gerar uma Resposta.
Yes
id cadeia (de caracteres) Identificador único para esta Resposta.
Yes
incomplete_details objecto Detalhes sobre porque é que a resposta está incompleta.
Yes
└─ Justificação enumeração A razão pela qual a resposta está incompleta.
Valores possíveis: max_output_tokens, content_filter
No
instructions cadeia (de caracteres) Insere uma mensagem do sistema (ou do desenvolvedor) como o primeiro elemento no contexto do modelo.

Ao usar junto com previous_response_id, as instruções de uma resposta anterior não serão transferidas para a resposta seguinte. Isto facilita a troca de mensagens do sistema (ou do programador) em novas respostas.
Yes
max_output_tokens número inteiro Um limite superior para o número de tokens que podem ser gerados para uma resposta, incluindo tokens de saída visíveis e estado de conversa.
No
metadados Metadata Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado e para consultar objetos através da API ou do dashboard.

As teclas são cadeias com um comprimento máximo de 64 caracteres. Os valores são cadeias com um comprimento máximo de 512 caracteres.
Yes
modelo cadeia (de caracteres) Modelo usado para gerar as respostas. Yes
objecto enumeração O tipo de objeto deste recurso - sempre definido para response.

Valores possíveis: response
Yes
saída matriz Uma variedade de conteúdos gerados pelo modelo.

- O comprimento e a ordem dos itens no output array dependem da resposta do modelo.
- Em vez de aceder ao primeiro item do output array e assumir que é uma assistant mensagem com o conteúdo gerado pelo modelo, pode considerar usar a output_text propriedade onde suportada nos SDKs.
Yes
output_text cadeia (de caracteres) Propriedade de conveniência apenas SDK que contém o texto agregado de saída de todos os output_text itens do output array, se houver algum.
Suportado nos SDKs de Python e JavaScript.
No
chamadas_de_ferramentas_em_paralelo boolean Se permitir que o modelo execute chamadas de ferramenta em paralelo.
Yes Verdade
previous_response_id cadeia (de caracteres) O ID único da resposta anterior ao modelo. Usa isto para criar conversas com vários turnos. No
reasoning Reasoning Opções de configuração para modelos de raciocínio.
No
estado enumeração O estado da geração de resposta. Um de completed, failed, in_progress, ou incomplete.

Valores possíveis: completed, failed, in_progress, incomplete
No
Temperatura number Que temperatura de amostragem usar, entre 0 e 2. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 tornam-na mais focada e determinística.
Geralmente recomendamos alterar isto ou top_p , mas não ambos.
Yes 1
enviar SMS objecto Opções de configuração para uma resposta de texto do modelo. Pode ser texto simples ou dados JSON estruturados. Saiba mais:
- entradas e saídas de texto
- Saídas Estruturadas
No
└─ formato TextResponseFormatConfiguration Um objeto que especifica o formato que o modelo deve gerar.

Configurar { "type": "json_schema" } ativa o Structured Outputs, que garante que o modelo corresponde ao seu esquema JSON fornecido. O formato padrão é { "type": "text" } sem opções adicionais.

Não recomendado para gpt-4o e modelos mais recentes:

Configurar para { "type": "json_object" } ativar o modo JSON mais antigo, que garante que a mensagem gerada pelo modelo é JSON válida. O uso json_schema é preferido para modelos que o suportam.
No
tool_choice OpçõesDeEscolhaFerramenta ou TiposEscolhaFerramenta ou FunçãoDeEscolhaFerramenta Como o modelo deve escolher qual ferramenta (ou ferramentas) usar ao gerar uma resposta. Consulte o tools parâmetro para ver como especificar que ferramentas o modelo pode chamar.
Yes
tools matriz Um conjunto de ferramentas que o modelo pode invocar enquanto gera uma resposta. Podes especificar qual ferramenta usar definindo o tool_choice parâmetro.

As duas categorias de ferramentas que pode fornecer ao modelo são:

- Ferramentas incorporadas
Yes
top_p number Uma alternativa à amostragem com temperatura, chamada amostragem de núcleo, onde o modelo considera os resultados dos tokens com top_p massa de probabilidade. Portanto, 0,1 significa que apenas os tokens que compõem o top 10% massa de probabilidade são considerados.

Geralmente recomendamos alterar isto ou temperature , mas não ambos.
Yes 1
truncation enumeração A estratégia de truncamento a usar para a resposta do modelo.
- auto: Se o contexto desta resposta e das anteriores exceder o tamanho da janela de contexto do modelo, o modelo truncará a resposta para se ajustar à janela de contexto, eliminando itens de entrada a meio da conversa.
- disabled (padrão): Se uma resposta de modelo exceder o tamanho da janela de contexto para um modelo, o pedido falhará com um erro 400.

Valores possíveis: auto, disabled
No
utilização ResponseUsage Representa detalhes de utilização dos tokens, incluindo tokens de entrada, tokens de saída, uma divisão dos tokens de saída e o total de tokens utilizados.
No
utilizador cadeia (de caracteres) Um identificador único que representa o seu utilizador final, que pode ajudar a OpenAI a monitorizar e detetar abusos. .
No

ResponseAudioDeltaEvent

Emitido quando há uma resposta parcial de áudio.

Name Tipo Description Obrigatório Predefinição
delta cadeia (de caracteres) Um bloco de bytes de resposta codificada em Base64.
Yes
tipo enumeração O tipo de evento. Sempre response.audio.delta.

Valores possíveis: response.audio.delta
Yes

ResponseAudioDoneEvent

Emitido quando a resposta áudio está completa.

Name Tipo Description Obrigatório Predefinição
tipo enumeração O tipo de evento. Sempre response.audio.done.

Valores possíveis: response.audio.done
Yes

ResponseAudioTranscriptDeltaEvent

Emitido quando existe uma transcrição parcial do áudio.

Name Tipo Description Obrigatório Predefinição
delta cadeia (de caracteres) A transcrição parcial da resposta áudio.
Yes
tipo enumeração O tipo de evento. Sempre response.audio.transcript.delta.

Valores possíveis: response.audio.transcript.delta
Yes

ResponseAudioTranscriptDoneEvent

Emitido quando a transcrição áudio completa está concluída.

Name Tipo Description Obrigatório Predefinição
tipo enumeração O tipo de evento. Sempre response.audio.transcript.done.

Valores possíveis: response.audio.transcript.done
Yes

ResponseCodeInterpreterCallCodeDeltaEvent

Emitido quando um excerto parcial de código é adicionado pelo interpretador de código.

Name Tipo Description Obrigatório Predefinição
delta cadeia (de caracteres) O excerto parcial de código adicionado pelo interpretador de código.
Yes
output_index número inteiro O índice do item de saída que o interpretador de código chama está em progresso.
Yes
tipo enumeração O tipo de evento. Sempre response.code_interpreter_call.code.delta.

Valores possíveis: response.code_interpreter_call.code.delta
Yes

ResponseCodeInterpreterCallCodeDoneEvent

Emitido quando a saída do excerto de código é finalizada pelo interpretador de código.

Name Tipo Description Obrigatório Predefinição
código cadeia (de caracteres) O excerto final de código produzido pelo interpretador de código.
Yes
output_index número inteiro O índice do item de saída que o interpretador de código chama está em progresso.
Yes
tipo enumeração O tipo de evento. Sempre response.code_interpreter_call.code.done.

Valores possíveis: response.code_interpreter_call.code.done
Yes

ResponseCodeInterpreterCallCompletedEvent

Emitido quando a chamada ao interpretador de código é concluída.

Name Tipo Description Obrigatório Predefinição
code_interpreter_call CodeInterpreterToolCall Uma chamada de ferramenta para executar código.
Yes
output_index número inteiro O índice do item de saída que o interpretador de código chama está em progresso.
Yes
tipo enumeração O tipo de evento. Sempre response.code_interpreter_call.completed.

Valores possíveis: response.code_interpreter_call.completed
Yes

ResponseCodeInterpreterCallInProgressEvent

Emitido quando uma chamada de interpretador de código está em curso.

Name Tipo Description Obrigatório Predefinição
code_interpreter_call CodeInterpreterToolCall Uma chamada de ferramenta para executar código.
Yes
output_index número inteiro O índice do item de saída que o interpretador de código chama está em progresso.
Yes
tipo enumeração O tipo de evento. Sempre response.code_interpreter_call.in_progress.

Valores possíveis: response.code_interpreter_call.in_progress
Yes

ResponseCodeInterpreterCallInterpretingEvent

Emitido quando o interpretador de código está a interpretar ativamente o fragmento de código.

Name Tipo Description Obrigatório Predefinição
code_interpreter_call CodeInterpreterToolCall Uma chamada de ferramenta para executar código.
Yes
output_index número inteiro O índice do item de saída que o interpretador de código chama está em progresso.
Yes
tipo enumeração O tipo de evento. Sempre response.code_interpreter_call.interpreting.

Valores possíveis: response.code_interpreter_call.interpreting
Yes

ResponseCompletedEvent

Emitido quando a resposta do modelo está concluída.

Name Tipo Description Obrigatório Predefinição
response response Yes
tipo enumeração O tipo de evento. Sempre response.completed.

Valores possíveis: response.completed
Yes

ResponseContentPartAddedEvent

Emitido quando uma nova parte de conteúdo é adicionada.

Name Tipo Description Obrigatório Predefinição
content_index número inteiro O índice da parte de conteúdo que foi adicionada.
Yes
item_id cadeia (de caracteres) O ID do item de saída ao qual a parte de conteúdo foi adicionada.
Yes
output_index número inteiro O índice do item de saída ao qual a parte de conteúdo foi adicionada.
Yes
part OutputContent Yes
tipo enumeração O tipo de evento. Sempre response.content_part.added.

Valores possíveis: response.content_part.added
Yes

ResponseContentPartDoneEvent

Emitido quando uma parte de conteúdo é concluída.

Name Tipo Description Obrigatório Predefinição
content_index número inteiro O índice da parte do conteúdo que é feita.
Yes
item_id cadeia (de caracteres) O ID do item de saída ao qual a parte de conteúdo foi adicionada.
Yes
output_index número inteiro O índice do item de saída ao qual a parte de conteúdo foi adicionada.
Yes
part OutputContent Yes
tipo enumeração O tipo de evento. Sempre response.content_part.done.

Valores possíveis: response.content_part.done
Yes

ResponseCreatedEvent

Um evento que é emitido quando uma resposta é criada.

Name Tipo Description Obrigatório Predefinição
response response Yes
tipo enumeração O tipo de evento. Sempre response.created.

Valores possíveis: response.created
Yes

ResponseError

Um objeto de erro devolvido quando o modelo falha em gerar uma Resposta.

Name Tipo Description Obrigatório Predefinição
código ResponseErrorCode O código de erro da resposta.
Yes
mensagem cadeia (de caracteres) Uma descrição legível para humanos do erro.
Yes

ResponseErrorCode

O código de erro da resposta.

Propriedade valor
Description O código de erro da resposta.
Type cadeia (de caracteres)
Valores server_error
rate_limit_exceeded
invalid_prompt
vector_store_timeout
invalid_image
invalid_image_format
invalid_base64_image
invalid_image_url
image_too_large
image_too_small
image_parse_error
image_content_policy_violation
invalid_image_mode
image_file_too_large
unsupported_image_media_type
empty_image_file
failed_to_download_image
image_file_not_found

ResponseErrorEvent

Emitido quando ocorre um erro.

Name Tipo Description Obrigatório Predefinição
código cadeia (de caracteres) O código de erro.
Yes
mensagem cadeia (de caracteres) A mensagem de erro.
Yes
param cadeia (de caracteres) O parâmetro de erro.
Yes
tipo enumeração O tipo de evento. Sempre error.

Valores possíveis: error
Yes

ResponseFailedEvent

Um evento que é emitido quando uma resposta falha.

Name Tipo Description Obrigatório Predefinição
response response Yes
tipo enumeração O tipo de evento. Sempre response.failed.

Valores possíveis: response.failed
Yes

ResponseFileSearchCallCompletedEvent

Emitido quando uma chamada de pesquisa de ficheiro é concluída (resultados encontrados).

Name Tipo Description Obrigatório Predefinição
item_id cadeia (de caracteres) O ID do item de saída que a pesquisa de ficheiro é iniciado.
Yes
output_index número inteiro O índice do item de saída que a pesquisa de ficheiro é iniciado.
Yes
tipo enumeração O tipo de evento. Sempre response.file_search_call.completed.

Valores possíveis: response.file_search_call.completed
Yes

ResponseFileSearchCallInProgressEvent

Emitido quando uma chamada de pesquisa de ficheiro é iniciada.

Name Tipo Description Obrigatório Predefinição
item_id cadeia (de caracteres) O ID do item de saída que a pesquisa de ficheiro é iniciado.
Yes
output_index número inteiro O índice do item de saída que a pesquisa de ficheiro é iniciado.
Yes
tipo enumeração O tipo de evento. Sempre response.file_search_call.in_progress.

Valores possíveis: response.file_search_call.in_progress
Yes

ResponseFileSearchCallSearchingEvent

Emitido quando uma pesquisa de ficheiros está atualmente a ser pesquisada.

Name Tipo Description Obrigatório Predefinição
item_id cadeia (de caracteres) O ID do item de saída que a pesquisa de ficheiro é iniciado.
Yes
output_index número inteiro O índice do item de saída que a pesquisa de ficheiro chama está a pesquisar.
Yes
tipo enumeração O tipo de evento. Sempre response.file_search_call.searching.

Valores possíveis: response.file_search_call.searching
Yes

ResponseFunctionCallArgumentsDeltaEvent

Emitido quando existe um delta parcial de argumentos de chamada de função.

Name Tipo Description Obrigatório Predefinição
delta cadeia (de caracteres) Os argumentos de chamada de função delta que são adicionados.
Yes
item_id cadeia (de caracteres) O ID do item de saída ao qual o delta dos argumentos da chamada de função é adicionado.
Yes
output_index número inteiro O índice do item de saída ao qual o delta dos argumentos da chamada de função é somado.
Yes
tipo enumeração O tipo de evento. Sempre response.function_call_arguments.delta.

Valores possíveis: response.function_call_arguments.delta
Yes

ResponseFunctionCallArgumentsDoneEvent

Emitido quando os argumentos de chamada de função são finalizados.

Name Tipo Description Obrigatório Predefinição
arguments cadeia (de caracteres) Os argumentos da chamada de funções. Yes
item_id cadeia (de caracteres) A identificação do item. Yes
output_index número inteiro O índice do item de saída. Yes
tipo enumeração
Valores possíveis: response.function_call_arguments.done
Yes

ResponseInProgressEvent

Emitido quando a resposta está em andamento.

Name Tipo Description Obrigatório Predefinição
response response Yes
tipo enumeração O tipo de evento. Sempre response.in_progress.

Valores possíveis: response.in_progress
Yes

ResponseIncompleteEvent

Um evento que é emitido quando uma resposta termina como incompleta.

Name Tipo Description Obrigatório Predefinição
response response Yes
tipo enumeração O tipo de evento. Sempre response.incomplete.

Valores possíveis: response.incomplete
Yes

responseItemList

Uma lista de itens de Resposta.

Name Tipo Description Obrigatório Predefinição
dados matriz Uma lista dos itens usados para gerar esta resposta. Yes
first_id cadeia (de caracteres) O ID do primeiro item da lista. Yes
tem_mais boolean Se há mais artigos disponíveis. Yes
last_id cadeia (de caracteres) O ID do último item da lista. Yes
objecto enumeração O tipo de objeto devolvido deve ser list.
Valores possíveis: list
Yes

ResponseModalities

Tipos de saída que gostaria que o modelo gerasse. A maioria dos modelos é capaz de gerar texto, que é o padrão:

["text"]

O gpt-4o-audio-preview modelo também pode ser usado para gerar áudio. Para solicitar que este modelo gere tanto respostas de texto como áudio, pode usar:

["text", "audio"]

Nenhuma propriedade definida para este componente.

ResponseModalitiesTextOnly

Tipos de saída que gostaria que o modelo gerasse. A maioria dos modelos é capaz de gerar texto, que é o padrão:

["text"]

Esta API irá em breve suportar outras modalidades de saída, incluindo áudio e imagens.

Nenhuma propriedade definida para este componente.

ResponseOutputItemAddedEvent

Emitido quando um novo item de saída é adicionado.

Name Tipo Description Obrigatório Predefinição
item OutputItem Yes
output_index número inteiro O índice do item de saída que foi adicionado.
Yes
tipo enumeração O tipo de evento. Sempre response.output_item.added.

Valores possíveis: response.output_item.added
Yes

ResponseOutputItemDoneEvent

Emitido quando um item de saída é marcado como concluído.

Name Tipo Description Obrigatório Predefinição
item OutputItem Yes
output_index número inteiro O índice do item de saída que foi marcado como feito.
Yes
tipo enumeração O tipo de evento. Sempre response.output_item.done.

Valores possíveis: response.output_item.done
Yes

ResponseProperties

Name Tipo Description Obrigatório Predefinição
instructions cadeia (de caracteres) Insere uma mensagem do sistema (ou do desenvolvedor) como o primeiro elemento no contexto do modelo.

Ao usar junto com previous_response_id, as instruções de uma resposta anterior não serão transferidas para a resposta seguinte. Isto facilita a troca de mensagens do sistema (ou do programador) em novas respostas.
No
max_output_tokens número inteiro Um limite superior para o número de tokens que podem ser gerados para uma resposta, incluindo tokens de saída visíveis e estado de conversa.
No
previous_response_id cadeia (de caracteres) O ID único da resposta anterior ao modelo. Usa isto para criar conversas com vários turnos. No
reasoning Reasoning Opções de configuração para modelos de raciocínio.
No
enviar SMS objecto Opções de configuração para uma resposta de texto do modelo. Pode ser texto simples ou dados JSON estruturados. Saiba mais:
- entradas e saídas de texto
- Saídas Estruturadas
No
└─ formato TextResponseFormatConfiguration Um objeto que especifica o formato que o modelo deve gerar.

Configurar { "type": "json_schema" } ativa o Structured Outputs, que garante que o modelo corresponde ao seu esquema JSON fornecido. O formato padrão é { "type": "text" } sem opções adicionais.

Não recomendado para gpt-4o e modelos mais recentes:

Configurar para { "type": "json_object" } ativar o modo JSON mais antigo, que garante que a mensagem gerada pelo modelo é JSON válida. O uso json_schema é preferido para modelos que o suportam.
No
tool_choice OpçõesDeEscolhaFerramenta ou TiposEscolhaFerramenta ou FunçãoDeEscolhaFerramenta Como o modelo deve escolher qual ferramenta (ou ferramentas) usar ao gerar uma resposta. Consulte o tools parâmetro para ver como especificar que ferramentas o modelo pode chamar.
No
tools matriz Um conjunto de ferramentas que o modelo pode invocar enquanto gera uma resposta. Podes especificar qual ferramenta usar definindo o tool_choice parâmetro.

As duas categorias de ferramentas que pode fornecer ao modelo são:

- Ferramentas incorporadas
No
truncation enumeração A estratégia de truncamento a usar para a resposta do modelo.
- auto: Se o contexto desta resposta e das anteriores exceder o tamanho da janela de contexto do modelo, o modelo truncará a resposta para se ajustar à janela de contexto, eliminando itens de entrada a meio da conversa.
- disabled (padrão): Se uma resposta de modelo exceder o tamanho da janela de contexto para um modelo, o pedido falhará com um erro 400.

Valores possíveis: auto, disabled
No

ResponseRefusalDeltaEvent

Emitido quando há um texto de recusa parcial.

Name Tipo Description Obrigatório Predefinição
content_index número inteiro O índice da parte de conteúdo a que o texto de recusa é adicionado.
Yes
delta cadeia (de caracteres) O texto de recusa que é adicionado.
Yes
item_id cadeia (de caracteres) O ID do item de saída ao qual o texto de recusa é adicionado.
Yes
output_index número inteiro O índice do item de saída ao qual o texto de recusa é adicionado.
Yes
tipo enumeração O tipo de evento. Sempre response.refusal.delta.

Valores possíveis: response.refusal.delta
Yes

ResponseRefusalDoneEvent

Emitido quando o texto de recusa é finalizado.

Name Tipo Description Obrigatório Predefinição
content_index número inteiro O índice do conteúdo da parte onde o texto da recusa está finalizado.
Yes
item_id cadeia (de caracteres) O ID do item de saída onde o texto de recusa está finalizado.
Yes
output_index número inteiro O índice do item de saída onde o texto de recusa está finalizado.
Yes
refusal cadeia (de caracteres) O texto de recusa está finalizado.
Yes
tipo enumeração O tipo de evento. Sempre response.refusal.done.

Valores possíveis: response.refusal.done
Yes

responseStreamEvent

Name Tipo Description Obrigatório Predefinição
anotação Annotation Yes
annotation_index número inteiro O índice da anotação que foi adicionada.
Yes
arguments cadeia (de caracteres) Os argumentos da chamada de funções. Yes
código cadeia (de caracteres) O código de erro.
Yes
code_interpreter_call CodeInterpreterToolCall Uma chamada de ferramenta para executar código.
Yes
content_index número inteiro O índice do conteúdo, parte onde o conteúdo do texto está finalizado.
Yes
delta cadeia (de caracteres) A diferença de texto que foi adicionada.
Yes
item OutputItem O item de saída que foi marcado como concluído.
Yes
item_id cadeia (de caracteres) O ID do item de saída onde o conteúdo do texto está finalizado.
Yes
mensagem cadeia (de caracteres) A mensagem de erro.
Yes
output_index número inteiro O índice do item de saída onde o conteúdo do texto está finalizado.
Yes
param cadeia (de caracteres) O parâmetro de erro.
Yes
part OutputContent A parte do conteúdo que está feita.
Yes
refusal cadeia (de caracteres) O texto de recusa está finalizado.
Yes
response response A resposta que estava incompleta.
Yes
enviar SMS cadeia (de caracteres) O conteúdo do texto que é finalizado.
Yes
tipo enumeração O tipo de evento. Sempre response.output_text.done.

Valores possíveis: response.output_text.done
Yes

ResponseTextAnnotationDeltaEvent

Emitido quando uma anotação de texto é adicionada.

Name Tipo Description Obrigatório Predefinição
anotação Annotation Yes
annotation_index número inteiro O índice da anotação que foi adicionada.
Yes
content_index número inteiro O índice da parte de conteúdo a que a anotação de texto foi adicionada.
Yes
item_id cadeia (de caracteres) O ID do item de saída ao qual a anotação de texto foi adicionada.
Yes
output_index número inteiro O índice do item de saída ao qual a anotação de texto foi adicionada.
Yes
tipo enumeração O tipo de evento. Sempre response.output_text.annotation.added.

Valores possíveis: response.output_text.annotation.added
Yes

ResponseTextDeltaEvent

Emitido quando há um delta adicional de texto.

Name Tipo Description Obrigatório Predefinição
content_index número inteiro O índice da parte de conteúdo a que foi adicionado o delta de texto.
Yes
delta cadeia (de caracteres) A diferença de texto que foi adicionada.
Yes
item_id cadeia (de caracteres) O ID do item de saída ao qual a delta de texto foi adicionada.
Yes
output_index número inteiro O índice do item de saída ao qual a delta de texto foi adicionada.
Yes
tipo enumeração O tipo de evento. Sempre response.output_text.delta.

Valores possíveis: response.output_text.delta
Yes

ResponseTextDoneEvent

Emitido quando o conteúdo de texto é finalizado.

Name Tipo Description Obrigatório Predefinição
content_index número inteiro O índice do conteúdo, parte onde o conteúdo do texto está finalizado.
Yes
item_id cadeia (de caracteres) O ID do item de saída onde o conteúdo do texto está finalizado.
Yes
output_index número inteiro O índice do item de saída onde o conteúdo do texto está finalizado.
Yes
enviar SMS cadeia (de caracteres) O conteúdo do texto que é finalizado.
Yes
tipo enumeração O tipo de evento. Sempre response.output_text.done.

Valores possíveis: response.output_text.done
Yes

ResponseUsage

Representa detalhes de utilização dos tokens, incluindo tokens de entrada, tokens de saída, uma divisão dos tokens de saída e o total de tokens utilizados.

Name Tipo Description Obrigatório Predefinição
input_tokens número inteiro O número de tokens de entrada. Yes
output_tokens número inteiro O número de tokens de saída. Yes
output_tokens_details objecto Uma análise detalhada dos tokens de saída. Yes
└─ tokens de raciocínio número inteiro O número de fichas de raciocínio. No
total_tokens número inteiro O número total de fichas usadas. Yes

Screenshot

Uma ação de captura de ecrã.

Name Tipo Description Obrigatório Predefinição
tipo enumeração Especifica o tipo de evento. Para uma ação de captura de ecrã, esta propriedade está sempre definida como screenshot.

Valores possíveis: screenshot
Yes

Scroll

Uma ação de pergaminho.

Name Tipo Description Obrigatório Predefinição
scroll_x número inteiro A distância do scroll horizontal.
Yes
scroll_y número inteiro A distância do scroll vertical.
Yes
tipo enumeração Especifica o tipo de evento. Para uma ação de scroll, esta propriedade é sempre definida como scroll.

Valores possíveis: scroll
Yes
x número inteiro A coordenada x onde ocorreu o scroll.
Yes
y número inteiro A coordenada y onde o scroll ocorreu.
Yes

StopConfiguration

Até 4 sequências em que a API deixa de gerar mais tokens. O texto devolvido não conterá a sequência de paragens.

Este componente pode ser um dos seguintes:

TextResponseFormatConfiguration

Um objeto que especifica o formato que o modelo deve gerar.

Configurar { "type": "json_schema" } permite Saídas Estruturadas, que garantem que o modelo corresponde ao seu esquema JSON fornecido.

O formato padrão é { "type": "text" } sem opções adicionais.

Não recomendado para gpt-4o e modelos mais recentes:

Configurar para { "type": "json_object" } ativar o modo JSON mais antigo, que garante que a mensagem gerada pelo modelo é JSON válida. O uso json_schema é preferido para modelos que o suportam.

Este componente pode ser um dos seguintes:

TextResponseFormatJsonSchema

Formato de resposta do esquema JSON. Usado para gerar respostas JSON estruturadas. Saiba mais sobre Saídas Estruturadas.

Name Tipo Description Obrigatório Predefinição
description cadeia (de caracteres) Uma descrição do que serve o formato de resposta, usada pelo modelo para determinar como responder nesse formato.
No
nome cadeia (de caracteres) O nome do formato da resposta. Devem ser de a z, de A a Z, de 0 a 9, ou conter sublinhados e traços, com um comprimento máximo de 64.
No
esquema ResponseFormatJsonSchemaSchema O esquema para o formato de resposta, descrito como um objeto de Esquema JSON. Yes
rigoroso boolean Se deve ativar a adesão estrita ao esquema ao gerar a saída.
Se definido como verdadeiro, o modelo seguirá sempre o esquema exato definido no schema campo. Apenas um subconjunto do esquema JSON é suportado quando strict é true.
No Falso
tipo enumeração O tipo de formato de resposta que está a ser definido. Sempre json_schema.
Valores possíveis: json_schema
Yes

Tool

Este componente pode ser um dos seguintes:

ToolChoiceFunction

Use esta opção para forçar o modelo a chamar uma função específica.

Name Tipo Description Obrigatório Predefinição
nome cadeia (de caracteres) O nome da função a chamar. Yes
tipo enumeração Para chamadas de funções, o tipo é sempre function.
Valores possíveis: function
Yes

ToolChoiceOptions

Controla qual (se houver) ferramenta chamada pelo modelo.

none significa que o modelo não chama nenhuma ferramenta e, em vez disso, gera uma mensagem.

auto significa que o modelo pode escolher entre gerar uma mensagem ou chamar uma ou mais ferramentas.

required significa que o modelo tem de chamar uma ou mais ferramentas.

Propriedade valor
Description Controla qual (se houver) ferramenta chamada pelo modelo.

none significa que o modelo não chama nenhuma ferramenta e, em vez disso, gera uma mensagem.

auto significa que o modelo pode escolher entre gerar uma mensagem ou chamar uma ou mais ferramentas.

required significa que o modelo tem de chamar uma ou mais ferramentas.
Type cadeia (de caracteres)
Valores none
auto
required

ToolChoiceTypes

Indica que o modelo deve usar uma ferramenta incorporada para gerar uma resposta.

Name Tipo Description Obrigatório Predefinição
tipo enumeração O tipo de ferramenta alojada que o modelo deve usar. Os valores permitidos são:
- file_search
- computer_use_preview

Valores possíveis: file_search, computer_use_preview
Yes

Tipo

Uma ação para escrever texto.

Name Tipo Description Obrigatório Predefinição
enviar SMS cadeia (de caracteres) O texto para escrever.
Yes
tipo enumeração Especifica o tipo de evento. Para uma ação de tipo, esta propriedade é sempre definida como type.

Valores possíveis: type
Yes

UpdateVectorStoreFileAttributesRequest

Name Tipo Description Obrigatório Predefinição
attributes VectorStoreFileAttributes Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado e para consultar objetos através da API ou do dashboard. As teclas são cadeias com um comprimento máximo de 64 caracteres. Os valores são cadeias com um comprimento máximo de 512 caracteres, booleanos ou números.
Yes

UrlCitation

Uma citação para um recurso web usado para gerar uma resposta de modelo.

Name Tipo Description Obrigatório Predefinição
end_index número inteiro O índice do último carácter da citação do URL na mensagem.
Yes
start_index número inteiro O índice do primeiro carácter da citação URL na mensagem.
Yes
título cadeia (de caracteres) O título do recurso web.
Yes
tipo enumeração O tipo da citação do URL. Sempre url_citation.

Valores possíveis: url_citation
Yes
url cadeia (de caracteres) A URL do recurso web.
Yes

VectorStoreFileAttributes

Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado e para consultar objetos através da API ou do dashboard. As teclas são cadeias com um comprimento máximo de 64 caracteres. Os valores são cadeias com um comprimento máximo de 512 caracteres, booleanos ou números.

Nenhuma propriedade definida para este componente.

VectorStoreFileContentResponse

Representa o conteúdo analisado de um ficheiro de armazenamento vetorial.

Name Tipo Description Obrigatório Predefinição
dados matriz Conteúdo analisado do ficheiro. Yes
tem_mais boolean Indica se há mais páginas de conteúdo para buscar. Yes
next_page cadeia (de caracteres) O token para a página seguinte, se houver. Yes
objecto enumeração O tipo de objeto, que é sempre vector_store.file_content.page
Valores possíveis: vector_store.file_content.page
Yes

VectorStoreSearchRequest

Name Tipo Description Obrigatório Predefinição
filters Filtro de Comparação ou Filtro Composto Um filtro a aplicar com base nos atributos do ficheiro. No
máximo_número_de_resultados número inteiro O número máximo de resultados a devolver. Este número deve estar entre 1 e 50, inclusive. No 10
consulta String ou array Uma cadeia de consulta para uma pesquisa Yes
opções_de_classificação objecto Opções de classificação para pesquisa. No
└─ classificador enumeração Valores possíveis: auto, default-2024-11-15 No
└─ limiar_de_pontuação number No 0
rewrite_query boolean Se deve reescrever a consulta em linguagem natural para pesquisa vetorial. No Falso

VectorStoreSearchResultContentObject

Name Tipo Description Obrigatório Predefinição
enviar SMS cadeia (de caracteres) O conteúdo do texto retornou da pesquisa. Yes
tipo enumeração O tipo de conteúdo.
Valores possíveis: text
Yes

VectorStoreSearchResultItem

Name Tipo Description Obrigatório Predefinição
attributes VectorStoreFileAttributes Conjunto de 16 pares-chave-valor que podem ser anexados a um objeto. Isto pode ser útil para armazenar informação adicional sobre o objeto num formato estruturado e para consultar objetos através da API ou do dashboard. As teclas são cadeias com um comprimento máximo de 64 caracteres. Os valores são cadeias com um comprimento máximo de 512 caracteres, booleanos ou números.
Yes
conteúdo matriz Fragmentos de conteúdo do ficheiro. Yes
identificação_de_ficheiro cadeia (de caracteres) O ID do ficheiro de armazenamento vetorial. Yes
filename cadeia (de caracteres) O nome do ficheiro de armazenamento vetorial. Yes
classificação number A pontuação de semelhança para o resultado. Yes

VectorStoreSearchResultsPage

Name Tipo Description Obrigatório Predefinição
dados matriz A lista de itens de resultados de pesquisa. Yes
tem_mais boolean Indica se há mais resultados para buscar. Yes
next_page cadeia (de caracteres) O token para a página seguinte, se houver. Yes
objecto enumeração O tipo de objeto, que é sempre vector_store.search_results.page
Valores possíveis: vector_store.search_results.page
Yes
search_query matriz Yes

VoiceIdsShared

Nenhuma propriedade definida para este componente.

Wait

Uma ação de espera.

Name Tipo Description Obrigatório Predefinição
tipo enumeração Especifica o tipo de evento. Para uma ação de espera, esta propriedade é sempre definida para wait.

Valores possíveis: wait
Yes

ReasoningEffort

Limita o esforço de raciocínio para modelos de raciocínio. Os valores atualmente suportados são low, medium, e high. Reduzir o esforço de raciocínio pode resultar em respostas mais rápidas e menos tokens usados no raciocínio numa resposta.

Propriedade valor
Description Limita o esforço de raciocínio para modelos de raciocínio.
Os valores atualmente suportados são low, medium, e high. Reduzir o esforço de raciocínio pode resultar em respostas mais rápidas e menos tokens usados no raciocínio numa resposta.
Type cadeia (de caracteres)
Predefinição meio
Valores low
medium
high

errorEvent

Ocorre quando ocorre um erro. Isto pode acontecer devido a um erro interno do servidor ou a um timeout.

Name Tipo Description Obrigatório Predefinição
dados error Yes
evento cadeia (de caracteres) Yes

Enum do evento: ErrorEventEnum

valor Description
erro

feitoEvento

Ocorre quando um stream termina.

Name Tipo Description Obrigatório Predefinição
dados cadeia (de caracteres) Yes
evento cadeia (de caracteres) Yes

evento Enum: DoneEventEnum

valor Description
concluído

Enum de dados: DoneEventDataEnum

valor Description
[FEITO]

Passos seguintes

Aprenda sobre Modelos e ajuste fino com a API REST. Saiba mais sobre os modelos subjacentes que alimentam Azure OpenAI.