Referência da API REST de imagem e áudio Azure OpenAI (2025-04-01-preview)

Este artigo documenta as operações de geração de imagens e inferência de planos de dados de áudio (voz) na API REST para o Azure OpenAI no 2025-04-01-preview lançamento. Para conclusãos de chat, embeddings, assistentes, respostas, armazenamentos vetoriais e todas as outras operações, consulte a referência oficial da API REST do Azure OpenAI.

Especificações da API

A gestão e interação com modelos e recursos OpenAI do Azure está dividida em três superfícies principais de API:

  • Plano de controlo
  • Plano de dados - autoria
  • Plano de dados - inferência

Cada superfície/especificação API encapsula um conjunto diferente de capacidades do Azure OpenAI. Cada API tem o seu próprio conjunto único de pré-visualização e versões de APIs estáveis/geralmente disponíveis (GA). Atualmente, os lançamentos de pré-visualização tendem a seguir uma cadência mensal.

Important

Agora existe uma nova API de inferência de pré-visualização. Saiba mais no nosso guia do ciclo de vida da API.

API Última versão de pré-visualização Última versão da GA Specifications Description
Plano de controlo 2025-07-01-preview 2025-06-01 Arquivos de especificações A API do plano de controlo é usada para operações como criação de recursos, implementação de modelos e outras tarefas de gestão de recursos de nível superior. O plano de controlo também regula o que é possível fazer com capacidades como Azure Resource Manager, Bicep, Terraform e CLI do Azure.
Plano de dados v1 preview v1 Arquivos de especificações A API do plano de dados controla as operações de inferência e autoria.

Authentication

O Azure OpenAI fornece dois métodos para autenticação. Pode usar API Keys ou Microsoft Entra ID.

  • Autenticação de Chave API: Para este tipo de autenticação, todos os pedidos de API devem incluir a Chave API no api-key cabeçalho HTTP. O Quickstart fornece orientações sobre como fazer chamadas com este tipo de autenticação.

  • Microsoft Entra ID: Pode autenticar uma chamada API usando um token Microsoft Entra. Os tokens de autenticação são incluídos num pedido como Authorization cabeçalho. O token fornecido deve ser precedido por Bearer, por exemplo Bearer YOUR_AUTH_TOKEN. Pode ler o nosso guia prático sobre autenticação com Microsoft Entra ID.

Versionamento da API REST

As APIs dos serviços são versionadas usando o api-version parâmetro de consulta. Todas as versões seguem a estrutura de datas YYYY-MM-DD. Por exemplo:

POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/chat/completions?api-version=2024-06-01

Inferência do plano de dados

O restante deste artigo aborda as operações de imagem e áudio na 2025-04-01-preview versão de pré-visualização da especificação de inferência do plano de dados do Azure OpenAI.

Para as operações de imagem e áudio GA, consulte a referência REST API de imagem GA e áudio.

Transcrições - Criar

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

Transcreve o áudio para a língua de entrada.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
ID de implementação caminho Yes cadeia (de caracteres)
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: multipart/form-data

Name Tipo Description Obrigatório Predefinição
modelo cadeia (de caracteres) ID do modelo a usar. As opções são gpt-4o-transcribe, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15, whisper-1, e gpt-4o-transcribe-diarize. Yes
ficheiro cadeia (de caracteres) O objeto do ficheiro áudio para transcrever. Yes
linguagem cadeia (de caracteres) A linguagem do áudio de entrada. Fornecer a linguagem de entrada no formato ISO-639-1 melhora a precisão e a latência. No
avisar cadeia (de caracteres) Um texto opcional para guiar o estilo do modelo ou continuar um segmento áudio anterior. O prompt deve corresponder à linguagem do áudio. No
formato_de_resposta audioResponseFormat Define o formato da saída. No
Temperatura number A temperatura de amostragem, entre 0 e 1. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 tornam-na mais focada e determinística. Se definido para 0, o modelo usa a probabilidade logarítmica para aumentar automaticamente a temperatura até que certos limiares sejam atingidos. No 0
timestamp_granularities[] matriz As granularidades do carimbo temporal para preencher esta transcrição. response_format deve ser definido verbose_json para usar granularidades de carimbo temporal. Uma ou ambas estas opções são suportadas: word, ou segment. Nota: Não existe latência adicional para carimbos temporais de segmentos, mas gerar carimbos temporais de palavra implica latência adicional. No ['segmento']

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON objecto
texto/sem formatação cadeia (de caracteres) Texto transcrito no formato de saída (quando response_format era um dos text, vtt ou srt).

Exemplos

Exemplo

Obtém texto transcrito e metadados associados a partir dos dados de áudio falado fornecidos.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

Respostas: Código de Estado: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Exemplo

Obtém texto transcrito e metadados associados a partir dos dados de áudio falado fornecidos.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Respostas: Código de Estado: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Traduções - Create

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

Transcreve e traduz áudio de entrada para texto em inglês.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
ID de implementação caminho Yes cadeia (de caracteres)
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: multipart/form-data

Name Tipo Description Obrigatório Predefinição
ficheiro cadeia (de caracteres) O ficheiro de áudio para traduzir. Yes
avisar cadeia (de caracteres) Um texto opcional para guiar o estilo do modelo ou continuar um segmento áudio anterior. O enunciado deve estar em inglês. No
formato_de_resposta audioResponseFormat Define o formato da saída. No
Temperatura number A temperatura de amostragem, entre 0 e 1. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 tornam-na mais focada e determinística. Se definido para 0, o modelo usa a probabilidade logarítmica para aumentar automaticamente a temperatura até que certos limiares sejam atingidos. No 0

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
Application/JSON objecto
texto/sem formatação cadeia (de caracteres) Texto transcrito no formato de saída (quando response_format era texto, vtt ou srt).

Exemplos

Exemplo

Obtém texto transcrito em inglês e metadados associados a partir dos dados de áudio falado fornecidos.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Respostas: Código de Estado: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Exemplo

Obtém texto transcrito em inglês e metadados associados a partir dos dados de áudio falado fornecidos.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Respostas: Código de Estado: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Fala - Criar

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview

Gera áudio a partir do texto de entrada.

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
ID de implementação caminho Yes cadeia (de caracteres)
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: multipart/form-data

Name Tipo Description Obrigatório Predefinição
dados introduzidos cadeia (de caracteres) O texto para sintetizar áudio. O comprimento máximo é de 4.096 caracteres. Yes
formato_de_resposta enumeração O formato para sintetizar o áudio.
Valores possíveis: mp3, opus, aac, flac, wav, pcm
No
Velocidade number A velocidade do áudio sintetizado. Selecione um valor de 0.25 para 4.0. 1.0 é o padrão. No 1.0
Voz enumeração A voz a usar para síntese de voz.
Valores possíveis: alloy, echo, fable, onyx, nova, shimmer
Yes

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo Type Description
application/octet-stream cadeia (de caracteres)

Exemplos

Exemplo

Sintetiza áudio a partir do texto fornecido.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview

{
 "input": "Hi! What are you going to make?",
 "voice": "fable",
 "response_format": "mp3"
}

Respostas: Código de Estado: 200

{
  "body": "101010101"
}

Gerações de imagens - Criar

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview

Gera um lote de imagens a partir de uma legenda de texto numa dada implementação de modelo de geração de imagens

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
ID de implementação caminho Yes cadeia (de caracteres)
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: application/json

Name Tipo Description Obrigatório Predefinição
em segundo plano imageBackground Permite definir transparência para o fundo das imagens geradas. Este parâmetro é apenas suportado para modelos da série gpt-image-1. No automóvel
n número inteiro O número de imagens a gerar. Para dall-e-3, apenas n=1 é suportado. No 1
compressão_de_saída número inteiro O nível de compressão (0-100%) para as imagens geradas. Este parâmetro é suportado apenas para modelos da série gpt-image-1 com o formato de saída jpeg. No 100
formato_de_saida imagesOutputFormat O formato de ficheiro no qual as imagens geradas são devolvidas. Apenas suportado para modelos da série gpt-image-1. No png
avisar cadeia (de caracteres) Uma descrição em texto da(s) imagem(ões) desejada(s). O comprimento máximo é de 32000 caracteres para a série gpt-image-1 e 4000 caracteres para dall-e-3 Yes
imagens parciais número inteiro O número de imagens parciais a gerar. Este parâmetro é usado para respostas em streaming que devolvem imagens parciais. O valor deve estar entre 0 e 3. Quando definido para 0, a resposta será uma única imagem enviada num evento de streaming. Note que a imagem final pode ser enviada antes de o número total de imagens parciais ser gerado, se a imagem completa for gerada mais rapidamente. 0
fluxo boolean Edita a imagem em modo streaming. não false
qualidade qualidade de imagem A qualidade da imagem que será gerada. No automóvel
formato_de_resposta imagesResponseFormat O formato em que as imagens geradas são devolvidas. Este parâmetro não é suportado para gpt-image-1modelos da série -que retornam sempre imagens codificadas base64.
Valores possíveis: url, b64_json.
No url
size imageSize O tamanho das imagens geradas. No automóvel
Estilo imageStyle O estilo das imagens geradas. Só é suportado para DALL-E-3. No vívido
utilizador cadeia (de caracteres) Um identificador único que representa o seu utilizador final, que pode ajudar a monitorizar e detetar abusos. No

Respostas

Código de Estado: 200

Descrição: Ok

Tipo de conteúdo Type Description
Application/JSON generateImagesResponse

Código de Estado: padrão

Descrição: Ocorreu um erro.

Tipo de conteúdo Type Description
Application/JSON dalleErrorResponse

Exemplos

Exemplo

Cria imagens com um prompt.

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview

{
 "prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
 "n": 1,
 "style": "natural",
 "quality": "standard"
}

Respostas: Código de Estado: 200

{
  "body": {
    "created": 1698342300,
    "data": [
      {
        "revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
        "prompt_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          },
          "profanity": {
            "detected": false,
            "filtered": false
          },
          "custom_blocklists": {
            "filtered": false,
            "details": []
          }
        },
        "url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
        "content_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          }
        }
      }
    ]
  }
}

Gerações de imagens - Editar

POST https://{endpoint}/openai/deployments/{deployment-id}/images/edits?api-version=2025-04-01-preview

Edita uma imagem a partir de uma legenda de texto numa dada implementação de modelo gpt-image-1

Parâmetros de URI

Name Em Obrigatório Tipo Description
ponto final caminho Yes URL de string Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
ID de implementação caminho Yes cadeia (de caracteres)
Versão da API consulta Yes cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name Obrigatório Tipo Description
Authorization Verdade cadeia (de caracteres) Exemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para gerar um token de autenticação usando CLI do Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de Autorização: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Âmbito: https://ai.azure.com/.default
chave de API Verdade cadeia (de caracteres) Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: multipart/form-data

Name Tipo Description Obrigatório Predefinição
imagem String ou array A(s) imagem(s) a editar. Deve ser um ficheiro de imagem suportado ou um array de imagens. Cada imagem deve ser um ficheiro png ou jpg com menos de 50MB. Yes
input_fidelity cadeia (de caracteres) Controla quanto esforço o modelo irá fazer para corresponder ao estilo e às características, especialmente as características faciais, das imagens de entrada. Este parâmetro é apenas suportado para modelos da série gpt-image-1. Suportes high e low. não low.
máscara cadeia (de caracteres) Uma imagem adicional cujas áreas totalmente transparentes (por exemplo, onde alfa é zero) indica onde a imagem deve ser editada. Se forem fornecidas várias imagens, a máscara será aplicada à primeira imagem. Deve ser um ficheiro PNG válido, com menos de 4MB, e ter as mesmas dimensões da imagem. No
n número inteiro O número de imagens a gerar. Deve estar entre 1 e 10. No 1
avisar cadeia (de caracteres) Uma descrição em texto da(s) imagem(ões) desejada(s). O comprimento máximo é de 32000 caracteres. Yes
qualidade qualidade de imagem A qualidade da imagem que será gerada. No automóvel
imagens parciais O número de imagens parciais a gerar. Este parâmetro é usado para respostas em streaming que devolvem imagens parciais. O valor deve estar entre 0 e 3. Quando definido para 0, a resposta será uma única imagem enviada num evento de streaming. Note que a imagem final pode ser enviada antes de o número total de imagens parciais ser gerado, se a imagem completa for gerada mais rapidamente.
fluxo boolean Edita a imagem em modo streaming. não false
formato_de_resposta imagesResponseFormat O formato em que as imagens geradas são devolvidas. No url
size imageSize O tamanho das imagens geradas. No automóvel
utilizador cadeia (de caracteres) Um identificador único que representa o seu utilizador final, que pode ajudar a monitorizar e detetar abusos. No

Respostas

Código de Estado: 200

Descrição: Ok

Tipo de conteúdo Type Description
Application/JSON generateImagesResponse

Código de Estado: padrão

Descrição: Ocorreu um erro.

Tipo de conteúdo Type Description
Application/JSON dalleErrorResponse

Components

Para as definições de esquema usadas pelo chat, completions, embeddings, respostas e outras operações de texto, veja a referência à API REST do Azure OpenAI. Os seguintes esquemas suportam as operações de imagem e áudio nesta página.

innerErrorCode

Códigos de erro para o objeto de erro interno.

Propriedade valor
Description Códigos de erro para o objeto de erro interno.
Type cadeia (de caracteres)
Valores ResponsibleAIPolicyViolation

dalleErrorResponse

Name Tipo Description Obrigatório Predefinição
erro dalleError No

dalleError

Name Tipo Description Obrigatório Predefinição
inner_error dalleInnerError Erro interno com detalhes adicionais. No
param cadeia (de caracteres) No
tipo cadeia (de caracteres) No

dalleInnerError

Erro interno com detalhes adicionais.

Name Tipo Description Obrigatório Predefinição
código innerErrorCode Códigos de erro para o objeto de erro interno. No
content_filter_results dalleFilterResults Informação sobre a categoria de filtragem de conteúdos (ódio, sexual, violência, self_harm), se foi detetada, bem como o nível de gravidade (escala very_low, baixa, média, alta que determina a intensidade e o nível de risco do conteúdo nocivo) e se foi filtrada ou não. Informação sobre conteúdos de jailbreak e palavrões, se foram detetados e se foram filtrados ou não. E informação sobre a lista de bloqueio de clientes, se foi filtrada e o seu ID. No
Proposta de Melhorias: - Certificar-se de que as frases e termos são traduzidos corretamente para refletir o mesmo significado do texto de origem. - Adaptar quaisquer termos em inglês que possam ser traduzidos naturalmente para português, preservando o seu significado. - Corrigir quaisquer questões gramaticais para aumentar a fluência e a legibilidade em português. - Usar a estrutura de frases em português natural para que a tradução soe nativa. - Verificar o uso apropriado de pontuação e registro para o português. cadeia (de caracteres) O prompt que foi usado para gerar a imagem, caso tenha havido alguma revisão ao prompt. No

resultadoDeSeveridadeDoFiltroDeConteúdo

Name Tipo Description Obrigatório Predefinição
filtered boolean Yes
severity cadeia (de caracteres) No

resultado de deteção de filtro de conteúdo

Name Tipo Description Obrigatório Predefinição
detected boolean No
filtered boolean Yes

contentFilterDetailedResults

Resultados de filtragem de conteúdo com um detalhe dos IDs dos filtros de conteúdo para os segmentos filtrados.

Name Tipo Description Obrigatório Predefinição
details matriz No
filtered boolean Yes

dalleFilterResults

Informação sobre a categoria de filtragem de conteúdos (ódio, sexual, violência, self_harm), se foi detetada, bem como o nível de gravidade (escala very_low, baixa, média, alta que determina a intensidade e o nível de risco do conteúdo nocivo) e se foi filtrada ou não. Informação sobre conteúdos de jailbreak e palavrões, se foram detetados e se foram filtrados ou não. E informação sobre a lista de bloqueio de clientes, se foi filtrada e o seu ID.

Name Tipo Description Obrigatório Predefinição
custom_blocklists contentFilterDetailedResults Resultados de filtragem de conteúdo com um detalhe dos IDs dos filtros de conteúdo para os segmentos filtrados. No
hate resultadoDaGravidadeDoFiltroDeConteúdo No
jailbreak resultadoDetetadoDoFiltroDeConteúdo No
profanity resultadoDetetadoDoFiltroDeConteúdo No
self_harm resultadoDaGravidadeDoFiltroDeConteúdo No
sexual resultadoDaGravidadeDoFiltroDeConteúdo No
violence resultadoDaGravidadeDoFiltroDeConteúdo No

audioResponseFormat

Define o formato da saída.

Propriedade valor
Description Define o formato da saída.
Type cadeia (de caracteres)
Valores json
text
srt
verbose_json
vtt

qualidade de imagem

A qualidade da imagem que será gerada.

Propriedade valor
Description A qualidade da imagem que será gerada.
Type cadeia (de caracteres)
Predefinição automóvel
Valores auto
high
medium
low
hd
standard

imagesResponseFormat

O formato em que as imagens geradas são devolvidas.

Propriedade valor
Description O formato em que as imagens geradas são devolvidas.
Type cadeia (de caracteres)
Predefinição url
Valores url
b64_json

imagesOutputFormat

O formato de ficheiro no qual as imagens geradas são devolvidas. Só é suportado para modelos em série.

Propriedade valor
Description O formato de ficheiro no qual as imagens geradas são devolvidas. Apenas suportado para modelos da série gpt-image-1.
Type cadeia (de caracteres)
Predefinição png
Valores png
jpeg

imageSize

O tamanho das imagens geradas.

Propriedade valor
Description O tamanho das imagens geradas.
Type cadeia (de caracteres)
Predefinição automóvel
Valores auto
1792x1024
1024x1792
1024x1024
1024x1536
1536x1024

imageStyle

O estilo das imagens geradas. Só é suportado para DALL-E-3.

Propriedade valor
Description O estilo das imagens geradas. Só é suportado para DALL-E-3.
Type cadeia (de caracteres)
Predefinição vívido
Valores vivid
natural

imageBackground

Permite definir transparência para o fundo da(s) imagem(s) gerada(s). Este parâmetro é apenas suportado para modelos da série gpt-image-1.

Propriedade valor
Description Permite definir transparência para o fundo da(s) imagem(s) gerada(s). Este parâmetro é apenas suportado para modelos da série gpt-image-1.
Type cadeia (de caracteres)
Predefinição automóvel
Valores transparent
opaque
auto

generateImagesResponse

Name Tipo Description Obrigatório Predefinição
criado número inteiro O carimbo temporal do unix quando a operação foi criada. Yes
dados matriz Os dados de resultado da operação, se bem-sucedidos Yes
utilização imageGenerationsUsage Representa detalhes de utilização de tokens para pedidos de geração de imagens. Apenas para modelos da série GPT-image-1. No

imageGenerationsUsage

Representa detalhes de utilização de tokens para pedidos de geração de imagens. Apenas para modelos da série GPT-image-1.

Name Tipo Description Obrigatório Predefinição
input_tokens número inteiro O número de tokens de entrada. No
input_tokens_details objecto Uma análise detalhada dos tokens de entrada. No
└─ image_tokens número inteiro O número de tokens de imagem. No
└─ text_tokens número inteiro O número de tokens de texto. No
output_tokens número inteiro O número de tokens de saída. No
total_tokens número inteiro O número total de fichas usadas. No

Passos seguintes

Aprenda sobre modelos e ajuste fino com a API REST. Saiba mais sobre os modelos subjacentes que alimentam Azure OpenAI.