Azure referência da API REST de áudio e imagem do OpenAI (2025-04-01-preview)

Este artigo documenta a geração de imagem e as operações da API REST de inferência do plano de dados de áudio (fala) para Azure OpenAI na 2025-04-01-preview versão. Para conclusões de chat, inserções, assistentes, respostas, repositórios de vetores e todas as outras operações, consulte a referência oficial da API REST do Azure OpenAI.

Especificações de API

Gerenciar e interagir com modelos e recursos do OpenAI do Azure é dividido em três superfícies principais de API:

Painel de controle
Plano de dados - autoria
Plano de dados - inferência

Cada superfície/especificação de API encapsula um conjunto diferente de capacidades do Azure OpenAI. Cada API possui seu próprio conjunto único de pré-visualizações e versões estáveis/geralmente disponíveis (GA). Os lançamentos de prévia atualmente tendem a seguir uma cadência mensal.

Importante

Agora há uma nova API de inferência de pré-visualização. Saiba mais em nosso guia do ciclo de vida da API.

API	Última versão de prévia	Última versão da GA	Specifications	Descrição
Plano de controle	`2025-07-01-preview`	`2025-06-01`	Arquivos de especificação	A API do plano de controle é usada para operações como criação de recursos, implantação de modelos e outras tarefas de gerenciamento de recursos de nível superior. O plano de controle também governa o que é possível fazer com capacidades como Azure Resource Manager, Bicep, Terraform e CLI do Azure.
Plano de dados	`v1 preview`	`v1`	Arquivos de especificação	A API do plano de dados controla as operações de inferência e autoria.

Autenticação

O Azure OpenAI oferece dois métodos para autenticação. Você pode usar tanto API Keys quanto Microsoft Entra ID.

Autenticação de Chave API: Para esse tipo de autenticação, todas as requisições de API devem incluir a Chave API no api-key cabeçalho HTTP. O Quickstart fornece orientações sobre como fazer chamadas com esse tipo de autenticação.
Microsoft Entra ID: Você pode autenticar uma chamada API usando um token Microsoft Entra. Tokens de autenticação são incluídos em uma solicitação como cabeçalho Authorization . O token fornecido deve ser precedido por Bearer, por exemplo Bearer YOUR_AUTH_TOKEN. Você pode ler nosso guia prático sobre autenticação com Microsoft Entra ID.

Versionamento da API REST

As APIs de serviço são versionadas usando o api-version parâmetro de consulta. Todas as versões seguem a estrutura de datas YYYY-MM-DD. Por exemplo:

POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/chat/completions?api-version=2024-06-01

Inferência de plano de dados

O restante deste artigo aborda as operações de imagem e áudio na 2025-04-01-preview versão prévia da especificação de inferência do plano de dados Azure OpenAI.

Para as operações de áudio e imagem GA, consulte a referência da API REST de áudio e imagem GA.

Transcrições - Criar

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

Transcreve o áudio para a língua de entrada.

Parâmetros de URI

Nome	Em	Obrigatório	Tipo	Descrição
ponto de extremidade	caminho	Yes	URL da sequência de caracteres	Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: `https://aoairesource.openai.azure.com`. Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id	caminho	Yes	cadeia
versão da API	consulta	Yes	cadeia

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e mais segura.

Nome	Obrigatório	Tipo	Descrição
Autorização	Verdade	cadeia	Exemplo:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Para gerar um token de autenticação usando CLI do Azure: `az account get-access-token --resource https://cognitiveservices.azure.com` Tipo: oauth2 URL de Autorização: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` ESCOPO: `https://ai.azure.com/.default`
chave da API	Verdade	cadeia	Forneça a chave API do Azure OpenAI aqui

Corpo da solicitação

Content-Type: multipart/form-data (dados de formulário em múltiplas partes)

Nome	Tipo	Descrição	Obrigatório	Default
modelo	cadeia	ID do modelo a ser usado. As opções são `gpt-4o-transcribe`, `gpt-4o-mini-transcribe`, `gpt-4o-mini-transcribe-2025-12-15`, `whisper-1`, e `gpt-4o-transcribe-diarize`.	Yes
arquivo	cadeia	O arquivo de áudio é objeto para transcrever.	Yes
linguagem	cadeia	O idioma do áudio de entrada. Fornecer a linguagem de entrada no formato ISO-639-1 melhora a precisão e a latência.	No
solicitação	cadeia	Um texto opcional para guiar o estilo do modelo ou continuar um segmento de áudio anterior. O prompt deve corresponder à linguagem do áudio.	No
formato_de_resposta	audioResponseFormat	Define o formato da saída.	No
Temperatura	number	A temperatura de amostragem, entre 0 e 1. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 a tornam mais focada e determinística. Se definido como 0, o modelo usa a probabilidade logarítmica para aumentar automaticamente a temperatura até que certos limiares sejam atingidos.	No	0
timestamp_granularities[]	matriz	As granularidades do timestamp devem preencher para essa transcrição. `response_format` deve ser configurado `verbose_json` para usar granularidades de carimbo de tempo. Uma ou ambas essas opções são suportadas: `word`, ou `segment`. Nota: Não há latência adicional para carimbos de tempo de segmentos, mas gerar carimbos de data de tempo de palavra gera latência adicional.	No	['segment']

Respostas

Código de status: 200

Descrição: OK

Tipo de conteúdo	Tipo	Descrição
application/json	objeto
texto/sem formatação	cadeia	Texto transcrito no formato de saída (quando response_format era um dos `text`, `vtt` ou `srt`).

Exemplos

Example

Recebe texto transcrito e metadados associados a partir dos dados de áudio falados fornecidos.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

Respostas: Código de status: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Example

Recebe texto transcrito e metadados associados a partir dos dados de áudio falados fornecidos.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Respostas: Código de status: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Traduções - Criar

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

Transcreve e traduz áudio de entrada para texto em inglês.

Parâmetros de URI

Nome	Em	Obrigatório	Tipo	Descrição
ponto de extremidade	caminho	Yes	URL da sequência de caracteres	Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: `https://aoairesource.openai.azure.com`. Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id	caminho	Yes	cadeia
versão da API	consulta	Yes	cadeia

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e mais segura.

Nome	Obrigatório	Tipo	Descrição
Autorização	Verdade	cadeia	Exemplo:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Para gerar um token de autenticação usando CLI do Azure: `az account get-access-token --resource https://cognitiveservices.azure.com` Tipo: oauth2 URL de Autorização: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` ESCOPO: `https://ai.azure.com/.default`
chave da API	Verdade	cadeia	Forneça a chave API do Azure OpenAI aqui

Corpo da solicitação

Content-Type: multipart/form-data (dados de formulário em múltiplas partes)

Nome	Tipo	Descrição	Obrigatório	Default
arquivo	cadeia	O arquivo de áudio para traduzir.	Yes
solicitação	cadeia	Um texto opcional para guiar o estilo do modelo ou continuar um segmento de áudio anterior. O prompt deve estar em inglês.	No
formato_de_resposta	audioResponseFormat	Define o formato da saída.	No
Temperatura	number	A temperatura de amostragem, entre 0 e 1. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 a tornam mais focada e determinística. Se definido como 0, o modelo usa a probabilidade logarítmica para aumentar automaticamente a temperatura até que certos limiares sejam atingidos.	No	0

Respostas

Código de status: 200

Descrição: OK

Tipo de conteúdo	Tipo	Descrição
application/json	objeto
texto/sem formatação	cadeia	Texto transcrito no formato de saída (quando response_format era de texto, vtt ou srt).

Exemplos

Example

Obtém texto transcrito em inglês e metadados associados a partir dos dados de áudio falados fornecidos.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Respostas: Código de status: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Example

Obtém texto transcrito em inglês e metadados associados a partir dos dados de áudio falados fornecidos.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Respostas: Código de status: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Fala - Criar

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview

Gera áudio a partir do texto de entrada.

Parâmetros de URI

Nome	Em	Obrigatório	Tipo	Descrição
ponto de extremidade	caminho	Yes	URL da sequência de caracteres	Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: `https://aoairesource.openai.azure.com`. Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id	caminho	Yes	cadeia
versão da API	consulta	Yes	cadeia

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e mais segura.

Nome	Obrigatório	Tipo	Descrição
Autorização	Verdade	cadeia	Exemplo:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Para gerar um token de autenticação usando CLI do Azure: `az account get-access-token --resource https://cognitiveservices.azure.com` Tipo: oauth2 URL de Autorização: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` ESCOPO: `https://ai.azure.com/.default`
chave da API	Verdade	cadeia	Forneça a chave API do Azure OpenAI aqui

Corpo da solicitação

Content-Type: multipart/form-data (dados de formulário em múltiplas partes)

Nome	Tipo	Descrição	Obrigatório	Default
entrada	cadeia	O texto para sintetizar áudio. O comprimento máximo é de 4.096 caracteres.	Yes
formato_de_resposta	enumeração	O formato para sintetizar o áudio. Valores possíveis: `mp3`, `opus`, `aac`, `flac`, `wav`, `pcm`	No
Velocidade	number	A velocidade do áudio sintetizado. Selecione um valor de `0.25` para `4.0`. `1.0` é o padrão.	No	1.0
Voz	enumeração	A voz para usar na síntese de voz. Valores possíveis: `alloy`, `echo`, `fable`, `onyx`, `nova`, `shimmer`	Yes

Respostas

Código de status: 200

Descrição: OK

Tipo de conteúdo	Tipo	Descrição
application/octet-stream	cadeia

Exemplos

Example

Sintetiza o áudio a partir do texto fornecido.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview

{
 "input": "Hi! What are you going to make?",
 "voice": "fable",
 "response_format": "mp3"
}

Respostas: Código de status: 200

{
  "body": "101010101"
}

Gerações de imagens - Criar

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview

Gera um lote de imagens a partir de uma legenda de texto em uma determinada implantação de modelo de geração de imagem

Parâmetros de URI

Nome	Em	Obrigatório	Tipo	Descrição
ponto de extremidade	caminho	Yes	URL da sequência de caracteres	Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: `https://aoairesource.openai.azure.com`. Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id	caminho	Yes	cadeia
versão da API	consulta	Yes	cadeia

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e mais segura.

Nome	Obrigatório	Tipo	Descrição
Autorização	Verdade	cadeia	Exemplo:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Para gerar um token de autenticação usando CLI do Azure: `az account get-access-token --resource https://cognitiveservices.azure.com` Tipo: oauth2 URL de Autorização: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` ESCOPO: `https://ai.azure.com/.default`
chave da API	Verdade	cadeia	Forneça a chave API do Azure OpenAI aqui

Corpo da solicitação

Tipo de conteúdo: application/json

Nome	Tipo	Descrição	Obrigatório	Default
em segundo plano	imageBackground	Permite definir transparência para o fundo das imagens geradas. Esse parâmetro é suportado apenas para modelos da série gpt-imagem-1.	No	automático
n	inteiro	O número de imagens a serem geradas. Para dall-e-3, apenas n=1 é suportado.	No	1
compressão_de_saída	inteiro	O nível de compressão (0-100%) para as imagens geradas. Esse parâmetro é suportado apenas para modelos da série gpt-image-1 com o formato de saída jpeg.	No	100
formato de saída	imagesOutputFormat	O formato de arquivo no qual as imagens geradas são retornadas. Suportado apenas para modelos da série GPT-image-1.	No	png
solicitação	cadeia	Uma descrição em texto da(s) imagem(s) desejada(s). O comprimento máximo é de 32.000 caracteres para a série gpt-image-1 e 4.000 caracteres para dall-e-3	Yes
imagens parciais	inteiro	O número de imagens parciais a serem geradas. Esse parâmetro é usado para respostas em streaming que retornam imagens parciais. O valor deve estar entre 0 e 3. Quando configurado para 0, a resposta será uma única imagem enviada em um evento de streaming. Note que a imagem final pode ser enviada antes que o número total de imagens parciais seja gerado se a imagem completa for gerada mais rapidamente.	0
fluxo	booleano	Edite a imagem no modo streaming.	não	`false`
Qualidade	imageQuality	A qualidade da imagem que será gerada.	No	automático
formato_de_resposta	imagesResponseFormat	O formato no qual as imagens geradas são retornadas. Esse parâmetro não é suportado para `gpt-image-1`modelos da série -que sempre retornam imagens codificadas base64. Valores possíveis: `url`, `b64_json`.	No	url
size	imageSize	O tamanho das imagens geradas.	No	automático
estilo	imageStyle	O estilo das imagens geradas. Só é suportado para DALL-E-3.	No	Vívido
usuário	cadeia	Um identificador único representando seu usuário final, que pode ajudar a monitorar e detectar abusos.	No

Respostas

Código de status: 200

Descrição: Ok

Tipo de conteúdo	Tipo	Descrição
application/json	generateImagesResponse

Código de status: padrão

Descrição: Ocorreu um erro.

Tipo de conteúdo	Tipo	Descrição
application/json	dalleErrorResponse

Exemplos

Example

Cria imagens com um prompt.

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview

{
 "prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
 "n": 1,
 "style": "natural",
 "quality": "standard"
}

Respostas: Código de status: 200

{
  "body": {
    "created": 1698342300,
    "data": [
      {
        "revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
        "prompt_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          },
          "profanity": {
            "detected": false,
            "filtered": false
          },
          "custom_blocklists": {
            "filtered": false,
            "details": []
          }
        },
        "url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
        "content_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          }
        }
      }
    ]
  }
}

Gerações de imagens - Editar

POST https://{endpoint}/openai/deployments/{deployment-id}/images/edits?api-version=2025-04-01-preview

Edita uma imagem a partir de uma legenda de texto em uma determinada implantação de modelo gpt-image-1

Parâmetros de URI

Nome	Em	Obrigatório	Tipo	Descrição
ponto de extremidade	caminho	Yes	URL da sequência de caracteres	Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: `https://aoairesource.openai.azure.com`. Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id	caminho	Yes	cadeia
versão da API	consulta	Yes	cadeia

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e mais segura.

Nome	Obrigatório	Tipo	Descrição
Autorização	Verdade	cadeia	Exemplo:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Para gerar um token de autenticação usando CLI do Azure: `az account get-access-token --resource https://cognitiveservices.azure.com` Tipo: oauth2 URL de Autorização: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` ESCOPO: `https://ai.azure.com/.default`
chave da API	Verdade	cadeia	Forneça a chave API do Azure OpenAI aqui

Corpo da solicitação

Content-Type: multipart/form-data (dados de formulário em múltiplas partes)

Nome	Tipo	Descrição	Obrigatório	Default
imagem	String ou array	A(s) imagem(ões) a editar. Deve ser um arquivo de imagem suportado ou um array de imagens. Cada imagem deve ser um arquivo png ou jpg com menos de 50MB.	Yes
fidelidade_de_entrada	cadeia	Controle quanto esforço o modelo fará para combinar com o estilo e as características, especialmente as características faciais, das imagens de entrada. Esse parâmetro é suportado apenas para modelos da série gpt-imagem-1. Suportes `high` e `low`.	não	`low`.
máscara	cadeia	Uma imagem adicional cujas áreas totalmente transparentes (por exemplo, onde alfa é zero) indica onde a imagem deve ser editada. Se houver várias imagens fornecidas, a máscara será aplicada à primeira imagem. Deve ser um arquivo PNG válido, com menos de 4MB, e ter as mesmas dimensões da imagem.	No
n	inteiro	O número de imagens a serem geradas. Deve estar entre 1 e 10.	No	1
solicitação	cadeia	Uma descrição em texto da(s) imagem(s) desejada(s). O comprimento máximo é de 32.000 caracteres.	Yes
Qualidade	imageQuality	A qualidade da imagem que será gerada.	No	automático
imagens parciais	O número de imagens parciais a serem geradas. Esse parâmetro é usado para respostas em streaming que retornam imagens parciais. O valor deve estar entre 0 e 3. Quando configurado para 0, a resposta será uma única imagem enviada em um evento de streaming. Note que a imagem final pode ser enviada antes que o número total de imagens parciais seja gerado se a imagem completa for gerada mais rapidamente.
fluxo	booleano	Edite a imagem no modo streaming.	não	`false`
formato_de_resposta	imagesResponseFormat	O formato no qual as imagens geradas são retornadas.	No	url
size	imageSize	O tamanho das imagens geradas.	No	automático
usuário	cadeia	Um identificador único representando seu usuário final, que pode ajudar a monitorar e detectar abusos.	No

Respostas

Código de status: 200

Descrição: Ok

Tipo de conteúdo	Tipo	Descrição
application/json	generateImagesResponse

Código de status: padrão

Descrição: Ocorreu um erro.

Tipo de conteúdo	Tipo	Descrição
application/json	dalleErrorResponse

Componentes

Para obter as definições de esquema usadas por chat, conclusões, inserções, respostas e outras operações de texto, consulte a referência da API REST do Azure OpenAI. Os esquemas a seguir dão suporte às operações de imagem e áudio nesta página.

innerErrorCode

Códigos de erro para o objeto de erro interno.

Property	Valor
Descrição	Códigos de erro para o objeto de erro interno.
Tipo	cadeia
Valores	`ResponsibleAIPolicyViolation`

dalleErrorResponse

Nome	Tipo	Descrição	Obrigatório	Default
erro	dalleError		No

dalleError

Nome	Tipo	Descrição	Obrigatório
inner_error	dalleInnerError	Erro interno com detalhes adicionais.	No
param	cadeia		No
tipo	cadeia		No

dalleInnerError

Erro interno com detalhes adicionais.

Nome	Tipo	Descrição	Obrigatório
codificar	innerErrorCode	Códigos de erro para o objeto de erro interno.	No
content_filter_results	dalleFilterResults	Informações sobre a categoria de filtragem de conteúdo (ódio, sexual, violência, self_harm), se ela foi detectada, bem como o nível de gravidade (very_low, baixo, médio, alto que determina a intensidade e o nível de risco do conteúdo nocivo) e se foi filtrado ou não. Informações sobre conteúdo de jailbreak e palavrões, se foram detectados e se foram filtrados ou não. E informações sobre a lista de bloqueio de clientes, se foi filtrada e seu ID.	No
revised_prompt	cadeia	O prompt usado para gerar a imagem, caso houvesse alguma revisão no prompt.	No

contentFilterSeverityResult

Nome	Tipo	Descrição	Obrigatório	Default
Filtrada	booleano		Yes
severity	cadeia		No

contentFilterDetectedResult

Nome	Tipo	Descrição	Obrigatório	Default
detectado	booleano		No
Filtrada	booleano		Yes

contentFilterDetailedResults

Resultados de filtragem de conteúdo com um detalhe dos IDs de filtro de conteúdo para os segmentos filtrados.

Nome	Tipo	Descrição	Obrigatório	Default
details	matriz		No
Filtrada	booleano		Yes

dalleFilterResults

Informações sobre a categoria de filtragem de conteúdo (ódio, sexual, violência, self_harm), se ela foi detectada, bem como o nível de gravidade (very_low, baixo, médio, alto que determina a intensidade e o nível de risco do conteúdo nocivo) e se foi filtrado ou não. Informações sobre conteúdo de jailbreak e palavrões, se foram detectados e se foram filtrados ou não. E informações sobre a lista de bloqueio de clientes, se foi filtrada e seu ID.

Nome	Tipo	Descrição	Obrigatório
custom_blocklists	contentFilterDetailedResults	Resultados de filtragem de conteúdo com um detalhe dos IDs de filtro de conteúdo para os segmentos filtrados.	No
Odeio	Resultado de Severidade do Filtro de Conteúdo		No
jailbreak	Resultado de Filtro de Conteúdo Detectado		No
Profanidade	Resultado de Filtro de Conteúdo Detectado		No
self_harm	Resultado de Severidade do Filtro de Conteúdo		No
sexual	Resultado de Severidade do Filtro de Conteúdo		No
Violência	Resultado de Severidade do Filtro de Conteúdo		No

audioResponseFormat

Define o formato da saída.

Property	Valor
Descrição	Define o formato da saída.
Tipo	cadeia
Valores	`json` `text` `srt` `verbose_json` `vtt`

imageQuality

A qualidade da imagem que será gerada.

Property	Valor
Descrição	A qualidade da imagem que será gerada.
Tipo	cadeia
Default	automático
Valores	`auto` `high` `medium` `low` `hd` `standard`

imagesResponseFormat

O formato no qual as imagens geradas são retornadas.

Property	Valor
Descrição	O formato no qual as imagens geradas são retornadas.
Tipo	cadeia
Default	url
Valores	`url` `b64_json`

imagesOutputFormat

O formato de arquivo no qual as imagens geradas são retornadas. Só é suportado para modelos de série.

Property	Valor
Descrição	O formato de arquivo no qual as imagens geradas são retornadas. Suportado apenas para modelos da série GPT-image-1.
Tipo	cadeia
Default	png
Valores	`png` `jpeg`

imageSize

O tamanho das imagens geradas.

Property	Valor
Descrição	O tamanho das imagens geradas.
Tipo	cadeia
Default	automático
Valores	`auto` `1792x1024` `1024x1792` `1024x1024` `1024x1536` `1536x1024`

imageStyle

O estilo das imagens geradas. Só é suportado para DALL-E-3.

Property	Valor
Descrição	O estilo das imagens geradas. Só é suportado para DALL-E-3.
Tipo	cadeia
Default	Vívido
Valores	`vivid` `natural`

imageBackground

Permite definir a transparência para o fundo da(s) imagem(s) gerada(s). Esse parâmetro é suportado apenas para modelos da série gpt-imagem-1.

Property	Valor
Descrição	Permite definir a transparência para o fundo da(s) imagem(s) gerada(s). Esse parâmetro é suportado apenas para modelos da série gpt-imagem-1.
Tipo	cadeia
Default	automático
Valores	`transparent` `opaque` `auto`

generateImagesResponse

Nome	Tipo	Descrição	Obrigatório
criado	inteiro	O carimbo de data do unix quando a operação foi criada.	Yes
dados	matriz	Os dados de resultado da operação, se bem-sucedidos	Yes
uso	imageGenerationsUsage	Representa detalhes de uso de tokens para solicitações de geração de imagem. Apenas para modelos da série GPT-image-1.	No

imageGenerationsUsage

Representa detalhes de uso de tokens para solicitações de geração de imagem. Apenas para modelos da série GPT-image-1.

Nome	Tipo	Descrição	Obrigatório
input_tokens	inteiro	O número de tokens de entrada.	No
input_tokens_details	objeto	Uma divisão detalhada dos tokens de entrada.	No
└─ image_tokens	inteiro	O número de tokens de imagem.	No
└─ text_tokens	inteiro	O número de tokens de texto.	No
output_tokens	inteiro	O número de tokens de saída.	No
total_tokens	inteiro	O número total de tokens usados.	No

Próximas Etapas

Saiba mais sobre modelos e ajuste fino com a API REST. Saiba mais sobre os modelos underlying que alimentam Azure OpenAI.

Comentários

Esta página foi útil?

Last updated on 2026-06-24

Azure referência da API REST de áudio e imagem do OpenAI (2025-04-01-preview)

Especificações de API

Autenticação

Versionamento da API REST

Inferência de plano de dados

Transcrições - Criar

Parâmetros de URI

Cabeçalho da solicitação

Corpo da solicitação

Respostas

Exemplos

Example

Example

Traduções - Criar

Parâmetros de URI

Cabeçalho da solicitação

Corpo da solicitação

Respostas

Exemplos

Example

Example

Fala - Criar

Parâmetros de URI

Cabeçalho da solicitação

Corpo da solicitação

Respostas

Exemplos

Example

Gerações de imagens - Criar

Parâmetros de URI

Cabeçalho da solicitação

Corpo da solicitação

Respostas

Exemplos

Example

Gerações de imagens - Editar

Parâmetros de URI

Cabeçalho da solicitação

Corpo da solicitação

Respostas

Componentes

innerErrorCode

dalleErrorResponse

dalleError

dalleInnerError

contentFilterSeverityResult

contentFilterDetectedResult

contentFilterDetailedResults

dalleFilterResults

audioResponseFormat

imageQuality

imagesResponseFormat

imagesOutputFormat

imageSize

imageStyle

imageBackground

generateImagesResponse

imageGenerationsUsage

Próximas Etapas

Comentários

Recursos adicionais