Referência da API REST de imagem e áudio Azure OpenAI (2025-04-01-preview)

Este artigo documenta as operações de geração de imagens e inferência de planos de dados de áudio (voz) na API REST para o Azure OpenAI no 2025-04-01-preview lançamento. Para conclusãos de chat, embeddings, assistentes, respostas, armazenamentos vetoriais e todas as outras operações, consulte a referência oficial da API REST do Azure OpenAI.

Especificações da API

A gestão e interação com modelos e recursos OpenAI do Azure está dividida em três superfícies principais de API:

Plano de controlo
Plano de dados - autoria
Plano de dados - inferência

Cada superfície/especificação API encapsula um conjunto diferente de capacidades do Azure OpenAI. Cada API tem o seu próprio conjunto único de pré-visualização e versões de APIs estáveis/geralmente disponíveis (GA). Atualmente, os lançamentos de pré-visualização tendem a seguir uma cadência mensal.

Important

Agora existe uma nova API de inferência de pré-visualização. Saiba mais no nosso guia do ciclo de vida da API.

API	Última versão de pré-visualização	Última versão da GA	Specifications	Description
Plano de controlo	`2025-07-01-preview`	`2025-06-01`	Arquivos de especificações	A API do plano de controlo é usada para operações como criação de recursos, implementação de modelos e outras tarefas de gestão de recursos de nível superior. O plano de controlo também regula o que é possível fazer com capacidades como Azure Resource Manager, Bicep, Terraform e CLI do Azure.
Plano de dados	`v1 preview`	`v1`	Arquivos de especificações	A API do plano de dados controla as operações de inferência e autoria.

Authentication

O Azure OpenAI fornece dois métodos para autenticação. Pode usar API Keys ou Microsoft Entra ID.

Autenticação de Chave API: Para este tipo de autenticação, todos os pedidos de API devem incluir a Chave API no api-key cabeçalho HTTP. O Quickstart fornece orientações sobre como fazer chamadas com este tipo de autenticação.
Microsoft Entra ID: Pode autenticar uma chamada API usando um token Microsoft Entra. Os tokens de autenticação são incluídos num pedido como Authorization cabeçalho. O token fornecido deve ser precedido por Bearer, por exemplo Bearer YOUR_AUTH_TOKEN. Pode ler o nosso guia prático sobre autenticação com Microsoft Entra ID.

Versionamento da API REST

As APIs dos serviços são versionadas usando o api-version parâmetro de consulta. Todas as versões seguem a estrutura de datas YYYY-MM-DD. Por exemplo:

POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/chat/completions?api-version=2024-06-01

Inferência do plano de dados

O restante deste artigo aborda as operações de imagem e áudio na 2025-04-01-preview versão de pré-visualização da especificação de inferência do plano de dados do Azure OpenAI.

Para as operações de imagem e áudio GA, consulte a referência REST API de imagem GA e áudio.

Transcrições - Criar

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

Transcreve o áudio para a língua de entrada.

Parâmetros de URI

Name	Em	Obrigatório	Tipo	Description
ponto final	caminho	Yes	URL de string	Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: `https://aoairesource.openai.azure.com`). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
ID de implementação	caminho	Yes	cadeia (de caracteres)
Versão da API	consulta	Yes	cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name	Obrigatório	Tipo	Description
Authorization	Verdade	cadeia (de caracteres)	Exemplo:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Para gerar um token de autenticação usando CLI do Azure: `az account get-access-token --resource https://cognitiveservices.azure.com` Tipo: oauth2 URL de Autorização: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Âmbito: `https://ai.azure.com/.default`
chave de API	Verdade	cadeia (de caracteres)	Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: multipart/form-data

Name	Tipo	Description	Obrigatório	Predefinição
modelo	cadeia (de caracteres)	ID do modelo a usar. As opções são `gpt-4o-transcribe`, `gpt-4o-mini-transcribe`, `gpt-4o-mini-transcribe-2025-12-15`, `whisper-1`, e `gpt-4o-transcribe-diarize`.	Yes
ficheiro	cadeia (de caracteres)	O objeto do ficheiro áudio para transcrever.	Yes
linguagem	cadeia (de caracteres)	A linguagem do áudio de entrada. Fornecer a linguagem de entrada no formato ISO-639-1 melhora a precisão e a latência.	No
avisar	cadeia (de caracteres)	Um texto opcional para guiar o estilo do modelo ou continuar um segmento áudio anterior. O prompt deve corresponder à linguagem do áudio.	No
formato_de_resposta	audioResponseFormat	Define o formato da saída.	No
Temperatura	number	A temperatura de amostragem, entre 0 e 1. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 tornam-na mais focada e determinística. Se definido para 0, o modelo usa a probabilidade logarítmica para aumentar automaticamente a temperatura até que certos limiares sejam atingidos.	No	0
timestamp_granularities[]	matriz	As granularidades do carimbo temporal para preencher esta transcrição. `response_format` deve ser definido `verbose_json` para usar granularidades de carimbo temporal. Uma ou ambas estas opções são suportadas: `word`, ou `segment`. Nota: Não existe latência adicional para carimbos temporais de segmentos, mas gerar carimbos temporais de palavra implica latência adicional.	No	['segmento']

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo	Type	Description
Application/JSON	objecto
texto/sem formatação	cadeia (de caracteres)	Texto transcrito no formato de saída (quando response_format era um dos `text`, `vtt` ou `srt`).

Exemplos

Exemplo

Obtém texto transcrito e metadados associados a partir dos dados de áudio falado fornecidos.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

Respostas: Código de Estado: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Exemplo

Obtém texto transcrito e metadados associados a partir dos dados de áudio falado fornecidos.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Respostas: Código de Estado: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Traduções - Create

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

Transcreve e traduz áudio de entrada para texto em inglês.

Parâmetros de URI

Name	Em	Obrigatório	Tipo	Description
ponto final	caminho	Yes	URL de string	Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: `https://aoairesource.openai.azure.com`). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
ID de implementação	caminho	Yes	cadeia (de caracteres)
Versão da API	consulta	Yes	cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name	Obrigatório	Tipo	Description
Authorization	Verdade	cadeia (de caracteres)	Exemplo:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Para gerar um token de autenticação usando CLI do Azure: `az account get-access-token --resource https://cognitiveservices.azure.com` Tipo: oauth2 URL de Autorização: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Âmbito: `https://ai.azure.com/.default`
chave de API	Verdade	cadeia (de caracteres)	Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: multipart/form-data

Name	Tipo	Description	Obrigatório	Predefinição
ficheiro	cadeia (de caracteres)	O ficheiro de áudio para traduzir.	Yes
avisar	cadeia (de caracteres)	Um texto opcional para guiar o estilo do modelo ou continuar um segmento áudio anterior. O enunciado deve estar em inglês.	No
formato_de_resposta	audioResponseFormat	Define o formato da saída.	No
Temperatura	number	A temperatura de amostragem, entre 0 e 1. Valores mais altos como 0,8 tornam a saída mais aleatória, enquanto valores mais baixos como 0,2 tornam-na mais focada e determinística. Se definido para 0, o modelo usa a probabilidade logarítmica para aumentar automaticamente a temperatura até que certos limiares sejam atingidos.	No	0

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo	Type	Description
Application/JSON	objecto
texto/sem formatação	cadeia (de caracteres)	Texto transcrito no formato de saída (quando response_format era texto, vtt ou srt).

Exemplos

Exemplo

Obtém texto transcrito em inglês e metadados associados a partir dos dados de áudio falado fornecidos.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Respostas: Código de Estado: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Exemplo

Obtém texto transcrito em inglês e metadados associados a partir dos dados de áudio falado fornecidos.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Respostas: Código de Estado: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Fala - Criar

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview

Gera áudio a partir do texto de entrada.

Parâmetros de URI

Name	Em	Obrigatório	Tipo	Description
ponto final	caminho	Yes	URL de string	Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: `https://aoairesource.openai.azure.com`). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
ID de implementação	caminho	Yes	cadeia (de caracteres)
Versão da API	consulta	Yes	cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name	Obrigatório	Tipo	Description
Authorization	Verdade	cadeia (de caracteres)	Exemplo:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Para gerar um token de autenticação usando CLI do Azure: `az account get-access-token --resource https://cognitiveservices.azure.com` Tipo: oauth2 URL de Autorização: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Âmbito: `https://ai.azure.com/.default`
chave de API	Verdade	cadeia (de caracteres)	Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: multipart/form-data

Name	Tipo	Description	Obrigatório	Predefinição
dados introduzidos	cadeia (de caracteres)	O texto para sintetizar áudio. O comprimento máximo é de 4.096 caracteres.	Yes
formato_de_resposta	enumeração	O formato para sintetizar o áudio. Valores possíveis: `mp3`, `opus`, `aac`, `flac`, `wav`, `pcm`	No
Velocidade	number	A velocidade do áudio sintetizado. Selecione um valor de `0.25` para `4.0`. `1.0` é o padrão.	No	1.0
Voz	enumeração	A voz a usar para síntese de voz. Valores possíveis: `alloy`, `echo`, `fable`, `onyx`, `nova`, `shimmer`	Yes

Respostas

Código de Estado: 200

Descrição: OK

Tipo de conteúdo	Type	Description
application/octet-stream	cadeia (de caracteres)

Exemplos

Exemplo

Sintetiza áudio a partir do texto fornecido.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview

{
 "input": "Hi! What are you going to make?",
 "voice": "fable",
 "response_format": "mp3"
}

Respostas: Código de Estado: 200

{
  "body": "101010101"
}

Gerações de imagens - Criar

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview

Gera um lote de imagens a partir de uma legenda de texto numa dada implementação de modelo de geração de imagens

Parâmetros de URI

Name	Em	Obrigatório	Tipo	Description
ponto final	caminho	Yes	URL de string	Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: `https://aoairesource.openai.azure.com`). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
ID de implementação	caminho	Yes	cadeia (de caracteres)
Versão da API	consulta	Yes	cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name	Obrigatório	Tipo	Description
Authorization	Verdade	cadeia (de caracteres)	Exemplo:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Para gerar um token de autenticação usando CLI do Azure: `az account get-access-token --resource https://cognitiveservices.azure.com` Tipo: oauth2 URL de Autorização: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Âmbito: `https://ai.azure.com/.default`
chave de API	Verdade	cadeia (de caracteres)	Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: application/json

Name	Tipo	Description	Obrigatório	Predefinição
em segundo plano	imageBackground	Permite definir transparência para o fundo das imagens geradas. Este parâmetro é apenas suportado para modelos da série gpt-image-1.	No	automóvel
n	número inteiro	O número de imagens a gerar. Para dall-e-3, apenas n=1 é suportado.	No	1
compressão_de_saída	número inteiro	O nível de compressão (0-100%) para as imagens geradas. Este parâmetro é suportado apenas para modelos da série gpt-image-1 com o formato de saída jpeg.	No	100
formato_de_saida	imagesOutputFormat	O formato de ficheiro no qual as imagens geradas são devolvidas. Apenas suportado para modelos da série gpt-image-1.	No	png
avisar	cadeia (de caracteres)	Uma descrição em texto da(s) imagem(ões) desejada(s). O comprimento máximo é de 32000 caracteres para a série gpt-image-1 e 4000 caracteres para dall-e-3	Yes
imagens parciais	número inteiro	O número de imagens parciais a gerar. Este parâmetro é usado para respostas em streaming que devolvem imagens parciais. O valor deve estar entre 0 e 3. Quando definido para 0, a resposta será uma única imagem enviada num evento de streaming. Note que a imagem final pode ser enviada antes de o número total de imagens parciais ser gerado, se a imagem completa for gerada mais rapidamente.	0
fluxo	boolean	Edita a imagem em modo streaming.	não	`false`
qualidade	qualidade de imagem	A qualidade da imagem que será gerada.	No	automóvel
formato_de_resposta	imagesResponseFormat	O formato em que as imagens geradas são devolvidas. Este parâmetro não é suportado para `gpt-image-1`modelos da série -que retornam sempre imagens codificadas base64. Valores possíveis: `url`, `b64_json`.	No	url
size	imageSize	O tamanho das imagens geradas.	No	automóvel
Estilo	imageStyle	O estilo das imagens geradas. Só é suportado para DALL-E-3.	No	vívido
utilizador	cadeia (de caracteres)	Um identificador único que representa o seu utilizador final, que pode ajudar a monitorizar e detetar abusos.	No

Respostas

Código de Estado: 200

Descrição: Ok

Tipo de conteúdo	Type	Description
Application/JSON	generateImagesResponse

Código de Estado: padrão

Descrição: Ocorreu um erro.

Tipo de conteúdo	Type	Description
Application/JSON	dalleErrorResponse

Exemplos

Exemplo

Cria imagens com um prompt.

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview

{
 "prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
 "n": 1,
 "style": "natural",
 "quality": "standard"
}

Respostas: Código de Estado: 200

{
  "body": {
    "created": 1698342300,
    "data": [
      {
        "revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
        "prompt_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          },
          "profanity": {
            "detected": false,
            "filtered": false
          },
          "custom_blocklists": {
            "filtered": false,
            "details": []
          }
        },
        "url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
        "content_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          }
        }
      }
    ]
  }
}

Gerações de imagens - Editar

POST https://{endpoint}/openai/deployments/{deployment-id}/images/edits?api-version=2025-04-01-preview

Edita uma imagem a partir de uma legenda de texto numa dada implementação de modelo gpt-image-1

Parâmetros de URI

Name	Em	Obrigatório	Tipo	Description
ponto final	caminho	Yes	URL de string	Suportado Azure endpoints OpenAI (protocolo e nome do host, por exemplo: `https://aoairesource.openai.azure.com`). Substitua "aoairesource" pelo nome do seu recurso Azure OpenAI). https://{seu-nome-de-recurso}.openai.azure.com
ID de implementação	caminho	Yes	cadeia (de caracteres)
Versão da API	consulta	Yes	cadeia (de caracteres)

Cabeçalho da solicitação

Use autenticação baseada em token ou chave API. A autenticação com autenticação baseada em token é recomendada e é mais segura.

Name	Obrigatório	Tipo	Description
Authorization	Verdade	cadeia (de caracteres)	Exemplo:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Para gerar um token de autenticação usando CLI do Azure: `az account get-access-token --resource https://cognitiveservices.azure.com` Tipo: oauth2 URL de Autorização: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Âmbito: `https://ai.azure.com/.default`
chave de API	Verdade	cadeia (de caracteres)	Forneça aqui a chave API do Azure OpenAI

Órgão do Pedido

Tipo de conteúdo: multipart/form-data

Name	Tipo	Description	Obrigatório	Predefinição
imagem	String ou array	A(s) imagem(s) a editar. Deve ser um ficheiro de imagem suportado ou um array de imagens. Cada imagem deve ser um ficheiro png ou jpg com menos de 50MB.	Yes
input_fidelity	cadeia (de caracteres)	Controla quanto esforço o modelo irá fazer para corresponder ao estilo e às características, especialmente as características faciais, das imagens de entrada. Este parâmetro é apenas suportado para modelos da série gpt-image-1. Suportes `high` e `low`.	não	`low`.
máscara	cadeia (de caracteres)	Uma imagem adicional cujas áreas totalmente transparentes (por exemplo, onde alfa é zero) indica onde a imagem deve ser editada. Se forem fornecidas várias imagens, a máscara será aplicada à primeira imagem. Deve ser um ficheiro PNG válido, com menos de 4MB, e ter as mesmas dimensões da imagem.	No
n	número inteiro	O número de imagens a gerar. Deve estar entre 1 e 10.	No	1
avisar	cadeia (de caracteres)	Uma descrição em texto da(s) imagem(ões) desejada(s). O comprimento máximo é de 32000 caracteres.	Yes
qualidade	qualidade de imagem	A qualidade da imagem que será gerada.	No	automóvel
imagens parciais	O número de imagens parciais a gerar. Este parâmetro é usado para respostas em streaming que devolvem imagens parciais. O valor deve estar entre 0 e 3. Quando definido para 0, a resposta será uma única imagem enviada num evento de streaming. Note que a imagem final pode ser enviada antes de o número total de imagens parciais ser gerado, se a imagem completa for gerada mais rapidamente.
fluxo	boolean	Edita a imagem em modo streaming.	não	`false`
formato_de_resposta	imagesResponseFormat	O formato em que as imagens geradas são devolvidas.	No	url
size	imageSize	O tamanho das imagens geradas.	No	automóvel
utilizador	cadeia (de caracteres)	Um identificador único que representa o seu utilizador final, que pode ajudar a monitorizar e detetar abusos.	No

Respostas

Código de Estado: 200

Descrição: Ok

Tipo de conteúdo	Type	Description
Application/JSON	generateImagesResponse

Código de Estado: padrão

Descrição: Ocorreu um erro.

Tipo de conteúdo	Type	Description
Application/JSON	dalleErrorResponse

Components

Para as definições de esquema usadas pelo chat, completions, embeddings, respostas e outras operações de texto, veja a referência à API REST do Azure OpenAI. Os seguintes esquemas suportam as operações de imagem e áudio nesta página.

innerErrorCode

Códigos de erro para o objeto de erro interno.

Propriedade	valor
Description	Códigos de erro para o objeto de erro interno.
Type	cadeia (de caracteres)
Valores	`ResponsibleAIPolicyViolation`

dalleErrorResponse

Name	Tipo	Description	Obrigatório	Predefinição
erro	dalleError		No

dalleError

Name	Tipo	Description	Obrigatório
inner_error	dalleInnerError	Erro interno com detalhes adicionais.	No
param	cadeia (de caracteres)		No
tipo	cadeia (de caracteres)		No

dalleInnerError

Erro interno com detalhes adicionais.

Name	Tipo	Description	Obrigatório
código	innerErrorCode	Códigos de erro para o objeto de erro interno.	No
content_filter_results	dalleFilterResults	Informação sobre a categoria de filtragem de conteúdos (ódio, sexual, violência, self_harm), se foi detetada, bem como o nível de gravidade (escala very_low, baixa, média, alta que determina a intensidade e o nível de risco do conteúdo nocivo) e se foi filtrada ou não. Informação sobre conteúdos de jailbreak e palavrões, se foram detetados e se foram filtrados ou não. E informação sobre a lista de bloqueio de clientes, se foi filtrada e o seu ID.	No
Proposta de Melhorias: - Certificar-se de que as frases e termos são traduzidos corretamente para refletir o mesmo significado do texto de origem. - Adaptar quaisquer termos em inglês que possam ser traduzidos naturalmente para português, preservando o seu significado. - Corrigir quaisquer questões gramaticais para aumentar a fluência e a legibilidade em português. - Usar a estrutura de frases em português natural para que a tradução soe nativa. - Verificar o uso apropriado de pontuação e registro para o português.	cadeia (de caracteres)	O prompt que foi usado para gerar a imagem, caso tenha havido alguma revisão ao prompt.	No

resultadoDeSeveridadeDoFiltroDeConteúdo

Name	Tipo	Description	Obrigatório	Predefinição
filtered	boolean		Yes
severity	cadeia (de caracteres)		No

resultado de deteção de filtro de conteúdo

Name	Tipo	Description	Obrigatório	Predefinição
detected	boolean		No
filtered	boolean		Yes

contentFilterDetailedResults

Resultados de filtragem de conteúdo com um detalhe dos IDs dos filtros de conteúdo para os segmentos filtrados.

Name	Tipo	Description	Obrigatório	Predefinição
details	matriz		No
filtered	boolean		Yes

dalleFilterResults

Informação sobre a categoria de filtragem de conteúdos (ódio, sexual, violência, self_harm), se foi detetada, bem como o nível de gravidade (escala very_low, baixa, média, alta que determina a intensidade e o nível de risco do conteúdo nocivo) e se foi filtrada ou não. Informação sobre conteúdos de jailbreak e palavrões, se foram detetados e se foram filtrados ou não. E informação sobre a lista de bloqueio de clientes, se foi filtrada e o seu ID.

Name	Tipo	Description	Obrigatório
custom_blocklists	contentFilterDetailedResults	Resultados de filtragem de conteúdo com um detalhe dos IDs dos filtros de conteúdo para os segmentos filtrados.	No
hate	resultadoDaGravidadeDoFiltroDeConteúdo		No
jailbreak	resultadoDetetadoDoFiltroDeConteúdo		No
profanity	resultadoDetetadoDoFiltroDeConteúdo		No
self_harm	resultadoDaGravidadeDoFiltroDeConteúdo		No
sexual	resultadoDaGravidadeDoFiltroDeConteúdo		No
violence	resultadoDaGravidadeDoFiltroDeConteúdo		No

audioResponseFormat

Define o formato da saída.

Propriedade	valor
Description	Define o formato da saída.
Type	cadeia (de caracteres)
Valores	`json` `text` `srt` `verbose_json` `vtt`

qualidade de imagem

A qualidade da imagem que será gerada.

Propriedade	valor
Description	A qualidade da imagem que será gerada.
Type	cadeia (de caracteres)
Predefinição	automóvel
Valores	`auto` `high` `medium` `low` `hd` `standard`

imagesResponseFormat

O formato em que as imagens geradas são devolvidas.

Propriedade	valor
Description	O formato em que as imagens geradas são devolvidas.
Type	cadeia (de caracteres)
Predefinição	url
Valores	`url` `b64_json`

imagesOutputFormat

O formato de ficheiro no qual as imagens geradas são devolvidas. Só é suportado para modelos em série.

Propriedade	valor
Description	O formato de ficheiro no qual as imagens geradas são devolvidas. Apenas suportado para modelos da série gpt-image-1.
Type	cadeia (de caracteres)
Predefinição	png
Valores	`png` `jpeg`

imageSize

O tamanho das imagens geradas.

Propriedade	valor
Description	O tamanho das imagens geradas.
Type	cadeia (de caracteres)
Predefinição	automóvel
Valores	`auto` `1792x1024` `1024x1792` `1024x1024` `1024x1536` `1536x1024`

imageStyle

O estilo das imagens geradas. Só é suportado para DALL-E-3.

Propriedade	valor
Description	O estilo das imagens geradas. Só é suportado para DALL-E-3.
Type	cadeia (de caracteres)
Predefinição	vívido
Valores	`vivid` `natural`

imageBackground

Permite definir transparência para o fundo da(s) imagem(s) gerada(s). Este parâmetro é apenas suportado para modelos da série gpt-image-1.

Propriedade	valor
Description	Permite definir transparência para o fundo da(s) imagem(s) gerada(s). Este parâmetro é apenas suportado para modelos da série gpt-image-1.
Type	cadeia (de caracteres)
Predefinição	automóvel
Valores	`transparent` `opaque` `auto`

generateImagesResponse

Name	Tipo	Description	Obrigatório
criado	número inteiro	O carimbo temporal do unix quando a operação foi criada.	Yes
dados	matriz	Os dados de resultado da operação, se bem-sucedidos	Yes
utilização	imageGenerationsUsage	Representa detalhes de utilização de tokens para pedidos de geração de imagens. Apenas para modelos da série GPT-image-1.	No

imageGenerationsUsage

Representa detalhes de utilização de tokens para pedidos de geração de imagens. Apenas para modelos da série GPT-image-1.

Name	Tipo	Description	Obrigatório
input_tokens	número inteiro	O número de tokens de entrada.	No
input_tokens_details	objecto	Uma análise detalhada dos tokens de entrada.	No
└─ image_tokens	número inteiro	O número de tokens de imagem.	No
└─ text_tokens	número inteiro	O número de tokens de texto.	No
output_tokens	número inteiro	O número de tokens de saída.	No
total_tokens	número inteiro	O número total de fichas usadas.	No

Passos seguintes

Aprenda sobre modelos e ajuste fino com a API REST. Saiba mais sobre os modelos subjacentes que alimentam Azure OpenAI.

Comentários

Esta página foi útil?

Last updated on 2026-06-24

Referência da API REST de imagem e áudio Azure OpenAI (2025-04-01-preview)

Especificações da API

Authentication

Versionamento da API REST

Inferência do plano de dados

Transcrições - Criar

Parâmetros de URI

Cabeçalho da solicitação

Órgão do Pedido

Respostas

Exemplos

Exemplo

Exemplo

Traduções - Create

Parâmetros de URI

Cabeçalho da solicitação

Órgão do Pedido

Respostas

Exemplos

Exemplo

Exemplo

Fala - Criar

Parâmetros de URI

Cabeçalho da solicitação

Órgão do Pedido

Respostas

Exemplos

Exemplo

Gerações de imagens - Criar

Parâmetros de URI

Cabeçalho da solicitação

Órgão do Pedido

Respostas

Exemplos

Exemplo

Gerações de imagens - Editar

Parâmetros de URI

Cabeçalho da solicitação

Órgão do Pedido

Respostas

Components

innerErrorCode

dalleErrorResponse

dalleError

dalleInnerError

resultadoDeSeveridadeDoFiltroDeConteúdo

resultado de deteção de filtro de conteúdo

contentFilterDetailedResults

dalleFilterResults

audioResponseFormat

qualidade de imagem

imagesResponseFormat

imagesOutputFormat

imageSize

imageStyle

imageBackground

generateImagesResponse

imageGenerationsUsage

Passos seguintes

Comentários

Recursos adicionais