Azure referencia de la API REST de audio y imagen de OpenAI (2025-04-01-preview)

En este artículo se documentan las operaciones de api rest de generación de imágenes y audio (voz) para Azure OpenAI en la 2025-04-01-preview versión. Para las finalizaciones de chat, incrustaciones, asistentes, respuestas, almacenes de vectores y todas las demás operaciones, consulte la referencia oficial de la API REST de OpenAI Azure.

Especificaciones de API

La gestión e interacción con los modelos y recursos de OpenAI de Azure se divide en tres superficies principales de API:

Plano de control
Plano de datos - creación
Plano de datos - inferencia

Cada superficie/especificación de API encapsula un conjunto diferente de capacidades de Azure OpenAI. Cada API tiene su propio conjunto único de versiones de vista previa y de APIs estables/disponibles en general (GA). Actualmente, los lanzamientos de vista previa tienden a seguir un ritmo mensual.

Importante

Ahora existe una nueva API de inferencia de vista previa. Descubre más en nuestra guía del ciclo de vida de la API.

API	Última versión previa	Último lanzamiento de GA	Specifications	Descripción
Plano de control	`2025-07-01-preview`	`2025-06-01`	Archivos de especificaciones técnicas	La API del plano de control se utiliza para operaciones como la creación de recursos, el despliegue de modelos y otras tareas de gestión de recursos de mayor nivel. El plano de control también regula lo que es posible hacer con capacidades como Azure Resource Manager, Bicep, Terraform y CLI de Azure.
Plano de datos	`v1 preview`	`v1`	Archivos de especificaciones técnicas	La API del plano de datos controla las operaciones de inferencia y autoría.

Authentication

Azure OpenAI ofrece dos métodos de autenticación. Puedes usar API Keys o Microsoft Entra ID.

Autenticación de clave API: Para este tipo de autenticación, todas las solicitudes API deben incluir la clave API en la api-key cabecera HTTP. El Quickstart ofrece orientación sobre cómo realizar llamadas con este tipo de autenticación.
Microsoft Entra ID: Puedes autenticar una llamada API usando un token Microsoft Entra. Los tokens de autenticación se incluyen en una solicitud como Authorization cabecera. El token proporcionado debe ir precedido por Bearer, por ejemplo Bearer YOUR_AUTH_TOKEN. Puedes leer nuestra guía práctica sobre autenticación con Microsoft Entra ID.

Versionado de la API REST

Las APIs de servicio se versionan usando el api-version parámetro de consulta. Todas las versiones siguen la estructura de fechas YYYY-MM-DD. Por ejemplo:

POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/chat/completions?api-version=2024-06-01

Inferencia en planos de datos

En el resto de este artículo se tratan las operaciones de imagen y audio en la 2025-04-01-preview versión preliminar de la especificación de inferencia del plano de datos openAI de Azure.

Para las operaciones de imagen y audio de disponibilidad general, consulte la referencia de la API REST de imagen y audio de disponibilidad general.

Transcripciones - Create

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

Transcribe el audio al idioma de entrada.

Parámetros de URI

Nombre	En	Obligatorio	Tipo	Descripción
endpoint	ruta	Sí	cadena de URL	Compatibles Azure endpoints OpenAI (protocolo y nombre de host, por ejemplo: `https://aoairesource.openai.azure.com`). Sustituye "aoairesource" por el nombre de tu recurso de Azure OpenAI). https://{your-resource-name}.openai.azure.com
ID de despliegue	ruta	Sí	string
versión de la API	consulta	Sí	string

Encabezado de solicitud

Utiliza autenticación basada en tokens o clave API. Se recomienda autenticar con autenticación basada en tokens y es más seguro.

Nombre	Obligatorio	Tipo	Descripción
Autorización	Cierto	string	Ejemplo:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Para generar un token de autenticación usando CLI de Azure: `az account get-access-token --resource https://cognitiveservices.azure.com` Tipo: oauth2 URL de autorización: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Alcance: `https://ai.azure.com/.default`
clave de API	Cierto	string	Proporciona aquí la clave API de Azure OpenAI

Cuerpo de la solicitud

Tipo de contenido: varias partes/datos de formulario

Nombre	Tipo	Descripción	Obligatorio	Predeterminado
model	string	ID del modelo a usar. Las opciones son `gpt-4o-transcribe`, `gpt-4o-mini-transcribe`, `gpt-4o-mini-transcribe-2025-12-15`, `whisper-1`, y `gpt-4o-transcribe-diarize`.	Sí
archivo	string	El objeto de archivo de audio para transcribir.	Sí
language	string	El idioma del audio de entrada. Suministrar el lenguaje de entrada en formato ISO-639-1 mejora la precisión y la latencia.	No
prompt	string	Un texto opcional para guiar el estilo del modelo o continuar un segmento de audio anterior. El prompt debería coincidir con el lenguaje del audio.	No
formato_de_respuesta	audioResponseFormat	Define el formato de la salida.	No
temperatura	número	La temperatura de muestreo, entre 0 y 1. Valores más altos como 0,8 harán que la salida sea más aleatoria, mientras que valores más bajos como 0,2 la harán más enfocada y determinista. Si se establece en 0, el modelo utiliza la probabilidad logarítmica para aumentar automáticamente la temperatura hasta alcanzar ciertos umbrales.	No	0
timestamp_granularities[]	array	Las granularidades de la marca temporal para esta transcripción. `response_format` debe configurarse `verbose_json` para usar granularidades de marca de tiempo. Se soportan una o ambas opciones: `word`, o `segment`. Nota: No hay latencia adicional para las marcas de tiempo de segmentos, pero generar marcas de tiempo de palabra implica latencia adicional.	No	['segment']

Responses

Código de estado: 200

Descripción: Aceptar

Tipo de contenido	Tipo	Descripción
application/json	object
text/plain	string	Texto transcrito en el formato de salida (cuando response_format era uno de `text`, `vtt` o `srt`).

Examples

Example

Obtiene texto transcrito y metadatos asociados de los datos de audio hablado proporcionados.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

Respuestas: Código de estado: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Example

Obtiene texto transcrito y metadatos asociados de los datos de audio hablado proporcionados.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Respuestas: Código de estado: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Traducciones - Create

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

Transcribe y traduce el audio de entrada a texto en inglés.

Parámetros de URI

Nombre	En	Obligatorio	Tipo	Descripción
endpoint	ruta	Sí	cadena de URL	Compatibles Azure endpoints OpenAI (protocolo y nombre de host, por ejemplo: `https://aoairesource.openai.azure.com`). Sustituye "aoairesource" por el nombre de tu recurso de Azure OpenAI). https://{your-resource-name}.openai.azure.com
ID de despliegue	ruta	Sí	string
versión de la API	consulta	Sí	string

Encabezado de solicitud

Utiliza autenticación basada en tokens o clave API. Se recomienda autenticar con autenticación basada en tokens y es más seguro.

Nombre	Obligatorio	Tipo	Descripción
Autorización	Cierto	string	Ejemplo:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Para generar un token de autenticación usando CLI de Azure: `az account get-access-token --resource https://cognitiveservices.azure.com` Tipo: oauth2 URL de autorización: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Alcance: `https://ai.azure.com/.default`
clave de API	Cierto	string	Proporciona aquí la clave API de Azure OpenAI

Cuerpo de la solicitud

Tipo de contenido: varias partes/datos de formulario

Nombre	Tipo	Descripción	Obligatorio	Predeterminado
archivo	string	El archivo de audio para traducir.	Sí
prompt	string	Un texto opcional para guiar el estilo del modelo o continuar un segmento de audio anterior. El prompt debería estar en inglés.	No
formato_de_respuesta	audioResponseFormat	Define el formato de la salida.	No
temperatura	número	La temperatura de muestreo, entre 0 y 1. Valores más altos como 0,8 harán que la salida sea más aleatoria, mientras que valores más bajos como 0,2 la harán más enfocada y determinista. Si se establece en 0, el modelo utiliza la probabilidad logarítmica para aumentar automáticamente la temperatura hasta alcanzar ciertos umbrales.	No	0

Responses

Código de estado: 200

Descripción: Aceptar

Tipo de contenido	Tipo	Descripción
application/json	object
text/plain	string	Texto transcrito en el formato de salida (cuando response_format era de texto, vtt o srt).

Examples

Example

Obtiene texto transcrito en inglés y metadatos asociados a partir de los datos de audio hablado proporcionados.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Respuestas: Código de estado: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Example

Obtiene texto transcrito en inglés y metadatos asociados a partir de los datos de audio hablado proporcionados.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Respuestas: Código de estado: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Discurso - Crear

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview

Genera audio a partir del texto de entrada.

Parámetros de URI

Nombre	En	Obligatorio	Tipo	Descripción
endpoint	ruta	Sí	cadena de URL	Compatibles Azure endpoints OpenAI (protocolo y nombre de host, por ejemplo: `https://aoairesource.openai.azure.com`). Sustituye "aoairesource" por el nombre de tu recurso de Azure OpenAI). https://{your-resource-name}.openai.azure.com
ID de despliegue	ruta	Sí	string
versión de la API	consulta	Sí	string

Encabezado de solicitud

Utiliza autenticación basada en tokens o clave API. Se recomienda autenticar con autenticación basada en tokens y es más seguro.

Nombre	Obligatorio	Tipo	Descripción
Autorización	Cierto	string	Ejemplo:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Para generar un token de autenticación usando CLI de Azure: `az account get-access-token --resource https://cognitiveservices.azure.com` Tipo: oauth2 URL de autorización: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Alcance: `https://ai.azure.com/.default`
clave de API	Cierto	string	Proporciona aquí la clave API de Azure OpenAI

Cuerpo de la solicitud

Tipo de contenido: varias partes/datos de formulario

Nombre	Tipo	Descripción	Obligatorio	Predeterminado
input	string	El texto para sintetizar audio. La longitud máxima es de 4.096 caracteres.	Sí
formato_de_respuesta	enum	El formato para sintetizar el audio. Valores posibles: `mp3`, `opus`, `aac`, `flac`, `wav`, `pcm`	No
velocidad	número	La velocidad del audio sintetizado. Seleccione un valor de `0.25` hasta `4.0`. `1.0` es el valor predeterminado.	No	1.0
voz	enum	La voz para usar en la síntesis de voz. Valores posibles: `alloy`, `echo`, `fable`, `onyx`, `nova`, `shimmer`	Sí

Responses

Código de estado: 200

Descripción: Aceptar

Tipo de contenido	Tipo	Descripción
application/octet-stream	string

Examples

Example

Sintetiza audio a partir del texto proporcionado.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview

{
 "input": "Hi! What are you going to make?",
 "voice": "fable",
 "response_format": "mp3"
}

Respuestas: Código de estado: 200

{
  "body": "101010101"
}

Generaciones de imágenes - Crear

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview

Genera un lote de imágenes a partir de un pie de foto en un despliegue dado de un modelo de generación de imágenes

Parámetros de URI

Nombre	En	Obligatorio	Tipo	Descripción
endpoint	ruta	Sí	cadena de URL	Compatibles Azure endpoints OpenAI (protocolo y nombre de host, por ejemplo: `https://aoairesource.openai.azure.com`). Sustituye "aoairesource" por el nombre de tu recurso de Azure OpenAI). https://{your-resource-name}.openai.azure.com
ID de despliegue	ruta	Sí	string
versión de la API	consulta	Sí	string

Encabezado de solicitud

Utiliza autenticación basada en tokens o clave API. Se recomienda autenticar con autenticación basada en tokens y es más seguro.

Nombre	Obligatorio	Tipo	Descripción
Autorización	Cierto	string	Ejemplo:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Para generar un token de autenticación usando CLI de Azure: `az account get-access-token --resource https://cognitiveservices.azure.com` Tipo: oauth2 URL de autorización: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Alcance: `https://ai.azure.com/.default`
clave de API	Cierto	string	Proporciona aquí la clave API de Azure OpenAI

Cuerpo de la solicitud

Tipo-Contenido: application/json

Nombre	Tipo	Descripción	Obligatorio	Predeterminado
fondo	imageBackground	Permite establecer transparencia para el fondo de las imágenes generadas. Este parámetro solo es compatible con modelos en serie gpt-image-1.	No	auto
n	entero	El número de imágenes que hay que generar. Para dall-e-3, solo se soporta n=1.	No	1
compresión_de_salida	entero	El nivel de compresión (0-100%) para las imágenes generadas. Este parámetro solo es compatible con modelos de la serie gpt-image-1 con el formato de salida jpeg.	No	100
formato_de_salida	imagesOutputFormat	El formato de archivo en el que se devuelven las imágenes generadas. Solo soportado para modelos de la serie GPT-image-1.	No	png
prompt	string	Una descripción en texto de la(s) imagen(es) deseada(s). La longitud máxima es de 32.000 caracteres para la serie gpt-image-1 y 4.000 caracteres para dall-e-3	Sí
imágenes_parciales	entero	El número de imágenes parciales que hay que generar. Este parámetro se utiliza para respuestas en streaming que devuelven imágenes parciales. El valor debe estar entre 0 y 3. Cuando se configura en 0, la respuesta será una sola imagen enviada en un evento de streaming. Ten en cuenta que la imagen final puede enviarse antes de que se generen el número completo de imágenes parciales si la imagen completa se genera más rápido.	0
stream	boolean	Edita la imagen en modo streaming.	no	`false`
calidad	imageQuality	La calidad de la imagen que se generará.	No	auto
formato_de_respuesta	imagesResponseFormat	El formato en el que se devuelven las imágenes generadas. Este parámetro no está soportado para `gpt-image-1`modelos en serie -, que siempre devolverán imágenes codificadas en base64. Valores posibles: `url`, `b64_json`.	No	url
size	imageSize	El tamaño de las imágenes generadas.	No	auto
estilo	imageStyle	El estilo de las imágenes generadas. Solo es compatible con DALL-E-3.	No	vívido
user	string	Un identificador único que representa a tu usuario final, que puede ayudar a monitorizar y detectar abusos.	No

Responses

Código de estado: 200

Descripción: Ok

Tipo de contenido	Tipo	Descripción
application/json	generateImagesResponse

Código de estado: por defecto

Descripción: Ha ocurrido un error.

Tipo de contenido	Tipo	Descripción
application/json	dalleErrorResponse

Examples

Example

Crea imágenes con un prompt.

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview

{
 "prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
 "n": 1,
 "style": "natural",
 "quality": "standard"
}

Respuestas: Código de estado: 200

{
  "body": {
    "created": 1698342300,
    "data": [
      {
        "revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
        "prompt_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          },
          "profanity": {
            "detected": false,
            "filtered": false
          },
          "custom_blocklists": {
            "filtered": false,
            "details": []
          }
        },
        "url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
        "content_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          }
        }
      }
    ]
  }
}

Generaciones de imágenes - Editar

POST https://{endpoint}/openai/deployments/{deployment-id}/images/edits?api-version=2025-04-01-preview

Edita una imagen de un pie de foto en un despliegue dado de un modelo gpt-image-1

Parámetros de URI

Nombre	En	Obligatorio	Tipo	Descripción
endpoint	ruta	Sí	cadena de URL	Compatibles Azure endpoints OpenAI (protocolo y nombre de host, por ejemplo: `https://aoairesource.openai.azure.com`). Sustituye "aoairesource" por el nombre de tu recurso de Azure OpenAI). https://{your-resource-name}.openai.azure.com
ID de despliegue	ruta	Sí	string
versión de la API	consulta	Sí	string

Encabezado de solicitud

Utiliza autenticación basada en tokens o clave API. Se recomienda autenticar con autenticación basada en tokens y es más seguro.

Nombre	Obligatorio	Tipo	Descripción
Autorización	Cierto	string	Ejemplo:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Para generar un token de autenticación usando CLI de Azure: `az account get-access-token --resource https://cognitiveservices.azure.com` Tipo: oauth2 URL de autorización: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Alcance: `https://ai.azure.com/.default`
clave de API	Cierto	string	Proporciona aquí la clave API de Azure OpenAI

Cuerpo de la solicitud

Tipo de contenido: varias partes/datos de formulario

Nombre	Tipo	Descripción	Obligatorio	Predeterminado
imagen	Cadena o matriz	La(s) imagen(es) a editar. Debe ser un archivo de imagen compatible o un array de imágenes. Cada imagen debe ser un archivo png o jpg de menos de 50MB.	Sí
input_fidelity	string	Controla cuánto esfuerzo ejercerá el modelo para que coincida con el estilo y las características, especialmente los rasgos faciales, de las imágenes de entrada. Este parámetro solo es compatible con modelos en serie gpt-image-1. Apoyos `high` y `low`.	no	`low`.
máscara	string	Una imagen adicional cuyas áreas totalmente transparentes (por ejemplo, donde alfa es cero) indica dónde debe editarse la imagen. Si se proporcionan varias imágenes, la máscara se aplicará a la primera imagen. Debe ser un archivo PNG válido, menos de 4MB y tener las mismas dimensiones que la imagen.	No
n	entero	El número de imágenes que hay que generar. Debe de estar entre 1 y 10.	No	1
prompt	string	Una descripción en texto de la(s) imagen(es) deseada(s). La longitud máxima es de 32.000 caracteres.	Sí
calidad	imageQuality	La calidad de la imagen que se generará.	No	auto
imágenes_parciales	El número de imágenes parciales que hay que generar. Este parámetro se utiliza para respuestas en streaming que devuelven imágenes parciales. El valor debe estar entre 0 y 3. Cuando se configura en 0, la respuesta será una sola imagen enviada en un evento de streaming. Ten en cuenta que la imagen final puede enviarse antes de que se generen el número completo de imágenes parciales si la imagen completa se genera más rápido.
stream	boolean	Edita la imagen en modo streaming.	no	`false`
formato_de_respuesta	imagesResponseFormat	El formato en el que se devuelven las imágenes generadas.	No	url
size	imageSize	El tamaño de las imágenes generadas.	No	auto
user	string	Un identificador único que representa a tu usuario final, que puede ayudar a monitorizar y detectar abusos.	No

Responses

Código de estado: 200

Descripción: Ok

Tipo de contenido	Tipo	Descripción
application/json	generateImagesResponse

Código de estado: por defecto

Descripción: Ha ocurrido un error.

Tipo de contenido	Tipo	Descripción
application/json	dalleErrorResponse

Componentes

Para conocer las definiciones de esquema usadas por chat, finalizaciones, incrustaciones, respuestas y otras operaciones de texto, consulte la referencia de la API rest de OpenAI de Azure. Los siguientes esquemas admiten las operaciones de imagen y audio en esta página.

innerErrorCode

Códigos de error para el objeto de error interno.

Propiedad	Value
Descripción	Códigos de error para el objeto de error interno.
Tipo	string
Valores	`ResponsibleAIPolicyViolation`

dalleErrorResponse

Nombre	Tipo	Descripción	Obligatorio	Predeterminado
error	dalleError		No

dalleError

Nombre	Tipo	Descripción	Obligatorio
inner_error	dalleInnerError	Error interno con detalles adicionales.	No
param	string		No
type	string		No

dalleInnerError

Error interno con detalles adicionales.

Nombre	Tipo	Descripción	Obligatorio
código	innerErrorCode	Códigos de error para el objeto de error interno.	No
content_filter_results	dalleFilterResults	Información sobre la categoría de filtrado de contenido (odio, sexual, violencia, self_harm), si ha sido detectada, así como el nivel de gravedad (escala very_low, baja, media, alta que determina la intensidad y el nivel de riesgo del contenido dañino) y si ha sido filtrado o no. Información sobre contenido de jailbreak y palabrotas, si se ha detectado y si ha sido filtrado o no. Y información sobre la lista de bloqueos de clientes, si ha sido filtrada y su identificación.	No
mensaje_revisado	string	El prompt que se usó para generar la imagen, si hubo alguna revisión del prompt.	No

contentFilterSeverityResult

Nombre	Tipo	Descripción	Obligatorio	Predeterminado
filtered	boolean		Sí
severity	string		No

contentFilterDetectedResult

Nombre	Tipo	Descripción	Obligatorio	Predeterminado
detectado	boolean		No
filtered	boolean		Sí

contentFilterDetailedResults

Resultados de filtrado de contenido con un detalle de los identificadores de filtro de contenido para los segmentos filtrados.

Nombre	Tipo	Descripción	Obligatorio	Predeterminado
detalles	array		No
filtered	boolean		Sí

dalleFilterResults

Información sobre la categoría de filtrado de contenido (odio, sexual, violencia, self_harm), si ha sido detectada, así como el nivel de gravedad (escala very_low, baja, media, alta que determina la intensidad y el nivel de riesgo del contenido dañino) y si ha sido filtrado o no. Información sobre contenido de jailbreak y palabrotas, si se ha detectado y si ha sido filtrado o no. Y información sobre la lista de bloqueos de clientes, si ha sido filtrada y su identificación.

Nombre	Tipo	Descripción	Obligatorio
custom_blocklists	contentFilterDetailedResults	Resultados de filtrado de contenido con un detalle de los identificadores de filtro de contenido para los segmentos filtrados.	No
odio	contentFilterSeverityResult		No
jailbreak	resultadoDetectadoPorElFiltroDeContenido		No
soece	resultadoDetectadoPorElFiltroDeContenido		No
self_harm	contentFilterSeverityResult		No
sexual	contentFilterSeverityResult		No
violencia	contentFilterSeverityResult		No

audioResponseFormat

Define el formato de la salida.

Propiedad	Value
Descripción	Define el formato de la salida.
Tipo	string
Valores	`json` `text` `srt` `verbose_json` `vtt`

imageQuality

La calidad de la imagen que se generará.

Propiedad	Value
Descripción	La calidad de la imagen que se generará.
Tipo	string
Predeterminado	auto
Valores	`auto` `high` `medium` `low` `hd` `standard`

imagesResponseFormat

El formato en el que se devuelven las imágenes generadas.

Propiedad	Value
Descripción	El formato en el que se devuelven las imágenes generadas.
Tipo	string
Predeterminado	url
Valores	`url` `b64_json`

imagesOutputFormat

El formato de archivo en el que se devuelven las imágenes generadas. Solo soportado para modelos de serie.

Propiedad	Value
Descripción	El formato de archivo en el que se devuelven las imágenes generadas. Solo soportado para modelos de la serie GPT-image-1.
Tipo	string
Predeterminado	png
Valores	`png` `jpeg`

imageSize

El tamaño de las imágenes generadas.

Propiedad	Value
Descripción	El tamaño de las imágenes generadas.
Tipo	string
Predeterminado	auto
Valores	`auto` `1792x1024` `1024x1792` `1024x1024` `1024x1536` `1536x1024`

imageStyle

El estilo de las imágenes generadas. Solo es compatible con DALL-E-3.

Propiedad	Value
Descripción	El estilo de las imágenes generadas. Solo es compatible con DALL-E-3.
Tipo	string
Predeterminado	vívido
Valores	`vivid` `natural`

imageBackground

Permite establecer transparencia para el fondo de la(s) imagen(es) generada(s). Este parámetro solo es compatible con modelos en serie gpt-image-1.

Propiedad	Value
Descripción	Permite establecer transparencia para el fondo de la(s) imagen(es) generada(s). Este parámetro solo es compatible con modelos en serie gpt-image-1.
Tipo	string
Predeterminado	auto
Valores	`transparent` `opaque` `auto`

generateImagesResponse

Nombre	Tipo	Descripción	Obligatorio
creado	entero	La marca de tiempo de Unix cuando se creó la operación.	Sí
datos	array	Los datos de resultados de la operación, si tienen éxito	Sí
uso	imageGenerationsUsage	Representa detalles de uso de tokens para solicitudes de generación de imágenes. Solo para modelos de la serie GPT-image-1.	No

imageGenerationsUsage

Representa detalles de uso de tokens para solicitudes de generación de imágenes. Solo para modelos de la serie GPT-image-1.

Nombre	Tipo	Descripción	Obligatorio
input_tokens	entero	El número de tokens de entrada.	No
input_tokens_details	object	Un desglose detallado de los tokens de entrada.	No
└" image_tokens	entero	El número de tokens de imagen.	No
└" text_tokens	entero	El número de fichas de texto.	No
output_tokens	entero	El número de tokens de salida.	No
total_tokens	entero	El número total de fichas utilizadas.	No

Pasos siguientes

Obtenga información sobre los modelos y la optimización con la API REST. Obtenga más información sobre los modelos underlying que potencian Azure OpenAI.

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2026-06-24

Azure referencia de la API REST de audio y imagen de OpenAI (2025-04-01-preview)

Especificaciones de API

Authentication

Versionado de la API REST

Inferencia en planos de datos

Transcripciones - Create

Parámetros de URI

Encabezado de solicitud

Cuerpo de la solicitud

Responses

Examples

Example

Example

Traducciones - Create

Parámetros de URI

Encabezado de solicitud

Cuerpo de la solicitud

Responses

Examples

Example

Example

Discurso - Crear

Parámetros de URI

Encabezado de solicitud

Cuerpo de la solicitud

Responses

Examples

Example

Generaciones de imágenes - Crear

Parámetros de URI

Encabezado de solicitud

Cuerpo de la solicitud

Responses

Examples

Example

Generaciones de imágenes - Editar

Parámetros de URI

Encabezado de solicitud

Cuerpo de la solicitud

Responses

Componentes

innerErrorCode

dalleErrorResponse

dalleError

dalleInnerError

contentFilterSeverityResult

contentFilterDetectedResult

contentFilterDetailedResults

dalleFilterResults

audioResponseFormat

imageQuality

imagesResponseFormat

imagesOutputFormat

imageSize

imageStyle

imageBackground

generateImagesResponse

imageGenerationsUsage

Pasos siguientes

Comentarios

Recursos adicionales