Azure referencia de la API REST de audio y imagen de OpenAI (2025-04-01-preview)

En este artículo se documentan las operaciones de api rest de generación de imágenes y audio (voz) para Azure OpenAI en la 2025-04-01-preview versión. Para las finalizaciones de chat, incrustaciones, asistentes, respuestas, almacenes de vectores y todas las demás operaciones, consulte la referencia oficial de la API REST de OpenAI Azure.

Especificaciones de API

La gestión e interacción con los modelos y recursos de OpenAI de Azure se divide en tres superficies principales de API:

  • Plano de control
  • Plano de datos - creación
  • Plano de datos - inferencia

Cada superficie/especificación de API encapsula un conjunto diferente de capacidades de Azure OpenAI. Cada API tiene su propio conjunto único de versiones de vista previa y de APIs estables/disponibles en general (GA). Actualmente, los lanzamientos de vista previa tienden a seguir un ritmo mensual.

Importante

Ahora existe una nueva API de inferencia de vista previa. Descubre más en nuestra guía del ciclo de vida de la API.

API Última versión previa Último lanzamiento de GA Specifications Descripción
Plano de control 2025-07-01-preview 2025-06-01 Archivos de especificaciones técnicas La API del plano de control se utiliza para operaciones como la creación de recursos, el despliegue de modelos y otras tareas de gestión de recursos de mayor nivel. El plano de control también regula lo que es posible hacer con capacidades como Azure Resource Manager, Bicep, Terraform y CLI de Azure.
Plano de datos v1 preview v1 Archivos de especificaciones técnicas La API del plano de datos controla las operaciones de inferencia y autoría.

Authentication

Azure OpenAI ofrece dos métodos de autenticación. Puedes usar API Keys o Microsoft Entra ID.

  • Autenticación de clave API: Para este tipo de autenticación, todas las solicitudes API deben incluir la clave API en la api-key cabecera HTTP. El Quickstart ofrece orientación sobre cómo realizar llamadas con este tipo de autenticación.

  • Microsoft Entra ID: Puedes autenticar una llamada API usando un token Microsoft Entra. Los tokens de autenticación se incluyen en una solicitud como Authorization cabecera. El token proporcionado debe ir precedido por Bearer, por ejemplo Bearer YOUR_AUTH_TOKEN. Puedes leer nuestra guía práctica sobre autenticación con Microsoft Entra ID.

Versionado de la API REST

Las APIs de servicio se versionan usando el api-version parámetro de consulta. Todas las versiones siguen la estructura de fechas YYYY-MM-DD. Por ejemplo:

POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/chat/completions?api-version=2024-06-01

Inferencia en planos de datos

En el resto de este artículo se tratan las operaciones de imagen y audio en la 2025-04-01-preview versión preliminar de la especificación de inferencia del plano de datos openAI de Azure.

Para las operaciones de imagen y audio de disponibilidad general, consulte la referencia de la API REST de imagen y audio de disponibilidad general.

Transcripciones - Create

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

Transcribe el audio al idioma de entrada.

Parámetros de URI

Nombre En Obligatorio Tipo Descripción
endpoint ruta cadena de URL Compatibles Azure endpoints OpenAI (protocolo y nombre de host, por ejemplo: https://aoairesource.openai.azure.com). Sustituye "aoairesource" por el nombre de tu recurso de Azure OpenAI). https://{your-resource-name}.openai.azure.com
ID de despliegue ruta string
versión de la API consulta string

Encabezado de solicitud

Utiliza autenticación basada en tokens o clave API. Se recomienda autenticar con autenticación basada en tokens y es más seguro.

Nombre Obligatorio Tipo Descripción
Autorización Cierto string Ejemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para generar un token de autenticación usando CLI de Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de autorización: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Alcance: https://ai.azure.com/.default
clave de API Cierto string Proporciona aquí la clave API de Azure OpenAI

Cuerpo de la solicitud

Tipo de contenido: varias partes/datos de formulario

Nombre Tipo Descripción Obligatorio Predeterminado
model string ID del modelo a usar. Las opciones son gpt-4o-transcribe, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15, whisper-1, y gpt-4o-transcribe-diarize.
archivo string El objeto de archivo de audio para transcribir.
language string El idioma del audio de entrada. Suministrar el lenguaje de entrada en formato ISO-639-1 mejora la precisión y la latencia. No
prompt string Un texto opcional para guiar el estilo del modelo o continuar un segmento de audio anterior. El prompt debería coincidir con el lenguaje del audio. No
formato_de_respuesta audioResponseFormat Define el formato de la salida. No
temperatura número La temperatura de muestreo, entre 0 y 1. Valores más altos como 0,8 harán que la salida sea más aleatoria, mientras que valores más bajos como 0,2 la harán más enfocada y determinista. Si se establece en 0, el modelo utiliza la probabilidad logarítmica para aumentar automáticamente la temperatura hasta alcanzar ciertos umbrales. No 0
timestamp_granularities[] array Las granularidades de la marca temporal para esta transcripción. response_format debe configurarse verbose_json para usar granularidades de marca de tiempo. Se soportan una o ambas opciones: word, o segment. Nota: No hay latencia adicional para las marcas de tiempo de segmentos, pero generar marcas de tiempo de palabra implica latencia adicional. No ['segment']

Responses

Código de estado: 200

Descripción: Aceptar

Tipo de contenido Tipo Descripción
application/json object
text/plain string Texto transcrito en el formato de salida (cuando response_format era uno de text, vtt o srt).

Examples

Example

Obtiene texto transcrito y metadatos asociados de los datos de audio hablado proporcionados.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

Respuestas: Código de estado: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Example

Obtiene texto transcrito y metadatos asociados de los datos de audio hablado proporcionados.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Respuestas: Código de estado: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Traducciones - Create

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

Transcribe y traduce el audio de entrada a texto en inglés.

Parámetros de URI

Nombre En Obligatorio Tipo Descripción
endpoint ruta cadena de URL Compatibles Azure endpoints OpenAI (protocolo y nombre de host, por ejemplo: https://aoairesource.openai.azure.com). Sustituye "aoairesource" por el nombre de tu recurso de Azure OpenAI). https://{your-resource-name}.openai.azure.com
ID de despliegue ruta string
versión de la API consulta string

Encabezado de solicitud

Utiliza autenticación basada en tokens o clave API. Se recomienda autenticar con autenticación basada en tokens y es más seguro.

Nombre Obligatorio Tipo Descripción
Autorización Cierto string Ejemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para generar un token de autenticación usando CLI de Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de autorización: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Alcance: https://ai.azure.com/.default
clave de API Cierto string Proporciona aquí la clave API de Azure OpenAI

Cuerpo de la solicitud

Tipo de contenido: varias partes/datos de formulario

Nombre Tipo Descripción Obligatorio Predeterminado
archivo string El archivo de audio para traducir.
prompt string Un texto opcional para guiar el estilo del modelo o continuar un segmento de audio anterior. El prompt debería estar en inglés. No
formato_de_respuesta audioResponseFormat Define el formato de la salida. No
temperatura número La temperatura de muestreo, entre 0 y 1. Valores más altos como 0,8 harán que la salida sea más aleatoria, mientras que valores más bajos como 0,2 la harán más enfocada y determinista. Si se establece en 0, el modelo utiliza la probabilidad logarítmica para aumentar automáticamente la temperatura hasta alcanzar ciertos umbrales. No 0

Responses

Código de estado: 200

Descripción: Aceptar

Tipo de contenido Tipo Descripción
application/json object
text/plain string Texto transcrito en el formato de salida (cuando response_format era de texto, vtt o srt).

Examples

Example

Obtiene texto transcrito en inglés y metadatos asociados a partir de los datos de audio hablado proporcionados.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Respuestas: Código de estado: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Example

Obtiene texto transcrito en inglés y metadatos asociados a partir de los datos de audio hablado proporcionados.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Respuestas: Código de estado: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Discurso - Crear

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview

Genera audio a partir del texto de entrada.

Parámetros de URI

Nombre En Obligatorio Tipo Descripción
endpoint ruta cadena de URL Compatibles Azure endpoints OpenAI (protocolo y nombre de host, por ejemplo: https://aoairesource.openai.azure.com). Sustituye "aoairesource" por el nombre de tu recurso de Azure OpenAI). https://{your-resource-name}.openai.azure.com
ID de despliegue ruta string
versión de la API consulta string

Encabezado de solicitud

Utiliza autenticación basada en tokens o clave API. Se recomienda autenticar con autenticación basada en tokens y es más seguro.

Nombre Obligatorio Tipo Descripción
Autorización Cierto string Ejemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para generar un token de autenticación usando CLI de Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de autorización: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Alcance: https://ai.azure.com/.default
clave de API Cierto string Proporciona aquí la clave API de Azure OpenAI

Cuerpo de la solicitud

Tipo de contenido: varias partes/datos de formulario

Nombre Tipo Descripción Obligatorio Predeterminado
input string El texto para sintetizar audio. La longitud máxima es de 4.096 caracteres.
formato_de_respuesta enum El formato para sintetizar el audio.
Valores posibles: mp3, opus, aac, flac, wav, pcm
No
velocidad número La velocidad del audio sintetizado. Seleccione un valor de 0.25 hasta 4.0. 1.0 es el valor predeterminado. No 1.0
voz enum La voz para usar en la síntesis de voz.
Valores posibles: alloy, echo, fable, onyx, nova, shimmer

Responses

Código de estado: 200

Descripción: Aceptar

Tipo de contenido Tipo Descripción
application/octet-stream string

Examples

Example

Sintetiza audio a partir del texto proporcionado.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview

{
 "input": "Hi! What are you going to make?",
 "voice": "fable",
 "response_format": "mp3"
}

Respuestas: Código de estado: 200

{
  "body": "101010101"
}

Generaciones de imágenes - Crear

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview

Genera un lote de imágenes a partir de un pie de foto en un despliegue dado de un modelo de generación de imágenes

Parámetros de URI

Nombre En Obligatorio Tipo Descripción
endpoint ruta cadena de URL Compatibles Azure endpoints OpenAI (protocolo y nombre de host, por ejemplo: https://aoairesource.openai.azure.com). Sustituye "aoairesource" por el nombre de tu recurso de Azure OpenAI). https://{your-resource-name}.openai.azure.com
ID de despliegue ruta string
versión de la API consulta string

Encabezado de solicitud

Utiliza autenticación basada en tokens o clave API. Se recomienda autenticar con autenticación basada en tokens y es más seguro.

Nombre Obligatorio Tipo Descripción
Autorización Cierto string Ejemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para generar un token de autenticación usando CLI de Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de autorización: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Alcance: https://ai.azure.com/.default
clave de API Cierto string Proporciona aquí la clave API de Azure OpenAI

Cuerpo de la solicitud

Tipo-Contenido: application/json

Nombre Tipo Descripción Obligatorio Predeterminado
fondo imageBackground Permite establecer transparencia para el fondo de las imágenes generadas. Este parámetro solo es compatible con modelos en serie gpt-image-1. No auto
n entero El número de imágenes que hay que generar. Para dall-e-3, solo se soporta n=1. No 1
compresión_de_salida entero El nivel de compresión (0-100%) para las imágenes generadas. Este parámetro solo es compatible con modelos de la serie gpt-image-1 con el formato de salida jpeg. No 100
formato_de_salida imagesOutputFormat El formato de archivo en el que se devuelven las imágenes generadas. Solo soportado para modelos de la serie GPT-image-1. No png
prompt string Una descripción en texto de la(s) imagen(es) deseada(s). La longitud máxima es de 32.000 caracteres para la serie gpt-image-1 y 4.000 caracteres para dall-e-3
imágenes_parciales entero El número de imágenes parciales que hay que generar. Este parámetro se utiliza para respuestas en streaming que devuelven imágenes parciales. El valor debe estar entre 0 y 3. Cuando se configura en 0, la respuesta será una sola imagen enviada en un evento de streaming. Ten en cuenta que la imagen final puede enviarse antes de que se generen el número completo de imágenes parciales si la imagen completa se genera más rápido. 0
stream boolean Edita la imagen en modo streaming. no false
calidad imageQuality La calidad de la imagen que se generará. No auto
formato_de_respuesta imagesResponseFormat El formato en el que se devuelven las imágenes generadas. Este parámetro no está soportado para gpt-image-1modelos en serie -, que siempre devolverán imágenes codificadas en base64.
Valores posibles: url, b64_json.
No url
size imageSize El tamaño de las imágenes generadas. No auto
estilo imageStyle El estilo de las imágenes generadas. Solo es compatible con DALL-E-3. No vívido
user string Un identificador único que representa a tu usuario final, que puede ayudar a monitorizar y detectar abusos. No

Responses

Código de estado: 200

Descripción: Ok

Tipo de contenido Tipo Descripción
application/json generateImagesResponse

Código de estado: por defecto

Descripción: Ha ocurrido un error.

Tipo de contenido Tipo Descripción
application/json dalleErrorResponse

Examples

Example

Crea imágenes con un prompt.

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview

{
 "prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
 "n": 1,
 "style": "natural",
 "quality": "standard"
}

Respuestas: Código de estado: 200

{
  "body": {
    "created": 1698342300,
    "data": [
      {
        "revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
        "prompt_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          },
          "profanity": {
            "detected": false,
            "filtered": false
          },
          "custom_blocklists": {
            "filtered": false,
            "details": []
          }
        },
        "url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
        "content_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          }
        }
      }
    ]
  }
}

Generaciones de imágenes - Editar

POST https://{endpoint}/openai/deployments/{deployment-id}/images/edits?api-version=2025-04-01-preview

Edita una imagen de un pie de foto en un despliegue dado de un modelo gpt-image-1

Parámetros de URI

Nombre En Obligatorio Tipo Descripción
endpoint ruta cadena de URL Compatibles Azure endpoints OpenAI (protocolo y nombre de host, por ejemplo: https://aoairesource.openai.azure.com). Sustituye "aoairesource" por el nombre de tu recurso de Azure OpenAI). https://{your-resource-name}.openai.azure.com
ID de despliegue ruta string
versión de la API consulta string

Encabezado de solicitud

Utiliza autenticación basada en tokens o clave API. Se recomienda autenticar con autenticación basada en tokens y es más seguro.

Nombre Obligatorio Tipo Descripción
Autorización Cierto string Ejemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Para generar un token de autenticación usando CLI de Azure: az account get-access-token --resource https://cognitiveservices.azure.com

Tipo: oauth2
URL de autorización: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Alcance: https://ai.azure.com/.default
clave de API Cierto string Proporciona aquí la clave API de Azure OpenAI

Cuerpo de la solicitud

Tipo de contenido: varias partes/datos de formulario

Nombre Tipo Descripción Obligatorio Predeterminado
imagen Cadena o matriz La(s) imagen(es) a editar. Debe ser un archivo de imagen compatible o un array de imágenes. Cada imagen debe ser un archivo png o jpg de menos de 50MB.
input_fidelity string Controla cuánto esfuerzo ejercerá el modelo para que coincida con el estilo y las características, especialmente los rasgos faciales, de las imágenes de entrada. Este parámetro solo es compatible con modelos en serie gpt-image-1. Apoyos high y low. no low.
máscara string Una imagen adicional cuyas áreas totalmente transparentes (por ejemplo, donde alfa es cero) indica dónde debe editarse la imagen. Si se proporcionan varias imágenes, la máscara se aplicará a la primera imagen. Debe ser un archivo PNG válido, menos de 4MB y tener las mismas dimensiones que la imagen. No
n entero El número de imágenes que hay que generar. Debe de estar entre 1 y 10. No 1
prompt string Una descripción en texto de la(s) imagen(es) deseada(s). La longitud máxima es de 32.000 caracteres.
calidad imageQuality La calidad de la imagen que se generará. No auto
imágenes_parciales El número de imágenes parciales que hay que generar. Este parámetro se utiliza para respuestas en streaming que devuelven imágenes parciales. El valor debe estar entre 0 y 3. Cuando se configura en 0, la respuesta será una sola imagen enviada en un evento de streaming. Ten en cuenta que la imagen final puede enviarse antes de que se generen el número completo de imágenes parciales si la imagen completa se genera más rápido.
stream boolean Edita la imagen en modo streaming. no false
formato_de_respuesta imagesResponseFormat El formato en el que se devuelven las imágenes generadas. No url
size imageSize El tamaño de las imágenes generadas. No auto
user string Un identificador único que representa a tu usuario final, que puede ayudar a monitorizar y detectar abusos. No

Responses

Código de estado: 200

Descripción: Ok

Tipo de contenido Tipo Descripción
application/json generateImagesResponse

Código de estado: por defecto

Descripción: Ha ocurrido un error.

Tipo de contenido Tipo Descripción
application/json dalleErrorResponse

Componentes

Para conocer las definiciones de esquema usadas por chat, finalizaciones, incrustaciones, respuestas y otras operaciones de texto, consulte la referencia de la API rest de OpenAI de Azure. Los siguientes esquemas admiten las operaciones de imagen y audio en esta página.

innerErrorCode

Códigos de error para el objeto de error interno.

Propiedad Value
Descripción Códigos de error para el objeto de error interno.
Tipo string
Valores ResponsibleAIPolicyViolation

dalleErrorResponse

Nombre Tipo Descripción Obligatorio Predeterminado
error dalleError No

dalleError

Nombre Tipo Descripción Obligatorio Predeterminado
inner_error dalleInnerError Error interno con detalles adicionales. No
param string No
type string No

dalleInnerError

Error interno con detalles adicionales.

Nombre Tipo Descripción Obligatorio Predeterminado
código innerErrorCode Códigos de error para el objeto de error interno. No
content_filter_results dalleFilterResults Información sobre la categoría de filtrado de contenido (odio, sexual, violencia, self_harm), si ha sido detectada, así como el nivel de gravedad (escala very_low, baja, media, alta que determina la intensidad y el nivel de riesgo del contenido dañino) y si ha sido filtrado o no. Información sobre contenido de jailbreak y palabrotas, si se ha detectado y si ha sido filtrado o no. Y información sobre la lista de bloqueos de clientes, si ha sido filtrada y su identificación. No
mensaje_revisado string El prompt que se usó para generar la imagen, si hubo alguna revisión del prompt. No

contentFilterSeverityResult

Nombre Tipo Descripción Obligatorio Predeterminado
filtered boolean
severity string No

contentFilterDetectedResult

Nombre Tipo Descripción Obligatorio Predeterminado
detectado boolean No
filtered boolean

contentFilterDetailedResults

Resultados de filtrado de contenido con un detalle de los identificadores de filtro de contenido para los segmentos filtrados.

Nombre Tipo Descripción Obligatorio Predeterminado
detalles array No
filtered boolean

dalleFilterResults

Información sobre la categoría de filtrado de contenido (odio, sexual, violencia, self_harm), si ha sido detectada, así como el nivel de gravedad (escala very_low, baja, media, alta que determina la intensidad y el nivel de riesgo del contenido dañino) y si ha sido filtrado o no. Información sobre contenido de jailbreak y palabrotas, si se ha detectado y si ha sido filtrado o no. Y información sobre la lista de bloqueos de clientes, si ha sido filtrada y su identificación.

Nombre Tipo Descripción Obligatorio Predeterminado
custom_blocklists contentFilterDetailedResults Resultados de filtrado de contenido con un detalle de los identificadores de filtro de contenido para los segmentos filtrados. No
odio contentFilterSeverityResult No
jailbreak resultadoDetectadoPorElFiltroDeContenido No
soece resultadoDetectadoPorElFiltroDeContenido No
self_harm contentFilterSeverityResult No
sexual contentFilterSeverityResult No
violencia contentFilterSeverityResult No

audioResponseFormat

Define el formato de la salida.

Propiedad Value
Descripción Define el formato de la salida.
Tipo string
Valores json
text
srt
verbose_json
vtt

imageQuality

La calidad de la imagen que se generará.

Propiedad Value
Descripción La calidad de la imagen que se generará.
Tipo string
Predeterminado auto
Valores auto
high
medium
low
hd
standard

imagesResponseFormat

El formato en el que se devuelven las imágenes generadas.

Propiedad Value
Descripción El formato en el que se devuelven las imágenes generadas.
Tipo string
Predeterminado url
Valores url
b64_json

imagesOutputFormat

El formato de archivo en el que se devuelven las imágenes generadas. Solo soportado para modelos de serie.

Propiedad Value
Descripción El formato de archivo en el que se devuelven las imágenes generadas. Solo soportado para modelos de la serie GPT-image-1.
Tipo string
Predeterminado png
Valores png
jpeg

imageSize

El tamaño de las imágenes generadas.

Propiedad Value
Descripción El tamaño de las imágenes generadas.
Tipo string
Predeterminado auto
Valores auto
1792x1024
1024x1792
1024x1024
1024x1536
1536x1024

imageStyle

El estilo de las imágenes generadas. Solo es compatible con DALL-E-3.

Propiedad Value
Descripción El estilo de las imágenes generadas. Solo es compatible con DALL-E-3.
Tipo string
Predeterminado vívido
Valores vivid
natural

imageBackground

Permite establecer transparencia para el fondo de la(s) imagen(es) generada(s). Este parámetro solo es compatible con modelos en serie gpt-image-1.

Propiedad Value
Descripción Permite establecer transparencia para el fondo de la(s) imagen(es) generada(s). Este parámetro solo es compatible con modelos en serie gpt-image-1.
Tipo string
Predeterminado auto
Valores transparent
opaque
auto

generateImagesResponse

Nombre Tipo Descripción Obligatorio Predeterminado
creado entero La marca de tiempo de Unix cuando se creó la operación.
datos array Los datos de resultados de la operación, si tienen éxito
uso imageGenerationsUsage Representa detalles de uso de tokens para solicitudes de generación de imágenes. Solo para modelos de la serie GPT-image-1. No

imageGenerationsUsage

Representa detalles de uso de tokens para solicitudes de generación de imágenes. Solo para modelos de la serie GPT-image-1.

Nombre Tipo Descripción Obligatorio Predeterminado
input_tokens entero El número de tokens de entrada. No
input_tokens_details object Un desglose detallado de los tokens de entrada. No
└" image_tokens entero El número de tokens de imagen. No
└" text_tokens entero El número de fichas de texto. No
output_tokens entero El número de tokens de salida. No
total_tokens entero El número total de fichas utilizadas. No

Pasos siguientes

Obtenga información sobre los modelos y la optimización con la API REST. Obtenga más información sobre los modelos underlying que potencian Azure OpenAI.