Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En este artículo se documentan las operaciones de api rest de generación de imágenes y audio (voz) para Azure OpenAI en la 2025-04-01-preview versión. Para las finalizaciones de chat, incrustaciones, asistentes, respuestas, almacenes de vectores y todas las demás operaciones, consulte la referencia oficial de la API REST de OpenAI Azure.
Especificaciones de API
La gestión e interacción con los modelos y recursos de OpenAI de Azure se divide en tres superficies principales de API:
- Plano de control
- Plano de datos - creación
- Plano de datos - inferencia
Cada superficie/especificación de API encapsula un conjunto diferente de capacidades de Azure OpenAI. Cada API tiene su propio conjunto único de versiones de vista previa y de APIs estables/disponibles en general (GA). Actualmente, los lanzamientos de vista previa tienden a seguir un ritmo mensual.
Importante
Ahora existe una nueva API de inferencia de vista previa. Descubre más en nuestra guía del ciclo de vida de la API.
| API | Última versión previa | Último lanzamiento de GA | Specifications | Descripción |
|---|---|---|---|---|
| Plano de control | 2025-07-01-preview |
2025-06-01 |
Archivos de especificaciones técnicas | La API del plano de control se utiliza para operaciones como la creación de recursos, el despliegue de modelos y otras tareas de gestión de recursos de mayor nivel. El plano de control también regula lo que es posible hacer con capacidades como Azure Resource Manager, Bicep, Terraform y CLI de Azure. |
| Plano de datos | v1 preview |
v1 |
Archivos de especificaciones técnicas | La API del plano de datos controla las operaciones de inferencia y autoría. |
Authentication
Azure OpenAI ofrece dos métodos de autenticación. Puedes usar API Keys o Microsoft Entra ID.
Autenticación de clave API: Para este tipo de autenticación, todas las solicitudes API deben incluir la clave API en la
api-keycabecera HTTP. El Quickstart ofrece orientación sobre cómo realizar llamadas con este tipo de autenticación.Microsoft Entra ID: Puedes autenticar una llamada API usando un token Microsoft Entra. Los tokens de autenticación se incluyen en una solicitud como Authorizationcabecera. El token proporcionado debe ir precedido porBearer, por ejemploBearer YOUR_AUTH_TOKEN. Puedes leer nuestra guía práctica sobre autenticación con Microsoft Entra ID.
Versionado de la API REST
Las APIs de servicio se versionan usando el api-version parámetro de consulta. Todas las versiones siguen la estructura de fechas YYYY-MM-DD. Por ejemplo:
POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/chat/completions?api-version=2024-06-01
Inferencia en planos de datos
En el resto de este artículo se tratan las operaciones de imagen y audio en la 2025-04-01-preview versión preliminar de la especificación de inferencia del plano de datos openAI de Azure.
Para las operaciones de imagen y audio de disponibilidad general, consulte la referencia de la API REST de imagen y audio de disponibilidad general.
Transcripciones - Create
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview
Transcribe el audio al idioma de entrada.
Parámetros de URI
| Nombre | En | Obligatorio | Tipo | Descripción |
|---|---|---|---|---|
| endpoint | ruta | Sí | cadena de URL | Compatibles Azure endpoints OpenAI (protocolo y nombre de host, por ejemplo: https://aoairesource.openai.azure.com). Sustituye "aoairesource" por el nombre de tu recurso de Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| ID de despliegue | ruta | Sí | string | |
| versión de la API | consulta | Sí | string |
Encabezado de solicitud
Utiliza autenticación basada en tokens o clave API. Se recomienda autenticar con autenticación basada en tokens y es más seguro.
| Nombre | Obligatorio | Tipo | Descripción |
|---|---|---|---|
| Autorización | Cierto | string |
Ejemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}Para generar un token de autenticación usando CLI de Azure: az account get-access-token --resource https://cognitiveservices.azure.comTipo: oauth2 URL de autorización: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeAlcance: https://ai.azure.com/.default |
| clave de API | Cierto | string | Proporciona aquí la clave API de Azure OpenAI |
Cuerpo de la solicitud
Tipo de contenido: varias partes/datos de formulario
| Nombre | Tipo | Descripción | Obligatorio | Predeterminado |
|---|---|---|---|---|
| model | string | ID del modelo a usar. Las opciones son gpt-4o-transcribe, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15, whisper-1, y gpt-4o-transcribe-diarize. |
Sí | |
| archivo | string | El objeto de archivo de audio para transcribir. | Sí | |
| language | string | El idioma del audio de entrada. Suministrar el lenguaje de entrada en formato ISO-639-1 mejora la precisión y la latencia. | No | |
| prompt | string | Un texto opcional para guiar el estilo del modelo o continuar un segmento de audio anterior. El prompt debería coincidir con el lenguaje del audio. | No | |
| formato_de_respuesta | audioResponseFormat | Define el formato de la salida. | No | |
| temperatura | número | La temperatura de muestreo, entre 0 y 1. Valores más altos como 0,8 harán que la salida sea más aleatoria, mientras que valores más bajos como 0,2 la harán más enfocada y determinista. Si se establece en 0, el modelo utiliza la probabilidad logarítmica para aumentar automáticamente la temperatura hasta alcanzar ciertos umbrales. | No | 0 |
| timestamp_granularities[] | array | Las granularidades de la marca temporal para esta transcripción.
response_format debe configurarse verbose_json para usar granularidades de marca de tiempo. Se soportan una o ambas opciones: word, o segment. Nota: No hay latencia adicional para las marcas de tiempo de segmentos, pero generar marcas de tiempo de palabra implica latencia adicional. |
No | ['segment'] |
Responses
Código de estado: 200
Descripción: Aceptar
| Tipo de contenido | Tipo | Descripción |
|---|---|---|
| application/json | object | |
| text/plain | string | Texto transcrito en el formato de salida (cuando response_format era uno de text, vtt o srt). |
Examples
Example
Obtiene texto transcrito y metadatos asociados de los datos de audio hablado proporcionados.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview
Respuestas: Código de estado: 200
{
"body": {
"text": "A structured object when requesting json or verbose_json"
}
}
Example
Obtiene texto transcrito y metadatos asociados de los datos de audio hablado proporcionados.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
Respuestas: Código de estado: 200
{
"type": "string",
"example": "plain text when requesting text, srt, or vtt"
}
Traducciones - Create
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview
Transcribe y traduce el audio de entrada a texto en inglés.
Parámetros de URI
| Nombre | En | Obligatorio | Tipo | Descripción |
|---|---|---|---|---|
| endpoint | ruta | Sí | cadena de URL | Compatibles Azure endpoints OpenAI (protocolo y nombre de host, por ejemplo: https://aoairesource.openai.azure.com). Sustituye "aoairesource" por el nombre de tu recurso de Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| ID de despliegue | ruta | Sí | string | |
| versión de la API | consulta | Sí | string |
Encabezado de solicitud
Utiliza autenticación basada en tokens o clave API. Se recomienda autenticar con autenticación basada en tokens y es más seguro.
| Nombre | Obligatorio | Tipo | Descripción |
|---|---|---|---|
| Autorización | Cierto | string |
Ejemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}Para generar un token de autenticación usando CLI de Azure: az account get-access-token --resource https://cognitiveservices.azure.comTipo: oauth2 URL de autorización: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeAlcance: https://ai.azure.com/.default |
| clave de API | Cierto | string | Proporciona aquí la clave API de Azure OpenAI |
Cuerpo de la solicitud
Tipo de contenido: varias partes/datos de formulario
| Nombre | Tipo | Descripción | Obligatorio | Predeterminado |
|---|---|---|---|---|
| archivo | string | El archivo de audio para traducir. | Sí | |
| prompt | string | Un texto opcional para guiar el estilo del modelo o continuar un segmento de audio anterior. El prompt debería estar en inglés. | No | |
| formato_de_respuesta | audioResponseFormat | Define el formato de la salida. | No | |
| temperatura | número | La temperatura de muestreo, entre 0 y 1. Valores más altos como 0,8 harán que la salida sea más aleatoria, mientras que valores más bajos como 0,2 la harán más enfocada y determinista. Si se establece en 0, el modelo utiliza la probabilidad logarítmica para aumentar automáticamente la temperatura hasta alcanzar ciertos umbrales. | No | 0 |
Responses
Código de estado: 200
Descripción: Aceptar
| Tipo de contenido | Tipo | Descripción |
|---|---|---|
| application/json | object | |
| text/plain | string | Texto transcrito en el formato de salida (cuando response_format era de texto, vtt o srt). |
Examples
Example
Obtiene texto transcrito en inglés y metadatos asociados a partir de los datos de audio hablado proporcionados.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
Respuestas: Código de estado: 200
{
"body": {
"text": "A structured object when requesting json or verbose_json"
}
}
Example
Obtiene texto transcrito en inglés y metadatos asociados a partir de los datos de audio hablado proporcionados.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
Respuestas: Código de estado: 200
{
"type": "string",
"example": "plain text when requesting text, srt, or vtt"
}
Discurso - Crear
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview
Genera audio a partir del texto de entrada.
Parámetros de URI
| Nombre | En | Obligatorio | Tipo | Descripción |
|---|---|---|---|---|
| endpoint | ruta | Sí | cadena de URL | Compatibles Azure endpoints OpenAI (protocolo y nombre de host, por ejemplo: https://aoairesource.openai.azure.com). Sustituye "aoairesource" por el nombre de tu recurso de Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| ID de despliegue | ruta | Sí | string | |
| versión de la API | consulta | Sí | string |
Encabezado de solicitud
Utiliza autenticación basada en tokens o clave API. Se recomienda autenticar con autenticación basada en tokens y es más seguro.
| Nombre | Obligatorio | Tipo | Descripción |
|---|---|---|---|
| Autorización | Cierto | string |
Ejemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}Para generar un token de autenticación usando CLI de Azure: az account get-access-token --resource https://cognitiveservices.azure.comTipo: oauth2 URL de autorización: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeAlcance: https://ai.azure.com/.default |
| clave de API | Cierto | string | Proporciona aquí la clave API de Azure OpenAI |
Cuerpo de la solicitud
Tipo de contenido: varias partes/datos de formulario
| Nombre | Tipo | Descripción | Obligatorio | Predeterminado |
|---|---|---|---|---|
| input | string | El texto para sintetizar audio. La longitud máxima es de 4.096 caracteres. | Sí | |
| formato_de_respuesta | enum | El formato para sintetizar el audio. Valores posibles: mp3, opus, aac, flac, wav, pcm |
No | |
| velocidad | número | La velocidad del audio sintetizado. Seleccione un valor de 0.25 hasta 4.0.
1.0 es el valor predeterminado. |
No | 1.0 |
| voz | enum | La voz para usar en la síntesis de voz. Valores posibles: alloy, echo, fable, onyx, nova, shimmer |
Sí |
Responses
Código de estado: 200
Descripción: Aceptar
| Tipo de contenido | Tipo | Descripción |
|---|---|---|
| application/octet-stream | string |
Examples
Example
Sintetiza audio a partir del texto proporcionado.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview
{
"input": "Hi! What are you going to make?",
"voice": "fable",
"response_format": "mp3"
}
Respuestas: Código de estado: 200
{
"body": "101010101"
}
Generaciones de imágenes - Crear
POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview
Genera un lote de imágenes a partir de un pie de foto en un despliegue dado de un modelo de generación de imágenes
Parámetros de URI
| Nombre | En | Obligatorio | Tipo | Descripción |
|---|---|---|---|---|
| endpoint | ruta | Sí | cadena de URL | Compatibles Azure endpoints OpenAI (protocolo y nombre de host, por ejemplo: https://aoairesource.openai.azure.com). Sustituye "aoairesource" por el nombre de tu recurso de Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| ID de despliegue | ruta | Sí | string | |
| versión de la API | consulta | Sí | string |
Encabezado de solicitud
Utiliza autenticación basada en tokens o clave API. Se recomienda autenticar con autenticación basada en tokens y es más seguro.
| Nombre | Obligatorio | Tipo | Descripción |
|---|---|---|---|
| Autorización | Cierto | string |
Ejemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}Para generar un token de autenticación usando CLI de Azure: az account get-access-token --resource https://cognitiveservices.azure.comTipo: oauth2 URL de autorización: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeAlcance: https://ai.azure.com/.default |
| clave de API | Cierto | string | Proporciona aquí la clave API de Azure OpenAI |
Cuerpo de la solicitud
Tipo-Contenido: application/json
| Nombre | Tipo | Descripción | Obligatorio | Predeterminado |
|---|---|---|---|---|
| fondo | imageBackground | Permite establecer transparencia para el fondo de las imágenes generadas. Este parámetro solo es compatible con modelos en serie gpt-image-1. | No | auto |
| n | entero | El número de imágenes que hay que generar. Para dall-e-3, solo se soporta n=1. | No | 1 |
| compresión_de_salida | entero | El nivel de compresión (0-100%) para las imágenes generadas. Este parámetro solo es compatible con modelos de la serie gpt-image-1 con el formato de salida jpeg. | No | 100 |
| formato_de_salida | imagesOutputFormat | El formato de archivo en el que se devuelven las imágenes generadas. Solo soportado para modelos de la serie GPT-image-1. | No | png |
| prompt | string | Una descripción en texto de la(s) imagen(es) deseada(s). La longitud máxima es de 32.000 caracteres para la serie gpt-image-1 y 4.000 caracteres para dall-e-3 | Sí | |
| imágenes_parciales | entero | El número de imágenes parciales que hay que generar. Este parámetro se utiliza para respuestas en streaming que devuelven imágenes parciales. El valor debe estar entre 0 y 3. Cuando se configura en 0, la respuesta será una sola imagen enviada en un evento de streaming. Ten en cuenta que la imagen final puede enviarse antes de que se generen el número completo de imágenes parciales si la imagen completa se genera más rápido. | 0 | |
| stream | boolean | Edita la imagen en modo streaming. | no | false |
| calidad | imageQuality | La calidad de la imagen que se generará. | No | auto |
| formato_de_respuesta | imagesResponseFormat | El formato en el que se devuelven las imágenes generadas. Este parámetro no está soportado para gpt-image-1modelos en serie -, que siempre devolverán imágenes codificadas en base64.Valores posibles: url, b64_json. |
No | url |
| size | imageSize | El tamaño de las imágenes generadas. | No | auto |
| estilo | imageStyle | El estilo de las imágenes generadas. Solo es compatible con DALL-E-3. | No | vívido |
| user | string | Un identificador único que representa a tu usuario final, que puede ayudar a monitorizar y detectar abusos. | No |
Responses
Código de estado: 200
Descripción: Ok
| Tipo de contenido | Tipo | Descripción |
|---|---|---|
| application/json | generateImagesResponse |
Código de estado: por defecto
Descripción: Ha ocurrido un error.
| Tipo de contenido | Tipo | Descripción |
|---|---|---|
| application/json | dalleErrorResponse |
Examples
Example
Crea imágenes con un prompt.
POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview
{
"prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
"n": 1,
"style": "natural",
"quality": "standard"
}
Respuestas: Código de estado: 200
{
"body": {
"created": 1698342300,
"data": [
{
"revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
"prompt_filter_results": {
"sexual": {
"severity": "safe",
"filtered": false
},
"violence": {
"severity": "safe",
"filtered": false
},
"hate": {
"severity": "safe",
"filtered": false
},
"self_harm": {
"severity": "safe",
"filtered": false
},
"profanity": {
"detected": false,
"filtered": false
},
"custom_blocklists": {
"filtered": false,
"details": []
}
},
"url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
"content_filter_results": {
"sexual": {
"severity": "safe",
"filtered": false
},
"violence": {
"severity": "safe",
"filtered": false
},
"hate": {
"severity": "safe",
"filtered": false
},
"self_harm": {
"severity": "safe",
"filtered": false
}
}
}
]
}
}
Generaciones de imágenes - Editar
POST https://{endpoint}/openai/deployments/{deployment-id}/images/edits?api-version=2025-04-01-preview
Edita una imagen de un pie de foto en un despliegue dado de un modelo gpt-image-1
Parámetros de URI
| Nombre | En | Obligatorio | Tipo | Descripción |
|---|---|---|---|---|
| endpoint | ruta | Sí | cadena de URL | Compatibles Azure endpoints OpenAI (protocolo y nombre de host, por ejemplo: https://aoairesource.openai.azure.com). Sustituye "aoairesource" por el nombre de tu recurso de Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| ID de despliegue | ruta | Sí | string | |
| versión de la API | consulta | Sí | string |
Encabezado de solicitud
Utiliza autenticación basada en tokens o clave API. Se recomienda autenticar con autenticación basada en tokens y es más seguro.
| Nombre | Obligatorio | Tipo | Descripción |
|---|---|---|---|
| Autorización | Cierto | string |
Ejemplo:Authorization: Bearer {Azure_OpenAI_Auth_Token}Para generar un token de autenticación usando CLI de Azure: az account get-access-token --resource https://cognitiveservices.azure.comTipo: oauth2 URL de autorización: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeAlcance: https://ai.azure.com/.default |
| clave de API | Cierto | string | Proporciona aquí la clave API de Azure OpenAI |
Cuerpo de la solicitud
Tipo de contenido: varias partes/datos de formulario
| Nombre | Tipo | Descripción | Obligatorio | Predeterminado |
|---|---|---|---|---|
| imagen | Cadena o matriz | La(s) imagen(es) a editar. Debe ser un archivo de imagen compatible o un array de imágenes. Cada imagen debe ser un archivo png o jpg de menos de 50MB. | Sí | |
| input_fidelity | string | Controla cuánto esfuerzo ejercerá el modelo para que coincida con el estilo y las características, especialmente los rasgos faciales, de las imágenes de entrada. Este parámetro solo es compatible con modelos en serie gpt-image-1. Apoyos high y low. |
no |
low. |
| máscara | string | Una imagen adicional cuyas áreas totalmente transparentes (por ejemplo, donde alfa es cero) indica dónde debe editarse la imagen. Si se proporcionan varias imágenes, la máscara se aplicará a la primera imagen. Debe ser un archivo PNG válido, menos de 4MB y tener las mismas dimensiones que la imagen. | No | |
| n | entero | El número de imágenes que hay que generar. Debe de estar entre 1 y 10. | No | 1 |
| prompt | string | Una descripción en texto de la(s) imagen(es) deseada(s). La longitud máxima es de 32.000 caracteres. | Sí | |
| calidad | imageQuality | La calidad de la imagen que se generará. | No | auto |
| imágenes_parciales | El número de imágenes parciales que hay que generar. Este parámetro se utiliza para respuestas en streaming que devuelven imágenes parciales. El valor debe estar entre 0 y 3. Cuando se configura en 0, la respuesta será una sola imagen enviada en un evento de streaming. Ten en cuenta que la imagen final puede enviarse antes de que se generen el número completo de imágenes parciales si la imagen completa se genera más rápido. | |||
| stream | boolean | Edita la imagen en modo streaming. | no | false |
| formato_de_respuesta | imagesResponseFormat | El formato en el que se devuelven las imágenes generadas. | No | url |
| size | imageSize | El tamaño de las imágenes generadas. | No | auto |
| user | string | Un identificador único que representa a tu usuario final, que puede ayudar a monitorizar y detectar abusos. | No |
Responses
Código de estado: 200
Descripción: Ok
| Tipo de contenido | Tipo | Descripción |
|---|---|---|
| application/json | generateImagesResponse |
Código de estado: por defecto
Descripción: Ha ocurrido un error.
| Tipo de contenido | Tipo | Descripción |
|---|---|---|
| application/json | dalleErrorResponse |
Componentes
Para conocer las definiciones de esquema usadas por chat, finalizaciones, incrustaciones, respuestas y otras operaciones de texto, consulte la referencia de la API rest de OpenAI de Azure. Los siguientes esquemas admiten las operaciones de imagen y audio en esta página.
innerErrorCode
Códigos de error para el objeto de error interno.
| Propiedad | Value |
|---|---|
| Descripción | Códigos de error para el objeto de error interno. |
| Tipo | string |
| Valores | ResponsibleAIPolicyViolation |
dalleErrorResponse
| Nombre | Tipo | Descripción | Obligatorio | Predeterminado |
|---|---|---|---|---|
| error | dalleError | No |
dalleError
| Nombre | Tipo | Descripción | Obligatorio | Predeterminado |
|---|---|---|---|---|
| inner_error | dalleInnerError | Error interno con detalles adicionales. | No | |
| param | string | No | ||
| type | string | No |
dalleInnerError
Error interno con detalles adicionales.
| Nombre | Tipo | Descripción | Obligatorio | Predeterminado |
|---|---|---|---|---|
| código | innerErrorCode | Códigos de error para el objeto de error interno. | No | |
| content_filter_results | dalleFilterResults | Información sobre la categoría de filtrado de contenido (odio, sexual, violencia, self_harm), si ha sido detectada, así como el nivel de gravedad (escala very_low, baja, media, alta que determina la intensidad y el nivel de riesgo del contenido dañino) y si ha sido filtrado o no. Información sobre contenido de jailbreak y palabrotas, si se ha detectado y si ha sido filtrado o no. Y información sobre la lista de bloqueos de clientes, si ha sido filtrada y su identificación. | No | |
| mensaje_revisado | string | El prompt que se usó para generar la imagen, si hubo alguna revisión del prompt. | No |
contentFilterSeverityResult
| Nombre | Tipo | Descripción | Obligatorio | Predeterminado |
|---|---|---|---|---|
| filtered | boolean | Sí | ||
| severity | string | No |
contentFilterDetectedResult
| Nombre | Tipo | Descripción | Obligatorio | Predeterminado |
|---|---|---|---|---|
| detectado | boolean | No | ||
| filtered | boolean | Sí |
contentFilterDetailedResults
Resultados de filtrado de contenido con un detalle de los identificadores de filtro de contenido para los segmentos filtrados.
| Nombre | Tipo | Descripción | Obligatorio | Predeterminado |
|---|---|---|---|---|
| detalles | array | No | ||
| filtered | boolean | Sí |
dalleFilterResults
Información sobre la categoría de filtrado de contenido (odio, sexual, violencia, self_harm), si ha sido detectada, así como el nivel de gravedad (escala very_low, baja, media, alta que determina la intensidad y el nivel de riesgo del contenido dañino) y si ha sido filtrado o no. Información sobre contenido de jailbreak y palabrotas, si se ha detectado y si ha sido filtrado o no. Y información sobre la lista de bloqueos de clientes, si ha sido filtrada y su identificación.
| Nombre | Tipo | Descripción | Obligatorio | Predeterminado |
|---|---|---|---|---|
| custom_blocklists | contentFilterDetailedResults | Resultados de filtrado de contenido con un detalle de los identificadores de filtro de contenido para los segmentos filtrados. | No | |
| odio | contentFilterSeverityResult | No | ||
| jailbreak | resultadoDetectadoPorElFiltroDeContenido | No | ||
| soece | resultadoDetectadoPorElFiltroDeContenido | No | ||
| self_harm | contentFilterSeverityResult | No | ||
| sexual | contentFilterSeverityResult | No | ||
| violencia | contentFilterSeverityResult | No |
audioResponseFormat
Define el formato de la salida.
| Propiedad | Value |
|---|---|
| Descripción | Define el formato de la salida. |
| Tipo | string |
| Valores | jsontextsrtverbose_jsonvtt |
imageQuality
La calidad de la imagen que se generará.
| Propiedad | Value |
|---|---|
| Descripción | La calidad de la imagen que se generará. |
| Tipo | string |
| Predeterminado | auto |
| Valores | autohighmediumlowhdstandard |
imagesResponseFormat
El formato en el que se devuelven las imágenes generadas.
| Propiedad | Value |
|---|---|
| Descripción | El formato en el que se devuelven las imágenes generadas. |
| Tipo | string |
| Predeterminado | url |
| Valores | urlb64_json |
imagesOutputFormat
El formato de archivo en el que se devuelven las imágenes generadas. Solo soportado para modelos de serie.
| Propiedad | Value |
|---|---|
| Descripción | El formato de archivo en el que se devuelven las imágenes generadas. Solo soportado para modelos de la serie GPT-image-1. |
| Tipo | string |
| Predeterminado | png |
| Valores | pngjpeg |
imageSize
El tamaño de las imágenes generadas.
| Propiedad | Value |
|---|---|
| Descripción | El tamaño de las imágenes generadas. |
| Tipo | string |
| Predeterminado | auto |
| Valores | auto1792x10241024x17921024x10241024x15361536x1024 |
imageStyle
El estilo de las imágenes generadas. Solo es compatible con DALL-E-3.
| Propiedad | Value |
|---|---|
| Descripción | El estilo de las imágenes generadas. Solo es compatible con DALL-E-3. |
| Tipo | string |
| Predeterminado | vívido |
| Valores | vividnatural |
imageBackground
Permite establecer transparencia para el fondo de la(s) imagen(es) generada(s). Este parámetro solo es compatible con modelos en serie gpt-image-1.
| Propiedad | Value |
|---|---|
| Descripción | Permite establecer transparencia para el fondo de la(s) imagen(es) generada(s). Este parámetro solo es compatible con modelos en serie gpt-image-1. |
| Tipo | string |
| Predeterminado | auto |
| Valores | transparentopaqueauto |
generateImagesResponse
| Nombre | Tipo | Descripción | Obligatorio | Predeterminado |
|---|---|---|---|---|
| creado | entero | La marca de tiempo de Unix cuando se creó la operación. | Sí | |
| datos | array | Los datos de resultados de la operación, si tienen éxito | Sí | |
| uso | imageGenerationsUsage | Representa detalles de uso de tokens para solicitudes de generación de imágenes. Solo para modelos de la serie GPT-image-1. | No |
imageGenerationsUsage
Representa detalles de uso de tokens para solicitudes de generación de imágenes. Solo para modelos de la serie GPT-image-1.
| Nombre | Tipo | Descripción | Obligatorio | Predeterminado |
|---|---|---|---|---|
| input_tokens | entero | El número de tokens de entrada. | No | |
| input_tokens_details | object | Un desglose detallado de los tokens de entrada. | No | |
| └" image_tokens | entero | El número de tokens de imagen. | No | |
| └" text_tokens | entero | El número de fichas de texto. | No | |
| output_tokens | entero | El número de tokens de salida. | No | |
| total_tokens | entero | El número total de fichas utilizadas. | No |
Pasos siguientes
Obtenga información sobre los modelos y la optimización con la API REST. Obtenga más información sobre los modelos underlying que potencian Azure OpenAI.