OpenAI 이미지, 오디오 및 비디오 REST API 참조 Azure(v1 미리 보기)

이 문서에서는 v1 미리 보기 릴리스에서 Azure OpenAI에 대한 이미지, 오디오(음성) 및 비디오 생성 데이터 평면 유추 REST API 작업을 설명합니다. 채팅 완료, 포함, 회피, 파일, 미세 조정, 응답, 벡터 저장소 및 기타 모든 작업은 공식 Azure OpenAI REST API 참조를 참조하세요.

데이터 평면 유추

이 문서의 나머지 부분에는 Azure OpenAI 데이터 평면 유추 사양의 새 v1 미리 보기 API 릴리스의 이미지, 오디오 및 비디오 작업이 설명되어 있습니다. 자세한 내용은 API 수명 주기 가이드를 참조하세요.

전체 v1 GA 데이터 평면 API는 공식 Azure OpenAI REST API 참조를 참조하세요.

음성 만들기

POST {endpoint}/openai/v1/audio/speech?api-version=preview

입력 텍스트에서 텍스트 음성 변환 오디오를 생성합니다.

URI 매개 변수

Name	In	필수	Type	Description
endpoint	경로	예	string Url	지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름( 예: `https://aoairesource.openai.azure.com`) "aoairesource"를 Azure OpenAI 리소스 이름)으로 대체합니다. https://{your-resource-name}.openai.azure.com
API 버전	query	No		이 요청에 사용할 명시적 Microsoft Foundry 모델 API 버전입니다. `v1` 그렇지 않으면 지정되지 않은 경우

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

Name	필수	Type	Description
Authorization	True	string	예:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Azure CLI 사용하여 인증 토큰을 생성하려면 `az account get-access-token --resource https://cognitiveservices.azure.com` 형식: oauth2 권한 부여 URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` 범위: `https://ai.azure.com/.default`
API 키	True	string	여기에서 Azure OpenAI API 키 제공

요청 본문

콘텐츠 형식: multipart/form-data

Name	Type	Description	필수	기본값
input	string	오디오를 생성할 텍스트입니다. 최대 길이는 4096자입니다.	예
instructions	string	추가 지침으로 생성된 오디오의 음성을 제어합니다. 또는 .와 함께 `tts-1tts-1-hd`작동하지 않습니다.	No
model	string	이 텍스트 음성 변환 요청에 사용할 모델입니다.	예
응답_형식	object	텍스트 음성 변환에 지원되는 오디오 출력 형식입니다.	No
speed	number	생성된 오디오의 음성 속도입니다. 값은 0.25에서 4.0까지의 범위에서 유효하며, 기본값은 1.0이고 더 빠른 음성에 해당하는 값은 더 높습니다.	No	1
스트림_포맷	enum	오디오를 스트리밍할 형식입니다. 지원되는 형식은 다음과 같습니다 `sseaudio`. `sse`가 지원되지 않는 경우 또는 `tts-1`.에 대해 `tts-1-hd` 지원되지 않습니다. 가능한 값: `sseaudio`	No
voice	object		예

응답

상태 코드: 200

설명: 요청이 성공했습니다.

콘텐츠-타입	Type	설명
application/octet-stream	string

상태 코드: 기본값

설명: 예기치 않은 오류 응답입니다.

콘텐츠-타입	Type	설명
application/json	AzureErrorResponse

예제

Example

제공된 텍스트에서 오디오를 합성합니다.

POST {endpoint}/openai/v1/audio/speech?api-version=preview

{
 "input": "Hi! What are you going to make?",
 "voice": "fable",
 "response_format": "mp3",
 "model": "tts-1"
}

응답: 상태 코드: 200

{
  "body": "101010101"
}

전사 만들기

POST {endpoint}/openai/v1/audio/transcriptions?api-version=preview

오디오를 입력 언어로 전사합니다.

URI 매개 변수

Name	In	필수	Type	Description
endpoint	경로	예	string Url	지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름( 예: `https://aoairesource.openai.azure.com`) "aoairesource"를 Azure OpenAI 리소스 이름)으로 대체합니다. https://{your-resource-name}.openai.azure.com
API 버전	query	No		이 요청에 사용할 명시적 Foundry Models API 버전입니다. `v1` 그렇지 않으면 지정되지 않은 경우

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

Name	필수	Type	Description
Authorization	True	string	예:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Azure CLI 사용하여 인증 토큰을 생성하려면 `az account get-access-token --resource https://cognitiveservices.azure.com` 형식: oauth2 권한 부여 URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` 범위: `https://ai.azure.com/.default`
API 키	True	string	여기에서 Azure OpenAI API 키 제공

요청 본문

콘텐츠 형식: multipart/form-data

Name	Type	Description	필수	기본값
chunking_strategy	object		No
└prefix_padding_ms	정수 (integer)	VAD가 음성을 감지하기 전에 포함할 오디오 양(밀리초)입니다.	No	300
└침묵 지속 시간(ms) silence_duration_ms	정수 (integer)	음성 중지를 감지하는 무음 기간(밀리초)입니다. 값이 짧을수록 모델은 더 빠르게 응답하지만 사용자로부터 짧은 일시 중지로 이동할 수 있습니다.	No	200
└) 임계값	number	음성 활동 감지의 민감도 임계값(0.0~1.0)입니다. 임계값이 높을수록 모델을 활성화하기 위해 더 큰 오디오가 필요하므로 시끄러운 환경에서 더 나은 성능을 발휘할 수 있습니다.	No	0.5
└─ 형식	enum	서버 쪽 VAD를 `server_vad` 사용하여 수동 청크를 사용하도록 설정해야 합니다. 가능한 값: `server_vad`	No
파일	string		예
filename	string	오디오 데이터와 연결할 선택적 파일 이름 또는 설명 식별자입니다.	No
include[]	배열	전사 응답에 포함할 추가 정보입니다. `logprobs` 는 응답에서 토큰의 로그 확률을 반환하여 전사에 대한 모델의 신뢰도를 이해합니다. `logprobs`는 response_format 설정 `json` 되고 모델`gpt-4o-transcribe`, `gpt-4o-transcribe-diarizegpt-4o-mini-transcribe`및 `gpt-4o-mini-transcribe-2025-12-15`.에서만 작동합니다.	No
language	string	입력 오디오의 언어입니다. ISO-639-1(예: `en`형식)로 입력 언어를 제공하면 정확도와 대기 시간이 향상됩니다.	No
model	string	이 전사 요청에 사용할 모델입니다.	No
프롬프트	string	모델의 스타일을 안내하거나 이전 오디오 세그먼트를 계속하기 위한 선택적 텍스트입니다. 프롬프트가 오디오 언어와 일치해야 합니다.	No
응답_형식	object		No
stream	boolean	true로 설정하면 모델 응답 데이터가 서버에서 보낸 이벤트를 사용하여 생성될 때 클라이언트로 스트리밍됩니다. 참고: 스트리밍은 모델에 대해 `whisper-1` 지원되지 않으며 무시됩니다.	No	거짓
온도	number	샘플링 온도(0에서 1 사이)입니다. 0.8과 같은 값이 높을수록 출력이 더 임의로 생성되고, 0.2와 같은 값이 낮으면 더 집중적이고 결정적입니다. 0으로 설정하면 모델은 로그 확률 을 사용하여 특정 임계값에 도달할 때까지 온도를 자동으로 높입니다.	No	0
timestamp_granularities[]	배열	이 전사에 대해 채울 타임스탬프 세분성입니다. `response_format` 는 타임스탬프 세분성을 사용하도록 설정 `verbose_json` 해야 합니다. 이러한 옵션 중 하나 또는 둘 다 지원`wordsegment`됩니다. 참고: 세그먼트 타임스탬프에 대한 추가 대기 시간은 없지만 단어 타임스탬프를 생성하면 추가 대기 시간이 발생합니다.	No	['segment']

응답

상태 코드: 200

설명: 요청이 성공했습니다.

콘텐츠-타입	Type	설명
application/json	AzureAudioTranscriptionResponse
text/plain	string

상태 코드: 기본값

설명: 예기치 않은 오류 응답입니다.

콘텐츠-타입	Type	설명
application/json	AzureErrorResponse

예제

Example

제공된 음성 오디오 데이터에서 전사된 텍스트 및 관련 메타데이터를 가져옵니다.

POST {endpoint}/openai/v1/audio/transcriptions?api-version=preview

{
 "file": "<binary audio data>",
 "model": "whisper-1",
 "response_format": "text"
}

응답: 상태 코드: 200

{
  "body": "plain text when requesting text, srt, or vtt"
}

번역 만들기

POST {endpoint}/openai/v1/audio/translations?api-version=preview

제공된 음성 오디오 데이터에서 영어 전사 텍스트 및 관련 메타데이터를 가져옵니다.

URI 매개 변수

Name	In	필수	Type	Description
endpoint	경로	예	string Url	지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름( 예: `https://aoairesource.openai.azure.com`) "aoairesource"를 Azure OpenAI 리소스 이름)으로 대체합니다. https://{your-resource-name}.openai.azure.com
API 버전	query	No		이 요청에 사용할 명시적 Foundry Models API 버전입니다. `v1` 그렇지 않으면 지정되지 않은 경우

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

Name	필수	Type	Description
Authorization	True	string	예:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Azure CLI 사용하여 인증 토큰을 생성하려면 `az account get-access-token --resource https://cognitiveservices.azure.com` 형식: oauth2 권한 부여 URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` 범위: `https://ai.azure.com/.default`
API 키	True	string	여기에서 Azure OpenAI API 키 제공

요청 본문

콘텐츠 형식: multipart/form-data

Name	Type	Description	필수	기본값
파일	string		예
filename	string	오디오 데이터와 연결할 선택적 파일 이름 또는 설명 식별자입니다.	No
model	string	이 번역 요청에 사용할 모델입니다.	No
프롬프트	string	모델의 스타일을 안내하거나 이전 오디오 세그먼트를 계속하기 위한 선택적 텍스트입니다. 프롬프트는 영어로 되어 있어야 합니다.	No
응답_형식	object		No
온도	number	샘플링 온도(0에서 1 사이)입니다. 0.8과 같은 값이 높을수록 출력이 더 임의로 생성되고, 0.2와 같은 값이 낮으면 더 집중적이고 결정적입니다. 0으로 설정하면 모델은 로그 확률 을 사용하여 특정 임계값에 도달할 때까지 온도를 자동으로 높입니다.	No	0

응답

상태 코드: 200

설명: 요청이 성공했습니다.

콘텐츠-타입	Type	설명
application/json	AzureAudioTranslationResponse
text/plain	string

상태 코드: 기본값

설명: 예기치 않은 오류 응답입니다.

콘텐츠-타입	Type	설명
application/json	AzureErrorResponse

예제

Example

제공된 음성 오디오 데이터에서 영어 전사 텍스트 및 관련 메타데이터를 가져옵니다.

POST {endpoint}/openai/v1/audio/translations?api-version=preview

{
 "file": "<binary audio data>",
 "model": "whisper-1",
 "response_format": "text"
}

응답: 상태 코드: 200

{
  "body": "plain text when requesting text, srt, or vtt"
}

이미지 편집 만들기

POST {endpoint}/openai/v1/images/edits?api-version=preview

URI 매개 변수

Name	In	필수	Type	Description
endpoint	경로	예	string Url	지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름( 예: `https://aoairesource.openai.azure.com`) "aoairesource"를 Azure OpenAI 리소스 이름)으로 대체합니다. https://{your-resource-name}.openai.azure.com
API 버전	query	No		이 요청에 사용할 명시적 Foundry Models API 버전입니다. `v1` 그렇지 않으면 지정되지 않은 경우

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

Name	필수	Type	Description
Authorization	True	string	예:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Azure CLI 사용하여 인증 토큰을 생성하려면 `az account get-access-token --resource https://cognitiveservices.azure.com` 형식: oauth2 권한 부여 URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` 범위: `https://ai.azure.com/.default`
API 키	True	string	여기에서 Azure OpenAI API 키 제공

요청 본문

콘텐츠 형식: multipart/form-data

Name	Type	Description	필수	기본값
배경	enum	생성된 이미지의 배경에 대한 투명도를 설정할 수 있습니다. 이 매개 변수는 모델에 대해서만 지원됩니다 `gpt-image-1` . 또는 `transparentopaque` (기본값) 중 `auto`하나여야 합니다. 사용되는 경우 `auto` 모델은 이미지에 가장 적합한 배경을 자동으로 결정합니다. 출력 형식이 투명도를 지원해야 하는 경우 `transparent`투명도를 (기본값) 또는 `png`.로 설정 `webp` 해야 합니다. 가능한 값: `transparent`, `opaqueauto`	No
이미지	문자열 또는 배열		예
마스크	string		No
model	string	이미지 편집 작업에 사용할 모델 배포입니다.	예
n	정수 (integer)	생성할 이미지 수입니다. 1에서 10 사이여야 합니다.	No	1
출력 압축	정수 (integer)	생성된 이미지의 압축 수준(0-100%)입니다. 이 매개 변수는 출력 형식 또는 `gpt-image-1` 출력 형식이 `webp` 있는 -series 모델에 대해서만 지원`jpeg`되며 기본값은 100입니다.	No	100
출력 형식	enum	생성된 이미지가 반환되는 형식입니다. 이 매개 변수는 -series 모델에 대해서만 지원됩니다 `gpt-image-1`. , `png`또는 `jpeg`. 중 `webp`하나여야 합니다. 기본값은 .입니다 `png`. 가능한 값: `png`, `jpegwebp`	No
프롬프트	string	원하는 이미지에 대한 텍스트 설명입니다. 최대 길이는 -series 모델의 경우 `dall-e-2`1000자, 32000자 `gpt-image-1`입니다.	예
질	enum	생성될 이미지의 품질입니다. `high` `medium`- `low` series 모델에 대해서만 지원`gpt-image-1`됩니다. `dall-e-2` 만 품질을 지원합니다 `standard` . 기본값은 .입니다 `auto`. 가능한 값: `standard`, `low`, `medium`, `highauto`	No
응답_형식	enum	생성된 이미지가 반환되는 형식입니다. 중 하나 `url` 여야 합니다.`b64_json` URL은 이미지가 생성된 후 60분 동안만 유효합니다. -series 모델은 항상 base64로 인코딩된 이미지를 반환하므로 이 매개 변수는 지원`dall-e-2gpt-image-1`됩니다. 가능한 값: `urlb64_json`	No
size	enum	생성된 이미지의 크기입니다. -series 모델의 경우 , `1024x1024` (가로), `1536x1024` (세로) 또는 `1024x1536` (기본값) `auto`중 하나`gpt-image-1`여야 하며, 그 중 `256x256`하나이거나 , `512x512`또는 `1024x1024` 에 대한 `dall-e-2`값이어야 합니다. 가능한 값: `256x256`, `512x512`, `1024x10241536x1024`, `1024x1536auto`	No
user	string	최종 사용자를 나타내는 고유 식별자입니다. 이 식별자는 OpenAI가 남용을 모니터링하고 감지하는 데 도움이 될 수 있습니다.	No

응답

상태 코드: 200

설명: 요청이 성공했습니다.

콘텐츠-타입	Type	설명
application/json	AzureImagesResponse

상태 코드: 기본값

설명: 예기치 않은 오류 응답입니다.

콘텐츠-타입	Type	설명
application/json	AzureErrorResponse

이미지 생성

POST {endpoint}/openai/v1/images/generations?api-version=preview

URI 매개 변수

Name	In	필수	Type	Description
endpoint	경로	예	string Url	지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름( 예: `https://aoairesource.openai.azure.com`) "aoairesource"를 Azure OpenAI 리소스 이름)으로 대체합니다. https://{your-resource-name}.openai.azure.com
API 버전	query	No		이 요청에 사용할 명시적 Foundry Models API 버전입니다. `v1` 그렇지 않으면 지정되지 않은 경우

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

Name	필수	Type	Description
Authorization	True	string	예:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Azure CLI 사용하여 인증 토큰을 생성하려면 `az account get-access-token --resource https://cognitiveservices.azure.com` 형식: oauth2 권한 부여 URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` 범위: `https://ai.azure.com/.default`
API 키	True	string	여기에서 Azure OpenAI API 키 제공

요청 본문

Content-Type: application/json

Name	Type	Description	필수	기본값
배경	enum	생성된 이미지의 배경에 대한 투명도를 설정할 수 있습니다. 이 매개 변수는 모델에 대해서만 지원됩니다 `gpt-image-1` . 또는 `transparentopaque` (기본값) 중 `auto`하나여야 합니다. 사용되는 경우 `auto` 모델은 이미지에 가장 적합한 배경을 자동으로 결정합니다. 출력 형식이 투명도를 지원해야 하는 경우 `transparent`투명도를 (기본값) 또는 `png`.로 설정 `webp` 해야 합니다. 가능한 값: `transparent`, `opaqueauto`	No
model	string	이미지 생성에 사용할 모델 배포입니다.	예
검토	enum	-series 모델에서 생성된 `gpt-image-1`이미지의 콘텐츠 조정 수준을 제어합니다. 덜 제한적인 필터링 또는 `low` (기본값) 중 하나 `auto` 여야 합니다. 가능한 값: `lowauto`	No
n	정수 (integer)	생성할 이미지 수입니다. 1에서 10 사이여야 합니다. 의 경우 `dall-e-3`만 `n=1` 지원됩니다.	No	1
출력 압축	정수 (integer)	생성된 이미지의 압축 수준(0-100%)입니다. 이 매개 변수는 출력 형식 또는 `gpt-image-1` 출력 형식이 `webp` 있는 -series 모델에 대해서만 지원`jpeg`되며 기본값은 100입니다.	No	100
출력 형식	enum	생성된 이미지가 반환되는 형식입니다. 이 매개 변수는 -series 모델에 대해서만 지원됩니다 `gpt-image-1`. , `png`또는 `jpeg`. 중 `webp`하나여야 합니다. 가능한 값: `png`, `jpegwebp`	No
프롬프트	string	원하는 이미지에 대한 텍스트 설명입니다. 최대 길이는 -series 모델의 경우 `gpt-image-1`32000자, 1000자 `dall-e-2` , 4000자입니다 `dall-e-3`.	예
질	enum	생성될 이미지의 품질입니다. - `auto` (기본값)은 지정된 모델의 최고 품질을 자동으로 선택합니다. - `high` `medium`- `low` series 모델에 대해 `gpt-image-1`지원됩니다. - `hd` 에 `standard` 대해 `dall-e-3`지원됩니다. - `standard` 는 .에 대한 유일한 옵션입니다 `dall-e-2`. 가능한 값: `standard`, `hd`, `lowmedium`, `highauto`	No
응답_형식	enum	생성된 이미지와 함께 `dall-e-2dall-e-3` 반환되는 형식입니다. 중 하나 `url` 여야 합니다.`b64_json` URL은 이미지가 생성된 후 60분 동안만 유효합니다. 이 매개 변수는 항상 base64로 인코딩된 이미지를 반환하는 -series 모델에 대해 지원 `gpt-image-1`되지 않습니다. 가능한 값: `urlb64_json`	No
size	enum	생성된 이미지의 크기입니다. -series 모델의 경우 , `1024x1024` (가로), `1536x1024` (세로) 또는 `1024x1536` (기본값) `auto`중 하나 `gpt-image-1256x256512x5121024x1024dall-e-21024x10241792x10241024x1792dall-e-3`여야 합니다. 가능한 값: `auto`,, `1024x10241536x1024`, `1024x1536256x256`, `512x512`, `1792x10241024x1792`	No
스타일	enum	생성된 이미지의 스타일입니다. 이 매개 변수는 .에 `dall-e-3`대해서만 지원됩니다. 중 하나 `vivid` 여야 합니다.`natural` 생생한 원인은 모델이 하이퍼 리얼 및 극적인 이미지를 생성하는 쪽으로 기울어지게 합니다. 자연은 모델이 더 자연스럽고 덜 실제적인 이미지를 생성하게 합니다. 가능한 값: `vividnatural`	No
user	string	최종 사용자를 나타내는 고유 식별자입니다. 이 식별자는 OpenAI가 남용을 모니터링하고 감지하는 데 도움이 될 수 있습니다.	No

응답

상태 코드: 200

설명: 요청이 성공했습니다.

콘텐츠-타입	Type	설명
application/json	AzureImagesResponse

상태 코드: 기본값

설명: 예기치 않은 오류 응답입니다.

콘텐츠-타입	Type	설명
application/json	AzureErrorResponse

예제

Example

프롬프트가 지정된 이미지를 만듭니다.

POST {endpoint}/openai/v1/images/generations?api-version=preview

{
 "model": "dall-e-3",
 "prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
 "n": 1,
 "style": "natural",
 "quality": "standard"
}

응답: 상태 코드: 200

{
  "body": {
    "created": 1698342300,
    "data": [
      {
        "revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
        "prompt_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          },
          "profanity": {
            "detected": false,
            "filtered": false
          },
          "custom_blocklists": {
            "filtered": false,
            "details": []
          }
        },
        "url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
        "content_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          }
        }
      }
    ]
  }
}

비디오 생성 작업 - 만들기

POST {endpoint}/openai/v1/video/generations/jobs?api-version=preview

새 비디오 생성 작업을 만듭니다.

URI 매개 변수

Name	In	필수	Type	Description
endpoint	경로	예	string Url	지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름( 예: `https://aoairesource.openai.azure.com`) "aoairesource"를 Azure OpenAI 리소스 이름)으로 대체합니다. https://{your-resource-name}.openai.azure.com
API 버전	query	No		이 요청에 사용할 명시적 Foundry Models API 버전입니다. `v1` 그렇지 않으면 지정되지 않은 경우

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

Name	필수	Type	Description
Authorization	True	string	예:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Azure CLI 사용하여 인증 토큰을 생성하려면 `az account get-access-token --resource https://cognitiveservices.azure.com` 형식: oauth2 권한 부여 URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` 범위: `https://ai.azure.com/.default`
API 키	True	string	여기에서 Azure OpenAI API 키 제공

요청 본문

Content-Type: application/json

Name	Type	Description	필수	기본값
높이	정수 (integer)	비디오의 높이입니다. 지원되는 차원은 가로 방향과 세로 방향 모두에서 480x480, 854x480, 720x720, 1280x720, 1080x1080 및 1920x1080입니다.	예
model	string	이 요청에 사용할 배포의 이름입니다.	예
n_seconds	정수 (integer)	비디오 생성 작업의 기간입니다. 1~20초 사이여야 합니다.	No	5
n_variants	정수 (integer)	이 작업의 변형으로 만들 비디오 수입니다. 1에서 5 사이여야 합니다. 크기가 작을수록 더 많은 변형이 허용됩니다.	No	1
프롬프트	string	이 비디오 생성 작업에 대한 프롬프트입니다.	예
width	정수 (integer)	비디오의 너비입니다. 지원되는 차원은 가로 방향과 세로 방향 모두에서 480x480, 854x480, 720x720, 1280x720, 1080x1080 및 1920x1080입니다.	예

요청 본문

콘텐츠 형식: multipart/form-data

Name	Type	Description	필수	기본값
파일	배열		예
높이	정수 (integer)	비디오의 높이입니다. 지원되는 차원은 가로 방향과 세로 방향 모두에서 480x480, 854x480, 720x720, 1280x720, 1080x1080 및 1920x1080입니다.	예
inpaint_items	배열	이 비디오 생성 작업에 대한 선택적 인페인팅 항목입니다.	No
model	string	이 요청에 사용할 배포의 이름입니다.	예
n_seconds	정수 (integer)	비디오 생성 작업의 기간입니다. 1~20초 사이여야 합니다.	No	5
n_variants	정수 (integer)	이 작업의 변형으로 만들 비디오 수입니다. 1에서 5 사이여야 합니다. 크기가 작을수록 더 많은 변형이 허용됩니다.	No	1
프롬프트	string	이 비디오 생성 작업에 대한 프롬프트입니다.	예
width	정수 (integer)	비디오의 너비입니다. 지원되는 차원은 가로 방향과 세로 방향 모두에서 480x480, 854x480, 720x720, 1280x720, 1080x1080 및 1920x1080입니다.	예

응답

상태 코드: 200

설명: 요청이 성공했습니다.

콘텐츠-타입	Type	설명
application/json	VideoGenerationJob

상태 코드: 기본값

설명: 예기치 않은 오류 응답입니다.

콘텐츠-타입	Type	설명
application/json	AzureOpenAIVideoGenerationErrorResponse

예제

예제 파일을 찾을 수 없습니다. ./examples/create_video_generation_job_simple.json

비디오 생성 작업 - 목록

GET {endpoint}/openai/v1/video/generations/jobs?api-version=preview

비디오 생성 작업을 나열합니다.

URI 매개 변수

Name	In	필수	Type	Description
endpoint	경로	예	string Url	지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름( 예: `https://aoairesource.openai.azure.com`) "aoairesource"를 Azure OpenAI 리소스 이름)으로 대체합니다. https://{your-resource-name}.openai.azure.com
API 버전	query	No		이 요청에 사용할 명시적 Foundry Models API 버전입니다. `v1` 그렇지 않으면 지정되지 않은 경우
before	query	No	string
후	query	No	string
limit	query	예	정수 (integer)
statuses	query	No	배열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

Name	필수	Type	Description
Authorization	True	string	예:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Azure CLI 사용하여 인증 토큰을 생성하려면 `az account get-access-token --resource https://cognitiveservices.azure.com` 형식: oauth2 권한 부여 URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` 범위: `https://ai.azure.com/.default`
API 키	True	string	여기에서 Azure OpenAI API 키 제공

응답

상태 코드: 200

설명: 요청이 성공했습니다.

콘텐츠-타입	Type	설명
application/json	VideoGenerationJobList

상태 코드: 기본값

설명: 예기치 않은 오류 응답입니다.

콘텐츠-타입	Type	설명
application/json	AzureOpenAIVideoGenerationErrorResponse

예제

예제 파일을 찾을 수 없습니다. ./examples/get_video_generation_job_list.json

비디오 생성 작업 - 가져오기

GET {endpoint}/openai/v1/video/generations/jobs/{job-id}?api-version=preview

비디오 생성 작업의 속성을 검색합니다.

URI 매개 변수

Name	In	필수	Type	Description
endpoint	경로	예	string Url	지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름( 예: `https://aoairesource.openai.azure.com`) "aoairesource"를 Azure OpenAI 리소스 이름)으로 대체합니다. https://{your-resource-name}.openai.azure.com
API 버전	query	No		이 요청에 사용할 명시적 Foundry Models API 버전입니다. `v1` 그렇지 않으면 지정되지 않은 경우
job-id	경로	예	string	Azure OpenAI 요청에 사용할 비디오 생성 작업의 ID입니다.

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

Name	필수	Type	Description
Authorization	True	string	예:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Azure CLI 사용하여 인증 토큰을 생성하려면 `az account get-access-token --resource https://cognitiveservices.azure.com` 형식: oauth2 권한 부여 URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` 범위: `https://ai.azure.com/.default`
API 키	True	string	여기에서 Azure OpenAI API 키 제공

응답

상태 코드: 200

설명: 요청이 성공했습니다.

콘텐츠-타입	Type	설명
application/json	VideoGenerationJob

상태 코드: 기본값

설명: 예기치 않은 오류 응답입니다.

콘텐츠-타입	Type	설명
application/json	AzureOpenAIVideoGenerationErrorResponse

예제

예제 파일을 찾을 수 없습니다. ./examples/get_video_generation_job.json

비디오 생성 작업 - 삭제

DELETE {endpoint}/openai/v1/video/generations/jobs/{job-id}?api-version=preview

비디오 생성 작업을 삭제합니다.

URI 매개 변수

Name	In	필수	Type	Description
endpoint	경로	예	string Url	지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름( 예: `https://aoairesource.openai.azure.com`) "aoairesource"를 Azure OpenAI 리소스 이름)으로 대체합니다. https://{your-resource-name}.openai.azure.com
API 버전	query	No		이 요청에 사용할 명시적 Foundry Models API 버전입니다. `v1` 그렇지 않으면 지정되지 않은 경우
job-id	경로	예	string	Azure OpenAI 요청에 사용할 비디오 생성 작업의 ID입니다.

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

Name	필수	Type	Description
Authorization	True	string	예:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Azure CLI 사용하여 인증 토큰을 생성하려면 `az account get-access-token --resource https://cognitiveservices.azure.com` 형식: oauth2 권한 부여 URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` 범위: `https://ai.azure.com/.default`
API 키	True	string	여기에서 Azure OpenAI API 키 제공

응답

상태 코드: 204

설명: 이 요청에 대해 보낼 콘텐츠는 없지만 헤더가 유용할 수 있습니다.

상태 코드: 기본값

설명: 예기치 않은 오류 응답입니다.

콘텐츠-타입	Type	설명
application/json	AzureOpenAIVideoGenerationErrorResponse

비디오 세대 - 가져오기

GET {endpoint}/openai/v1/video/generations/{generation-id}?api-version=preview

ID별로 비디오 생성을 검색합니다.

URI 매개 변수

Name	In	필수	Type	Description
endpoint	경로	예	string Url	지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름( 예: `https://aoairesource.openai.azure.com`) "aoairesource"를 Azure OpenAI 리소스 이름)으로 대체합니다. https://{your-resource-name}.openai.azure.com
API 버전	query	No		이 요청에 사용할 명시적 Foundry Models API 버전입니다. `v1` 그렇지 않으면 지정되지 않은 경우
generation-id	경로	예	string	Azure OpenAI 요청에 사용할 비디오 생성의 ID입니다.

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

Name	필수	Type	Description
Authorization	True	string	예:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Azure CLI 사용하여 인증 토큰을 생성하려면 `az account get-access-token --resource https://cognitiveservices.azure.com` 형식: oauth2 권한 부여 URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` 범위: `https://ai.azure.com/.default`
API 키	True	string	여기에서 Azure OpenAI API 키 제공

응답

상태 코드: 200

설명: 요청이 성공했습니다.

콘텐츠-타입	Type	설명
application/json	VideoGeneration

상태 코드: 기본값

설명: 예기치 않은 오류 응답입니다.

콘텐츠-타입	Type	설명
application/json	AzureOpenAIVideoGenerationErrorResponse

예제

예제 파일을 찾을 수 없습니다. ./examples/get_video_generation.json

비디오 생성 - 썸네일 검색

GET {endpoint}/openai/v1/video/generations/{generation-id}/content/thumbnail?api-version=preview

생성된 비디오 콘텐츠의 썸네일을 검색합니다.

URI 매개 변수

Name	In	필수	Type	Description
endpoint	경로	예	string Url	지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름( 예: `https://aoairesource.openai.azure.com`) "aoairesource"를 Azure OpenAI 리소스 이름)으로 대체합니다. https://{your-resource-name}.openai.azure.com
API 버전	query	No		이 요청에 사용할 명시적 Foundry Models API 버전입니다. `v1` 그렇지 않으면 지정되지 않은 경우
generation-id	경로	예	string	Azure OpenAI 요청에 사용할 비디오 생성의 ID입니다.

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

Name	필수	Type	Description
Authorization	True	string	예:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Azure CLI 사용하여 인증 토큰을 생성하려면 `az account get-access-token --resource https://cognitiveservices.azure.com` 형식: oauth2 권한 부여 URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` 범위: `https://ai.azure.com/.default`
API 키	True	string	여기에서 Azure OpenAI API 키 제공

응답

상태 코드: 200

설명: 요청이 성공했습니다.

콘텐츠-타입	Type	설명
image/jpg	string

상태 코드: 기본값

설명: 예기치 않은 오류 응답입니다.

콘텐츠-타입	Type	설명
application/json	AzureOpenAIVideoGenerationErrorResponse

비디오 세대 - 비디오 콘텐츠 검색

GET {endpoint}/openai/v1/video/generations/{generation-id}/content/video?api-version=preview

생성된 비디오 콘텐츠를 검색합니다.

URI 매개 변수

Name	In	필수	Type	Description
endpoint	경로	예	string Url	지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름( 예: `https://aoairesource.openai.azure.com`) "aoairesource"를 Azure OpenAI 리소스 이름)으로 대체합니다. https://{your-resource-name}.openai.azure.com
API 버전	query	No		이 요청에 사용할 명시적 Foundry Models API 버전입니다. `v1` 그렇지 않으면 지정되지 않은 경우
generation-id	경로	예	string	Azure OpenAI 요청에 사용할 비디오 생성의 ID입니다.
질	query	No

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

Name	필수	Type	Description
Authorization	True	string	예:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Azure CLI 사용하여 인증 토큰을 생성하려면 `az account get-access-token --resource https://cognitiveservices.azure.com` 형식: oauth2 권한 부여 URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` 범위: `https://ai.azure.com/.default`
API 키	True	string	여기에서 Azure OpenAI API 키 제공

응답

상태 코드: 200

설명: 요청이 성공했습니다.

콘텐츠-타입	Type	설명
video/mp4	string

상태 코드: 기본값

설명: 예기치 않은 오류 응답입니다.

콘텐츠-타입	Type	설명
application/json	AzureOpenAIVideoGenerationErrorResponse

비디오 세대 - videocontent 헤더만 검색

HEAD {endpoint}/openai/v1/video/generations/{generation-id}/content/video?api-version=preview

생성된 비디오 콘텐츠의 헤더를 검색합니다.

URI 매개 변수

Name	In	필수	Type	Description
endpoint	경로	예	string Url	지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름( 예: `https://aoairesource.openai.azure.com`) "aoairesource"를 Azure OpenAI 리소스 이름)으로 대체합니다. https://{your-resource-name}.openai.azure.com
API 버전	query	No		이 요청에 사용할 명시적 Foundry Models API 버전입니다. `v1` 그렇지 않으면 지정되지 않은 경우
generation-id	경로	예	string	Azure OpenAI 요청에 사용할 비디오 생성의 ID입니다.
질	query	No

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

Name	필수	Type	Description
Authorization	True	string	예:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Azure CLI 사용하여 인증 토큰을 생성하려면 `az account get-access-token --resource https://cognitiveservices.azure.com` 형식: oauth2 권한 부여 URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` 범위: `https://ai.azure.com/.default`
API 키	True	string	여기에서 Azure OpenAI API 키 제공

응답

상태 코드: 200

설명: 요청이 성공했습니다.

상태 코드: 기본값

설명: 예기치 않은 오류 응답입니다.

콘텐츠-타입	Type	설명
application/json	AzureOpenAIVideoGenerationErrorResponse

Components

채팅, 완료, 포함, 응답 및 기타 텍스트 작업에서 사용되는 스키마 정의는 Azure OpenAI REST API 참조를 참조하세요. 다음 스키마는 이 페이지에서 이미지, 오디오 및 비디오 작업을 지원합니다.

AzureAudioTranscriptionResponse

음성 오디오를 쓰기 텍스트로 전사한 작업에 대한 결과 정보입니다.

Name	Type	Description	필수
duration	number	함께 제공되는 전사 정보를 생성하기 위해 처리된 오디오의 총 기간입니다.	No
language	string	전사된 오디오 데이터에서 검색된 음성 언어입니다. 이는 'en' 또는 'fr'과 같은 두 글자 ISO-639-1 언어 코드로 표현됩니다.	No
세그먼트	배열	처리된 각 오디오 세그먼트의 타이밍, 확률 및 기타 세부 정보에 대한 정보 컬렉션입니다.	No
작업	object	사용 가능한 오디오 작업 응답에 사용할 수 있는 설명자를 정의합니다.	No
문자 메시지	string	제공된 오디오 데이터에 대한 전사된 텍스트입니다.	예
words	배열	처리된 각 단어의 타이밍에 대한 정보 컬렉션입니다.	No

AzureAudioTranslationResponse

음성 오디오를 쓰기 텍스트로 번역한 작업에 대한 결과 정보입니다.

Name	Type	Description	필수
duration	number	함께 제공되는 번역 정보를 생성하기 위해 처리된 오디오의 총 기간입니다.	No
language	string	번역된 오디오 데이터에서 검색된 음성 언어입니다. 이는 'en' 또는 'fr'과 같은 두 글자 ISO-639-1 언어 코드로 표현됩니다.	No
세그먼트	배열	처리된 각 오디오 세그먼트의 타이밍, 확률 및 기타 세부 정보에 대한 정보 컬렉션입니다.	No
작업	object	사용 가능한 오디오 작업 응답에 사용할 수 있는 설명자를 정의합니다.	No
문자 메시지	string	제공된 오디오 데이터에 대한 번역된 텍스트입니다.	예

AzureErrorResponse

Name	Type	Description	필수
오류	object	오류 세부 정보입니다.	No
└) 코드	string	오류에 대한 고유한 컴퓨터 생성 식별자입니다.	No
└─ 내부_오류			No
└) 메시지	string	오류와 관련된 사람이 읽을 수 있는 메시지입니다.	No
└─ 매개 변수	string	해당하는 경우 오류와 연결된 요청 입력 매개 변수	No
└─ 형식	enum	항상 'error'인 개체 형식입니다. 가능한 값: `error`	No

AzureImagesResponse

Name	Type	Description	필수
배경	enum	GPT-image-1만 해당: 이미지 생성에 사용되는 백그라운드 매개 변수입니다. 또는 `transparentopaque`. 가능한 값: `transparentopaque`	No
만든	정수 (integer)	이미지를 만들 때의 Unix 타임스탬프(초)입니다.	예
데이터	배열		No
출력 형식	enum	이미지 생성의 출력 형식입니다. `png`, `webp`또는 `jpeg`. 가능한 값: `png`, `webpjpeg`	No
질	enum	생성된 이미지의 품질입니다. `low`, `medium`또는 `high`. 가능한 값: `low`, `mediumhigh`	No
size	enum	생성된 이미지의 크기입니다. `1024x1024`, `1024x1536`또는 `1536x1024`. 가능한 값: `1024x1024`, `1024x15361536x1024`	No
사용량	object	-series 모델의 경우에만 `gpt-image-1`이미지 생성에 대한 토큰 사용량 정보입니다.	No
└input_tokens	정수 (integer)	입력 프롬프트의 토큰 수(이미지 및 텍스트)입니다.	No
입력 토큰 세부정보 └input_tokens_details	object	입력 토큰은 이미지 생성에 대한 자세한 정보를 제공합니다.	No
└image_tokens	정수 (integer)	입력 프롬프트의 이미지 토큰 수입니다.	No
└text_tokens	정수 (integer)	입력 프롬프트의 텍스트 토큰 수입니다.	No
└─ 출력 토큰 (output_tokens)	정수 (integer)	출력 이미지의 이미지 토큰 수입니다.	No
└total_tokens	정수 (integer)	이미지 생성에 사용되는 총 토큰 수(이미지 및 텍스트)입니다.	No

AzureOpenAIVideoGenerationErrorResponse

Name	Type	Description	필수
코드	string	오류에 대한 고유한 컴퓨터 생성 식별자입니다.	No
inner_error	object	해당하는 경우 이 오류를 발생시킨 업스트림 오류입니다.	No
└) 코드	enum	내부 오류와 연결된 코드입니다. 가능한 값: `ResponsibleAIPolicyViolation`	No
└─ 오류_세부사항		내부 오류와 관련된 콘텐츠 필터 결과 세부 정보입니다.	No
└-revised_prompt	string	해당하는 경우 생성에 사용되는 수정된 프롬프트입니다.	No
메시지	string	오류와 관련된 사람이 읽을 수 있는 메시지입니다.	No
param	string	해당하는 경우 오류와 연결된 요청 입력 매개 변수	No
type	string	해당하는 경우 오류와 연결된 입력 줄 번호입니다.	No

VideoGeneration

비디오 생성 결과입니다.

Name	Type	Description	필수
생성_시간	정수 (integer)	비디오 생성이 만들어진 시간입니다.	예
높이	정수 (integer)	비디오의 높이입니다.	예
id	string	비디오 생성의 ID입니다.	예
job_id	string	이 비디오에 대한 비디오 생성 작업의 ID입니다.	예
n_seconds	정수 (integer)	비디오 생성 기간입니다.	예
object	enum	가능한 값: `video.generation`	예
프롬프트	string	이 비디오 생성을 위한 프롬프트입니다.	예
width	정수 (integer)	비디오의 너비입니다.	예

VideoGenerationJob

비디오 생성 작업입니다.

Name	Type	Description	필수
생성_시간	정수 (integer)	작업이 만들어진 시간입니다.	예
만료_일자	정수 (integer)	서비스에서 작업이 자동으로 삭제되는 시간입니다. 데이터 손실을 방지하려면 이 날짜 이전에 작업의 비디오 콘텐츠와 메타데이터를 저장해야 합니다.	No
failure_reason	string(아래 유효한 모델 참조)		No
완료 시각	정수 (integer)	작업이 모든 비디오 세대로 완료된 시간입니다.	No
세대	배열	이 작업에 대해 생성된 비디오입니다. 이 숫자는 지정된 n_variants 세대의 생성 성공에 따라 달라집니다.	No
높이	정수 (integer)	비디오의 높이입니다.	예
id	string	작업의 ID입니다.	예
inpaint_items	배열	이 비디오 생성 작업에 대한 선택적 인페인팅 항목입니다.	No
model	string	이 비디오 생성 작업에 사용할 배포의 이름입니다.	예
n_seconds	정수 (integer)	비디오 생성 작업의 기간입니다.	예
n_variants	정수 (integer)	이 비디오 생성 작업의 변형으로 만들 비디오 수입니다.	예
object	enum	가능한 값: `video.generation.job`	예
프롬프트	string	이 비디오 생성 작업에 대한 프롬프트입니다.	예
상태	object	비디오 생성 작업의 상태입니다.	예
width	정수 (integer)	비디오의 높이입니다.	예

VideoGenerationJobList

비디오 생성 작업 목록입니다.

Name	Type	Description	필수
데이터	배열	비디오 생성 작업 목록입니다.	예
첫번째_아이디	string	사용 가능한 경우 현재 페이지에서 첫 번째 작업의 ID입니다.	No
더_있음	boolean	목록 이후에 사용할 수 있는 작업이 더 있는지 여부를 나타내는 플래그입니다.	예
마지막 아이디	string	현재 페이지의 마지막 작업 ID(사용 가능한 경우)입니다.	No
object	enum	가능한 값: `list`	예

다음 단계

REST API를 사용한 모델 및 미세 조정에 대해 알아봅니다. OpenAI 어설픈 모델에 대해 자세히 알아보세요>.

피드백

이 페이지가 도움이 되었나요?

Last updated on 2026-06-24