OpenAI 이미지, 오디오 및 비디오 REST API 참조 Azure(v1 미리 보기)

이 문서에서는 v1 미리 보기 릴리스에서 Azure OpenAI에 대한 이미지, 오디오(음성) 및 비디오 생성 데이터 평면 유추 REST API 작업을 설명합니다. 채팅 완료, 포함, 회피, 파일, 미세 조정, 응답, 벡터 저장소 및 기타 모든 작업은 공식 Azure OpenAI REST API 참조를 참조하세요.

데이터 평면 유추

이 문서의 나머지 부분에는 Azure OpenAI 데이터 평면 유추 사양의 새 v1 미리 보기 API 릴리스의 이미지, 오디오 및 비디오 작업이 설명되어 있습니다. 자세한 내용은 API 수명 주기 가이드를 참조하세요.

전체 v1 GA 데이터 평면 API는 공식 Azure OpenAI REST API 참조를 참조하세요.

음성 만들기

POST {endpoint}/openai/v1/audio/speech?api-version=preview

입력 텍스트에서 텍스트 음성 변환 오디오를 생성합니다.

URI 매개 변수

Name In 필수 Type Description
endpoint 경로 string
Url
지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름( 예: https://aoairesource.openai.azure.com) "aoairesource"를 Azure OpenAI 리소스 이름)으로 대체합니다. https://{your-resource-name}.openai.azure.com
API 버전 query No 이 요청에 사용할 명시적 Microsoft Foundry 모델 API 버전입니다.
v1 그렇지 않으면 지정되지 않은 경우

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

Name 필수 Type Description
Authorization True string 예:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Azure CLI 사용하여 인증 토큰을 생성하려면 az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://ai.azure.com/.default
API 키 True string 여기에서 Azure OpenAI API 키 제공

요청 본문

콘텐츠 형식: multipart/form-data

Name Type Description 필수 기본값
input string 오디오를 생성할 텍스트입니다. 최대 길이는 4096자입니다.
instructions string 추가 지침으로 생성된 오디오의 음성을 제어합니다. 또는 .와 함께 tts-1tts-1-hd작동하지 않습니다. No
model string 이 텍스트 음성 변환 요청에 사용할 모델입니다.
응답_형식 object 텍스트 음성 변환에 지원되는 오디오 출력 형식입니다. No
speed number 생성된 오디오의 음성 속도입니다. 값은 0.25에서 4.0까지의 범위에서 유효하며, 기본값은 1.0이고 더 빠른 음성에 해당하는 값은 더 높습니다. No 1
스트림_포맷 enum 오디오를 스트리밍할 형식입니다. 지원되는 형식은 다음과 같습니다 sseaudio. sse가 지원되지 않는 경우 또는 tts-1.에 대해 tts-1-hd 지원되지 않습니다.
가능한 값: sseaudio
No
voice object

응답

상태 코드: 200

설명: 요청이 성공했습니다.

콘텐츠-타입 Type 설명
application/octet-stream string

상태 코드: 기본값

설명: 예기치 않은 오류 응답입니다.

콘텐츠-타입 Type 설명
application/json AzureErrorResponse

예제

Example

제공된 텍스트에서 오디오를 합성합니다.

POST {endpoint}/openai/v1/audio/speech?api-version=preview

{
 "input": "Hi! What are you going to make?",
 "voice": "fable",
 "response_format": "mp3",
 "model": "tts-1"
}

응답: 상태 코드: 200

{
  "body": "101010101"
}

전사 만들기

POST {endpoint}/openai/v1/audio/transcriptions?api-version=preview

오디오를 입력 언어로 전사합니다.

URI 매개 변수

Name In 필수 Type Description
endpoint 경로 string
Url
지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름( 예: https://aoairesource.openai.azure.com) "aoairesource"를 Azure OpenAI 리소스 이름)으로 대체합니다. https://{your-resource-name}.openai.azure.com
API 버전 query No 이 요청에 사용할 명시적 Foundry Models API 버전입니다.
v1 그렇지 않으면 지정되지 않은 경우

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

Name 필수 Type Description
Authorization True string 예:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Azure CLI 사용하여 인증 토큰을 생성하려면 az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://ai.azure.com/.default
API 키 True string 여기에서 Azure OpenAI API 키 제공

요청 본문

콘텐츠 형식: multipart/form-data

Name Type Description 필수 기본값
chunking_strategy object No
└prefix_padding_ms 정수 (integer) VAD가 음성을 감지하기 전에 포함할 오디오 양(밀리초)입니다. No 300
└침묵 지속 시간(ms) silence_duration_ms 정수 (integer) 음성 중지를 감지하는 무음 기간(밀리초)입니다. 값이 짧을수록 모델은 더 빠르게 응답하지만 사용자로부터 짧은 일시 중지로 이동할 수 있습니다. No 200
└) 임계값 number 음성 활동 감지의 민감도 임계값(0.0~1.0)입니다. 임계값이 높을수록 모델을 활성화하기 위해 더 큰 오디오가 필요하므로 시끄러운 환경에서 더 나은 성능을 발휘할 수 있습니다. No 0.5
└─ 형식 enum 서버 쪽 VAD를 server_vad 사용하여 수동 청크를 사용하도록 설정해야 합니다.
가능한 값: server_vad
No
파일 string
filename string 오디오 데이터와 연결할 선택적 파일 이름 또는 설명 식별자입니다. No
include[] 배열 전사 응답에 포함할 추가 정보입니다. logprobs 는 응답에서 토큰의 로그 확률을 반환하여 전사에 대한 모델의 신뢰도를 이해합니다. logprobs는 response_format 설정 json 되고 모델gpt-4o-transcribe, gpt-4o-transcribe-diarizegpt-4o-mini-transcribegpt-4o-mini-transcribe-2025-12-15.에서만 작동합니다. No
language string 입력 오디오의 언어입니다. ISO-639-1(예: en형식)로 입력 언어를 제공하면 정확도와 대기 시간이 향상됩니다. No
model string 이 전사 요청에 사용할 모델입니다. No
프롬프트 string 모델의 스타일을 안내하거나 이전 오디오 세그먼트를 계속하기 위한 선택적 텍스트입니다. 프롬프트가 오디오 언어와 일치해야 합니다. No
응답_형식 object No
stream boolean true로 설정하면 모델 응답 데이터가 서버에서 보낸 이벤트를 사용하여 생성될 때 클라이언트로 스트리밍됩니다. 참고: 스트리밍은 모델에 대해 whisper-1 지원되지 않으며 무시됩니다. No 거짓
온도 number 샘플링 온도(0에서 1 사이)입니다. 0.8과 같은 값이 높을수록 출력이 더 임의로 생성되고, 0.2와 같은 값이 낮으면 더 집중적이고 결정적입니다. 0으로 설정하면 모델은 로그 확률 을 사용하여 특정 임계값에 도달할 때까지 온도를 자동으로 높입니다. No 0
timestamp_granularities[] 배열 이 전사에 대해 채울 타임스탬프 세분성입니다. response_format 는 타임스탬프 세분성을 사용하도록 설정 verbose_json 해야 합니다. 이러한 옵션 중 하나 또는 둘 다 지원wordsegment됩니다. 참고: 세그먼트 타임스탬프에 대한 추가 대기 시간은 없지만 단어 타임스탬프를 생성하면 추가 대기 시간이 발생합니다. No ['segment']

응답

상태 코드: 200

설명: 요청이 성공했습니다.

콘텐츠-타입 Type 설명
application/json AzureAudioTranscriptionResponse
text/plain string

상태 코드: 기본값

설명: 예기치 않은 오류 응답입니다.

콘텐츠-타입 Type 설명
application/json AzureErrorResponse

예제

Example

제공된 음성 오디오 데이터에서 전사된 텍스트 및 관련 메타데이터를 가져옵니다.

POST {endpoint}/openai/v1/audio/transcriptions?api-version=preview

{
 "file": "<binary audio data>",
 "model": "whisper-1",
 "response_format": "text"
}

응답: 상태 코드: 200

{
  "body": "plain text when requesting text, srt, or vtt"
}

번역 만들기

POST {endpoint}/openai/v1/audio/translations?api-version=preview

제공된 음성 오디오 데이터에서 영어 전사 텍스트 및 관련 메타데이터를 가져옵니다.

URI 매개 변수

Name In 필수 Type Description
endpoint 경로 string
Url
지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름( 예: https://aoairesource.openai.azure.com) "aoairesource"를 Azure OpenAI 리소스 이름)으로 대체합니다. https://{your-resource-name}.openai.azure.com
API 버전 query No 이 요청에 사용할 명시적 Foundry Models API 버전입니다.
v1 그렇지 않으면 지정되지 않은 경우

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

Name 필수 Type Description
Authorization True string 예:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Azure CLI 사용하여 인증 토큰을 생성하려면 az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://ai.azure.com/.default
API 키 True string 여기에서 Azure OpenAI API 키 제공

요청 본문

콘텐츠 형식: multipart/form-data

Name Type Description 필수 기본값
파일 string
filename string 오디오 데이터와 연결할 선택적 파일 이름 또는 설명 식별자입니다. No
model string 이 번역 요청에 사용할 모델입니다. No
프롬프트 string 모델의 스타일을 안내하거나 이전 오디오 세그먼트를 계속하기 위한 선택적 텍스트입니다. 프롬프트는 영어로 되어 있어야 합니다. No
응답_형식 object No
온도 number 샘플링 온도(0에서 1 사이)입니다. 0.8과 같은 값이 높을수록 출력이 더 임의로 생성되고, 0.2와 같은 값이 낮으면 더 집중적이고 결정적입니다. 0으로 설정하면 모델은 로그 확률 을 사용하여 특정 임계값에 도달할 때까지 온도를 자동으로 높입니다. No 0

응답

상태 코드: 200

설명: 요청이 성공했습니다.

콘텐츠-타입 Type 설명
application/json AzureAudioTranslationResponse
text/plain string

상태 코드: 기본값

설명: 예기치 않은 오류 응답입니다.

콘텐츠-타입 Type 설명
application/json AzureErrorResponse

예제

Example

제공된 음성 오디오 데이터에서 영어 전사 텍스트 및 관련 메타데이터를 가져옵니다.

POST {endpoint}/openai/v1/audio/translations?api-version=preview

{
 "file": "<binary audio data>",
 "model": "whisper-1",
 "response_format": "text"
}

응답: 상태 코드: 200

{
  "body": "plain text when requesting text, srt, or vtt"
}

이미지 편집 만들기

POST {endpoint}/openai/v1/images/edits?api-version=preview

URI 매개 변수

Name In 필수 Type Description
endpoint 경로 string
Url
지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름( 예: https://aoairesource.openai.azure.com) "aoairesource"를 Azure OpenAI 리소스 이름)으로 대체합니다. https://{your-resource-name}.openai.azure.com
API 버전 query No 이 요청에 사용할 명시적 Foundry Models API 버전입니다.
v1 그렇지 않으면 지정되지 않은 경우

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

Name 필수 Type Description
Authorization True string 예:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Azure CLI 사용하여 인증 토큰을 생성하려면 az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://ai.azure.com/.default
API 키 True string 여기에서 Azure OpenAI API 키 제공

요청 본문

콘텐츠 형식: multipart/form-data

Name Type Description 필수 기본값
배경 enum 생성된 이미지의 배경에 대한 투명도를 설정할 수 있습니다.
이 매개 변수는 모델에 대해서만 지원됩니다 gpt-image-1 . 또는 transparentopaque (기본값) 중 auto하나여야 합니다. 사용되는 경우 auto 모델은 이미지에 가장 적합한 배경을 자동으로 결정합니다.

출력 형식이 투명도를 지원해야 하는 경우 transparent투명도를 (기본값) 또는 png.로 설정 webp 해야 합니다.
가능한 값: transparent, opaqueauto
No
이미지 문자열 또는 배열
마스크 string No
model string 이미지 편집 작업에 사용할 모델 배포입니다.
n 정수 (integer) 생성할 이미지 수입니다. 1에서 10 사이여야 합니다. No 1
출력 압축 정수 (integer) 생성된 이미지의 압축 수준(0-100%)입니다. 이 매개 변수는 출력 형식 또는 gpt-image-1 출력 형식이 webp 있는 -series 모델에 대해서만 지원jpeg되며 기본값은 100입니다. No 100
출력 형식 enum 생성된 이미지가 반환되는 형식입니다. 이 매개 변수는 -series 모델에 대해서만 지원됩니다 gpt-image-1. , png또는 jpeg. 중 webp하나여야 합니다.
기본값은 .입니다 png.
가능한 값: png, jpegwebp
No
프롬프트 string 원하는 이미지에 대한 텍스트 설명입니다. 최대 길이는 -series 모델의 경우 dall-e-21000자, 32000자 gpt-image-1입니다.
enum 생성될 이미지의 품질입니다. high medium- low series 모델에 대해서만 지원gpt-image-1됩니다. dall-e-2 만 품질을 지원합니다 standard . 기본값은 .입니다 auto.
가능한 값: standard, low, medium, highauto
No
응답_형식 enum 생성된 이미지가 반환되는 형식입니다. 중 하나 url 여야 합니다.b64_json URL은 이미지가 생성된 후 60분 동안만 유효합니다. -series 모델은 항상 base64로 인코딩된 이미지를 반환하므로 이 매개 변수는 지원dall-e-2gpt-image-1됩니다.
가능한 값: urlb64_json
No
size enum 생성된 이미지의 크기입니다. -series 모델의 경우 , 1024x1024 (가로), 1536x1024 (세로) 또는 1024x1536 (기본값) auto중 하나gpt-image-1여야 하며, 그 중 256x256하나이거나 , 512x512또는 1024x1024 에 대한 dall-e-2값이어야 합니다.
가능한 값: 256x256, 512x512, 1024x10241536x1024, 1024x1536auto
No
user string 최종 사용자를 나타내는 고유 식별자입니다. 이 식별자는 OpenAI가 남용을 모니터링하고 감지하는 데 도움이 될 수 있습니다. No

응답

상태 코드: 200

설명: 요청이 성공했습니다.

콘텐츠-타입 Type 설명
application/json AzureImagesResponse

상태 코드: 기본값

설명: 예기치 않은 오류 응답입니다.

콘텐츠-타입 Type 설명
application/json AzureErrorResponse

이미지 생성

POST {endpoint}/openai/v1/images/generations?api-version=preview

URI 매개 변수

Name In 필수 Type Description
endpoint 경로 string
Url
지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름( 예: https://aoairesource.openai.azure.com) "aoairesource"를 Azure OpenAI 리소스 이름)으로 대체합니다. https://{your-resource-name}.openai.azure.com
API 버전 query No 이 요청에 사용할 명시적 Foundry Models API 버전입니다.
v1 그렇지 않으면 지정되지 않은 경우

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

Name 필수 Type Description
Authorization True string 예:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Azure CLI 사용하여 인증 토큰을 생성하려면 az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://ai.azure.com/.default
API 키 True string 여기에서 Azure OpenAI API 키 제공

요청 본문

Content-Type: application/json

Name Type Description 필수 기본값
배경 enum 생성된 이미지의 배경에 대한 투명도를 설정할 수 있습니다.
이 매개 변수는 모델에 대해서만 지원됩니다 gpt-image-1 . 또는 transparentopaque (기본값) 중 auto하나여야 합니다. 사용되는 경우 auto 모델은 이미지에 가장 적합한 배경을 자동으로 결정합니다.

출력 형식이 투명도를 지원해야 하는 경우 transparent투명도를 (기본값) 또는 png.로 설정 webp 해야 합니다.
가능한 값: transparent, opaqueauto
No
model string 이미지 생성에 사용할 모델 배포입니다.
검토 enum -series 모델에서 생성된 gpt-image-1이미지의 콘텐츠 조정 수준을 제어합니다. 덜 제한적인 필터링 또는 low (기본값) 중 하나 auto 여야 합니다.
가능한 값: lowauto
No
n 정수 (integer) 생성할 이미지 수입니다. 1에서 10 사이여야 합니다. 의 경우 dall-e-3n=1 지원됩니다. No 1
출력 압축 정수 (integer) 생성된 이미지의 압축 수준(0-100%)입니다. 이 매개 변수는 출력 형식 또는 gpt-image-1 출력 형식이 webp 있는 -series 모델에 대해서만 지원jpeg되며 기본값은 100입니다. No 100
출력 형식 enum 생성된 이미지가 반환되는 형식입니다. 이 매개 변수는 -series 모델에 대해서만 지원됩니다 gpt-image-1. , png또는 jpeg. 중 webp하나여야 합니다.
가능한 값: png, jpegwebp
No
프롬프트 string 원하는 이미지에 대한 텍스트 설명입니다. 최대 길이는 -series 모델의 경우 gpt-image-132000자, 1000자 dall-e-2 , 4000자입니다 dall-e-3.
enum 생성될 이미지의 품질입니다.

- auto (기본값)은 지정된 모델의 최고 품질을 자동으로 선택합니다.
- high medium- low series 모델에 대해 gpt-image-1지원됩니다.
- hdstandard 대해 dall-e-3지원됩니다.
- standard 는 .에 대한 유일한 옵션입니다 dall-e-2.
가능한 값: standard, hd, lowmedium, highauto
No
응답_형식 enum 생성된 이미지와 함께 dall-e-2dall-e-3 반환되는 형식입니다. 중 하나 url 여야 합니다.b64_json URL은 이미지가 생성된 후 60분 동안만 유효합니다. 이 매개 변수는 항상 base64로 인코딩된 이미지를 반환하는 -series 모델에 대해 지원 gpt-image-1되지 않습니다.
가능한 값: urlb64_json
No
size enum 생성된 이미지의 크기입니다. -series 모델의 경우 , 1024x1024 (가로), 1536x1024 (세로) 또는 1024x1536 (기본값) auto중 하나 gpt-image-1256x256512x5121024x1024dall-e-21024x10241792x10241024x1792dall-e-3여야 합니다.
가능한 값: auto,, 1024x10241536x1024, 1024x1536256x256, 512x512, 1792x10241024x1792
No
스타일 enum 생성된 이미지의 스타일입니다. 이 매개 변수는 .에 dall-e-3대해서만 지원됩니다. 중 하나 vivid 여야 합니다.natural 생생한 원인은 모델이 하이퍼 리얼 및 극적인 이미지를 생성하는 쪽으로 기울어지게 합니다. 자연은 모델이 더 자연스럽고 덜 실제적인 이미지를 생성하게 합니다.
가능한 값: vividnatural
No
user string 최종 사용자를 나타내는 고유 식별자입니다. 이 식별자는 OpenAI가 남용을 모니터링하고 감지하는 데 도움이 될 수 있습니다. No

응답

상태 코드: 200

설명: 요청이 성공했습니다.

콘텐츠-타입 Type 설명
application/json AzureImagesResponse

상태 코드: 기본값

설명: 예기치 않은 오류 응답입니다.

콘텐츠-타입 Type 설명
application/json AzureErrorResponse

예제

Example

프롬프트가 지정된 이미지를 만듭니다.

POST {endpoint}/openai/v1/images/generations?api-version=preview

{
 "model": "dall-e-3",
 "prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
 "n": 1,
 "style": "natural",
 "quality": "standard"
}

응답: 상태 코드: 200

{
  "body": {
    "created": 1698342300,
    "data": [
      {
        "revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
        "prompt_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          },
          "profanity": {
            "detected": false,
            "filtered": false
          },
          "custom_blocklists": {
            "filtered": false,
            "details": []
          }
        },
        "url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
        "content_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          }
        }
      }
    ]
  }
}

비디오 생성 작업 - 만들기

POST {endpoint}/openai/v1/video/generations/jobs?api-version=preview

새 비디오 생성 작업을 만듭니다.

URI 매개 변수

Name In 필수 Type Description
endpoint 경로 string
Url
지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름( 예: https://aoairesource.openai.azure.com) "aoairesource"를 Azure OpenAI 리소스 이름)으로 대체합니다. https://{your-resource-name}.openai.azure.com
API 버전 query No 이 요청에 사용할 명시적 Foundry Models API 버전입니다.
v1 그렇지 않으면 지정되지 않은 경우

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

Name 필수 Type Description
Authorization True string 예:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Azure CLI 사용하여 인증 토큰을 생성하려면 az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://ai.azure.com/.default
API 키 True string 여기에서 Azure OpenAI API 키 제공

요청 본문

Content-Type: application/json

Name Type Description 필수 기본값
높이 정수 (integer) 비디오의 높이입니다. 지원되는 차원은 가로 방향과 세로 방향 모두에서 480x480, 854x480, 720x720, 1280x720, 1080x1080 및 1920x1080입니다.
model string 이 요청에 사용할 배포의 이름입니다.
n_seconds 정수 (integer) 비디오 생성 작업의 기간입니다. 1~20초 사이여야 합니다. No 5
n_variants 정수 (integer) 이 작업의 변형으로 만들 비디오 수입니다. 1에서 5 사이여야 합니다. 크기가 작을수록 더 많은 변형이 허용됩니다. No 1
프롬프트 string 이 비디오 생성 작업에 대한 프롬프트입니다.
width 정수 (integer) 비디오의 너비입니다. 지원되는 차원은 가로 방향과 세로 방향 모두에서 480x480, 854x480, 720x720, 1280x720, 1080x1080 및 1920x1080입니다.

요청 본문

콘텐츠 형식: multipart/form-data

Name Type Description 필수 기본값
파일 배열
높이 정수 (integer) 비디오의 높이입니다. 지원되는 차원은 가로 방향과 세로 방향 모두에서 480x480, 854x480, 720x720, 1280x720, 1080x1080 및 1920x1080입니다.
inpaint_items 배열 이 비디오 생성 작업에 대한 선택적 인페인팅 항목입니다. No
model string 이 요청에 사용할 배포의 이름입니다.
n_seconds 정수 (integer) 비디오 생성 작업의 기간입니다. 1~20초 사이여야 합니다. No 5
n_variants 정수 (integer) 이 작업의 변형으로 만들 비디오 수입니다. 1에서 5 사이여야 합니다. 크기가 작을수록 더 많은 변형이 허용됩니다. No 1
프롬프트 string 이 비디오 생성 작업에 대한 프롬프트입니다.
width 정수 (integer) 비디오의 너비입니다. 지원되는 차원은 가로 방향과 세로 방향 모두에서 480x480, 854x480, 720x720, 1280x720, 1080x1080 및 1920x1080입니다.

응답

상태 코드: 200

설명: 요청이 성공했습니다.

콘텐츠-타입 Type 설명
application/json VideoGenerationJob

상태 코드: 기본값

설명: 예기치 않은 오류 응답입니다.

콘텐츠-타입 Type 설명
application/json AzureOpenAIVideoGenerationErrorResponse

예제

예제 파일을 찾을 수 없습니다. ./examples/create_video_generation_job_simple.json

비디오 생성 작업 - 목록

GET {endpoint}/openai/v1/video/generations/jobs?api-version=preview

비디오 생성 작업을 나열합니다.

URI 매개 변수

Name In 필수 Type Description
endpoint 경로 string
Url
지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름( 예: https://aoairesource.openai.azure.com) "aoairesource"를 Azure OpenAI 리소스 이름)으로 대체합니다. https://{your-resource-name}.openai.azure.com
API 버전 query No 이 요청에 사용할 명시적 Foundry Models API 버전입니다.
v1 그렇지 않으면 지정되지 않은 경우
before query No string
query No string
limit query 정수 (integer)
statuses query No 배열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

Name 필수 Type Description
Authorization True string 예:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Azure CLI 사용하여 인증 토큰을 생성하려면 az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://ai.azure.com/.default
API 키 True string 여기에서 Azure OpenAI API 키 제공

응답

상태 코드: 200

설명: 요청이 성공했습니다.

콘텐츠-타입 Type 설명
application/json VideoGenerationJobList

상태 코드: 기본값

설명: 예기치 않은 오류 응답입니다.

콘텐츠-타입 Type 설명
application/json AzureOpenAIVideoGenerationErrorResponse

예제

예제 파일을 찾을 수 없습니다. ./examples/get_video_generation_job_list.json

비디오 생성 작업 - 가져오기

GET {endpoint}/openai/v1/video/generations/jobs/{job-id}?api-version=preview

비디오 생성 작업의 속성을 검색합니다.

URI 매개 변수

Name In 필수 Type Description
endpoint 경로 string
Url
지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름( 예: https://aoairesource.openai.azure.com) "aoairesource"를 Azure OpenAI 리소스 이름)으로 대체합니다. https://{your-resource-name}.openai.azure.com
API 버전 query No 이 요청에 사용할 명시적 Foundry Models API 버전입니다.
v1 그렇지 않으면 지정되지 않은 경우
job-id 경로 string Azure OpenAI 요청에 사용할 비디오 생성 작업의 ID입니다.

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

Name 필수 Type Description
Authorization True string 예:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Azure CLI 사용하여 인증 토큰을 생성하려면 az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://ai.azure.com/.default
API 키 True string 여기에서 Azure OpenAI API 키 제공

응답

상태 코드: 200

설명: 요청이 성공했습니다.

콘텐츠-타입 Type 설명
application/json VideoGenerationJob

상태 코드: 기본값

설명: 예기치 않은 오류 응답입니다.

콘텐츠-타입 Type 설명
application/json AzureOpenAIVideoGenerationErrorResponse

예제

예제 파일을 찾을 수 없습니다. ./examples/get_video_generation_job.json

비디오 생성 작업 - 삭제

DELETE {endpoint}/openai/v1/video/generations/jobs/{job-id}?api-version=preview

비디오 생성 작업을 삭제합니다.

URI 매개 변수

Name In 필수 Type Description
endpoint 경로 string
Url
지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름( 예: https://aoairesource.openai.azure.com) "aoairesource"를 Azure OpenAI 리소스 이름)으로 대체합니다. https://{your-resource-name}.openai.azure.com
API 버전 query No 이 요청에 사용할 명시적 Foundry Models API 버전입니다.
v1 그렇지 않으면 지정되지 않은 경우
job-id 경로 string Azure OpenAI 요청에 사용할 비디오 생성 작업의 ID입니다.

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

Name 필수 Type Description
Authorization True string 예:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Azure CLI 사용하여 인증 토큰을 생성하려면 az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://ai.azure.com/.default
API 키 True string 여기에서 Azure OpenAI API 키 제공

응답

상태 코드: 204

설명: 이 요청에 대해 보낼 콘텐츠는 없지만 헤더가 유용할 수 있습니다.

상태 코드: 기본값

설명: 예기치 않은 오류 응답입니다.

콘텐츠-타입 Type 설명
application/json AzureOpenAIVideoGenerationErrorResponse

비디오 세대 - 가져오기

GET {endpoint}/openai/v1/video/generations/{generation-id}?api-version=preview

ID별로 비디오 생성을 검색합니다.

URI 매개 변수

Name In 필수 Type Description
endpoint 경로 string
Url
지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름( 예: https://aoairesource.openai.azure.com) "aoairesource"를 Azure OpenAI 리소스 이름)으로 대체합니다. https://{your-resource-name}.openai.azure.com
API 버전 query No 이 요청에 사용할 명시적 Foundry Models API 버전입니다.
v1 그렇지 않으면 지정되지 않은 경우
generation-id 경로 string Azure OpenAI 요청에 사용할 비디오 생성의 ID입니다.

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

Name 필수 Type Description
Authorization True string 예:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Azure CLI 사용하여 인증 토큰을 생성하려면 az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://ai.azure.com/.default
API 키 True string 여기에서 Azure OpenAI API 키 제공

응답

상태 코드: 200

설명: 요청이 성공했습니다.

콘텐츠-타입 Type 설명
application/json VideoGeneration

상태 코드: 기본값

설명: 예기치 않은 오류 응답입니다.

콘텐츠-타입 Type 설명
application/json AzureOpenAIVideoGenerationErrorResponse

예제

예제 파일을 찾을 수 없습니다. ./examples/get_video_generation.json

비디오 생성 - 썸네일 검색

GET {endpoint}/openai/v1/video/generations/{generation-id}/content/thumbnail?api-version=preview

생성된 비디오 콘텐츠의 썸네일을 검색합니다.

URI 매개 변수

Name In 필수 Type Description
endpoint 경로 string
Url
지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름( 예: https://aoairesource.openai.azure.com) "aoairesource"를 Azure OpenAI 리소스 이름)으로 대체합니다. https://{your-resource-name}.openai.azure.com
API 버전 query No 이 요청에 사용할 명시적 Foundry Models API 버전입니다.
v1 그렇지 않으면 지정되지 않은 경우
generation-id 경로 string Azure OpenAI 요청에 사용할 비디오 생성의 ID입니다.

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

Name 필수 Type Description
Authorization True string 예:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Azure CLI 사용하여 인증 토큰을 생성하려면 az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://ai.azure.com/.default
API 키 True string 여기에서 Azure OpenAI API 키 제공

응답

상태 코드: 200

설명: 요청이 성공했습니다.

콘텐츠-타입 Type 설명
image/jpg string

상태 코드: 기본값

설명: 예기치 않은 오류 응답입니다.

콘텐츠-타입 Type 설명
application/json AzureOpenAIVideoGenerationErrorResponse

비디오 세대 - 비디오 콘텐츠 검색

GET {endpoint}/openai/v1/video/generations/{generation-id}/content/video?api-version=preview

생성된 비디오 콘텐츠를 검색합니다.

URI 매개 변수

Name In 필수 Type Description
endpoint 경로 string
Url
지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름( 예: https://aoairesource.openai.azure.com) "aoairesource"를 Azure OpenAI 리소스 이름)으로 대체합니다. https://{your-resource-name}.openai.azure.com
API 버전 query No 이 요청에 사용할 명시적 Foundry Models API 버전입니다.
v1 그렇지 않으면 지정되지 않은 경우
generation-id 경로 string Azure OpenAI 요청에 사용할 비디오 생성의 ID입니다.
query No

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

Name 필수 Type Description
Authorization True string 예:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Azure CLI 사용하여 인증 토큰을 생성하려면 az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://ai.azure.com/.default
API 키 True string 여기에서 Azure OpenAI API 키 제공

응답

상태 코드: 200

설명: 요청이 성공했습니다.

콘텐츠-타입 Type 설명
video/mp4 string

상태 코드: 기본값

설명: 예기치 않은 오류 응답입니다.

콘텐츠-타입 Type 설명
application/json AzureOpenAIVideoGenerationErrorResponse

비디오 세대 - videocontent 헤더만 검색

HEAD {endpoint}/openai/v1/video/generations/{generation-id}/content/video?api-version=preview

생성된 비디오 콘텐츠의 헤더를 검색합니다.

URI 매개 변수

Name In 필수 Type Description
endpoint 경로 string
Url
지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름( 예: https://aoairesource.openai.azure.com) "aoairesource"를 Azure OpenAI 리소스 이름)으로 대체합니다. https://{your-resource-name}.openai.azure.com
API 버전 query No 이 요청에 사용할 명시적 Foundry Models API 버전입니다.
v1 그렇지 않으면 지정되지 않은 경우
generation-id 경로 string Azure OpenAI 요청에 사용할 비디오 생성의 ID입니다.
query No

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

Name 필수 Type Description
Authorization True string 예:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Azure CLI 사용하여 인증 토큰을 생성하려면 az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://ai.azure.com/.default
API 키 True string 여기에서 Azure OpenAI API 키 제공

응답

상태 코드: 200

설명: 요청이 성공했습니다.

상태 코드: 기본값

설명: 예기치 않은 오류 응답입니다.

콘텐츠-타입 Type 설명
application/json AzureOpenAIVideoGenerationErrorResponse

Components

채팅, 완료, 포함, 응답 및 기타 텍스트 작업에서 사용되는 스키마 정의는 Azure OpenAI REST API 참조를 참조하세요. 다음 스키마는 이 페이지에서 이미지, 오디오 및 비디오 작업을 지원합니다.

AzureAudioTranscriptionResponse

음성 오디오를 쓰기 텍스트로 전사한 작업에 대한 결과 정보입니다.

Name Type Description 필수 기본값
duration number 함께 제공되는 전사 정보를 생성하기 위해 처리된 오디오의 총 기간입니다. No
language string 전사된 오디오 데이터에서 검색된 음성 언어입니다.
이는 'en' 또는 'fr'과 같은 두 글자 ISO-639-1 언어 코드로 표현됩니다.
No
세그먼트 배열 처리된 각 오디오 세그먼트의 타이밍, 확률 및 기타 세부 정보에 대한 정보 컬렉션입니다. No
작업 object 사용 가능한 오디오 작업 응답에 사용할 수 있는 설명자를 정의합니다. No
문자 메시지 string 제공된 오디오 데이터에 대한 전사된 텍스트입니다.
words 배열 처리된 각 단어의 타이밍에 대한 정보 컬렉션입니다. No

AzureAudioTranslationResponse

음성 오디오를 쓰기 텍스트로 번역한 작업에 대한 결과 정보입니다.

Name Type Description 필수 기본값
duration number 함께 제공되는 번역 정보를 생성하기 위해 처리된 오디오의 총 기간입니다. No
language string 번역된 오디오 데이터에서 검색된 음성 언어입니다.
이는 'en' 또는 'fr'과 같은 두 글자 ISO-639-1 언어 코드로 표현됩니다.
No
세그먼트 배열 처리된 각 오디오 세그먼트의 타이밍, 확률 및 기타 세부 정보에 대한 정보 컬렉션입니다. No
작업 object 사용 가능한 오디오 작업 응답에 사용할 수 있는 설명자를 정의합니다. No
문자 메시지 string 제공된 오디오 데이터에 대한 번역된 텍스트입니다.

AzureErrorResponse

Name Type Description 필수 기본값
오류 object 오류 세부 정보입니다. No
└) 코드 string 오류에 대한 고유한 컴퓨터 생성 식별자입니다. No
└─ 내부_오류 No
└) 메시지 string 오류와 관련된 사람이 읽을 수 있는 메시지입니다. No
└─ 매개 변수 string 해당하는 경우 오류와 연결된 요청 입력 매개 변수 No
└─ 형식 enum 항상 'error'인 개체 형식입니다.
가능한 값: error
No

AzureImagesResponse

Name Type Description 필수 기본값
배경 enum GPT-image-1만 해당: 이미지 생성에 사용되는 백그라운드 매개 변수입니다. 또는 transparentopaque.
가능한 값: transparentopaque
No
만든 정수 (integer) 이미지를 만들 때의 Unix 타임스탬프(초)입니다.
데이터 배열 No
출력 형식 enum 이미지 생성의 출력 형식입니다. png, webp또는 jpeg.
가능한 값: png, webpjpeg
No
enum 생성된 이미지의 품질입니다. low, medium또는 high.
가능한 값: low, mediumhigh
No
size enum 생성된 이미지의 크기입니다. 1024x1024, 1024x1536또는 1536x1024.
가능한 값: 1024x1024, 1024x15361536x1024
No
사용량 object -series 모델의 경우에만 gpt-image-1이미지 생성에 대한 토큰 사용량 정보입니다. No
└input_tokens 정수 (integer) 입력 프롬프트의 토큰 수(이미지 및 텍스트)입니다. No
입력 토큰 세부정보 └input_tokens_details object 입력 토큰은 이미지 생성에 대한 자세한 정보를 제공합니다. No
└image_tokens 정수 (integer) 입력 프롬프트의 이미지 토큰 수입니다. No
└text_tokens 정수 (integer) 입력 프롬프트의 텍스트 토큰 수입니다. No
└─ 출력 토큰 (output_tokens) 정수 (integer) 출력 이미지의 이미지 토큰 수입니다. No
└total_tokens 정수 (integer) 이미지 생성에 사용되는 총 토큰 수(이미지 및 텍스트)입니다. No

AzureOpenAIVideoGenerationErrorResponse

Name Type Description 필수 기본값
코드 string 오류에 대한 고유한 컴퓨터 생성 식별자입니다. No
inner_error object 해당하는 경우 이 오류를 발생시킨 업스트림 오류입니다. No
└) 코드 enum 내부 오류와 연결된 코드입니다.
가능한 값: ResponsibleAIPolicyViolation
No
└─ 오류_세부사항 내부 오류와 관련된 콘텐츠 필터 결과 세부 정보입니다. No
└-revised_prompt string 해당하는 경우 생성에 사용되는 수정된 프롬프트입니다. No
메시지 string 오류와 관련된 사람이 읽을 수 있는 메시지입니다. No
param string 해당하는 경우 오류와 연결된 요청 입력 매개 변수 No
type string 해당하는 경우 오류와 연결된 입력 줄 번호입니다. No

VideoGeneration

비디오 생성 결과입니다.

Name Type Description 필수 기본값
생성_시간 정수 (integer) 비디오 생성이 만들어진 시간입니다.
높이 정수 (integer) 비디오의 높이입니다.
id string 비디오 생성의 ID입니다.
job_id string 이 비디오에 대한 비디오 생성 작업의 ID입니다.
n_seconds 정수 (integer) 비디오 생성 기간입니다.
object enum
가능한 값: video.generation
프롬프트 string 이 비디오 생성을 위한 프롬프트입니다.
width 정수 (integer) 비디오의 너비입니다.

VideoGenerationJob

비디오 생성 작업입니다.

Name Type Description 필수 기본값
생성_시간 정수 (integer) 작업이 만들어진 시간입니다.
만료_일자 정수 (integer) 서비스에서 작업이 자동으로 삭제되는 시간입니다. 데이터 손실을 방지하려면 이 날짜 이전에 작업의 비디오 콘텐츠와 메타데이터를 저장해야 합니다. No
failure_reason string(아래 유효한 모델 참조) No
완료 시각 정수 (integer) 작업이 모든 비디오 세대로 완료된 시간입니다. No
세대 배열 이 작업에 대해 생성된 비디오입니다. 이 숫자는 지정된 n_variants 세대의 생성 성공에 따라 달라집니다. No
높이 정수 (integer) 비디오의 높이입니다.
id string 작업의 ID입니다.
inpaint_items 배열 이 비디오 생성 작업에 대한 선택적 인페인팅 항목입니다. No
model string 이 비디오 생성 작업에 사용할 배포의 이름입니다.
n_seconds 정수 (integer) 비디오 생성 작업의 기간입니다.
n_variants 정수 (integer) 이 비디오 생성 작업의 변형으로 만들 비디오 수입니다.
object enum
가능한 값: video.generation.job
프롬프트 string 이 비디오 생성 작업에 대한 프롬프트입니다.
상태 object 비디오 생성 작업의 상태입니다.
width 정수 (integer) 비디오의 높이입니다.

VideoGenerationJobList

비디오 생성 작업 목록입니다.

Name Type Description 필수 기본값
데이터 배열 비디오 생성 작업 목록입니다.
첫번째_아이디 string 사용 가능한 경우 현재 페이지에서 첫 번째 작업의 ID입니다. No
더_있음 boolean 목록 이후에 사용할 수 있는 작업이 더 있는지 여부를 나타내는 플래그입니다.
마지막 아이디 string 현재 페이지의 마지막 작업 ID(사용 가능한 경우)입니다. No
object enum
가능한 값: list

다음 단계

REST API를 사용한 모델 및 미세 조정에 대해 알아봅니다. OpenAI 어설픈 모델에 대해 자세히 알아보세요>.