비디오 생성 모델
비고
자세한 내용은 텍스트 및 이미지 탭을 참조하세요.
정적 이미지 외에도 시각적 콘텐츠를 비디오로 사용하는 것이 점점 더 늘어나고 있습니다.
Foundry에서 비디오 생성 모델 사용
Microsoft Foundry에는 원본 비디오 콘텐츠를 만드는 데 사용할 수 있는 비디오 생성 모델이 포함되어 있습니다.
Foundry의 비디오 생성 모델은 다음과 같습니다.
- Sora 1: Sora 는 Microsoft Foundry에서 제공되는 OpenAI의 첫 번째 텍스트-비디오 모델입니다. 텍스트 프롬프트에서 짧은 비디오 클립을 생성하고 이미지를 입력으로 사용하여 비디오 만들기를 안내할 수도 있습니다. Sora 1은 여러 해상도와 기간을 지원하며 실험을 위해 Azure OpenAI 서비스 및 파운드리 비디오 플레이그라운드 를 통해 노출됩니다.
일반적인 용도:
- 개념 비디오 및 스토리보드
- 텍스트 설명의 짧은 애니메이션
- 창의적인 워크플로를 위한 시각적 프로토타입 만들기
Sora 2(공개 미리 보기): Sora 2 는 Foundry 의 차세대 비디오 생성 모델 이며 Sora 1을 통해 상당한 업그레이드를 나타냅니다. 텍스트 → 비디오, 이미지 → 비디오, 비디오 → 비디오(리믹스) 등 여러 형식을 지원합니다. Sora 2는 전체 비디오를 다시 생성하는 대신 대상 편집을 허용하는 오디오 생성, 향상된 리얼리즘 및 리믹스 기능을 소개합니다. Azure OpenAI v1 API 및 Foundry 비디오 플레이그라운드를 통해 사용할 수 있으며, 책임 있는 AI 보호 기능이 기본 제공됩니다.
일반적인 용도:
- 마케팅 및 홍보 동영상
- 시네마틱 컨셉 미리 보기 및 예고편
- 교육 및 몰입형 미디어 콘텐츠
비고
중요한 것은, Sora 모델은 현재 Foundry를 통해 직접 제공되는 유일한 네이티브 비디오 생성 모델입니다. 다른 Foundry 모델은 멀티모달(텍스트, 이미지, 오디오)일 수 있지만 비디오 출력을 생성 하지는 않습니다. Sora 1과 Sora 2에는 실제 사용자에 대한 제한, 저작권이 있는 문자 및 특정 콘텐츠 형식과 같은 책임 있는 AI 제한이 모두 포함됩니다.
Foundry 놀이터의 비디오 생성
적절한 비디오 생성 모델을 배포한 후에는 Foundry 포털 플레이그라운드에서 테스트할 수 있습니다. 플레이그라운드에서 비디오 차원 및 기간과 같은 매개 변수를 지정할 수도 있습니다.
비디오 생성 모델에 대한 프롬프트에는 원하는 비디오의 콘텐츠에 대한 설명이 포함되어야 합니다. 몇 분 후 모델은 비디오를 생성합니다.
플레이그라운드의 샘플 코드를 살펴볼 수 있습니다.
샘플 코드는 비디오 생성을 위해 REST 인터페이스를 사용합니다.
비디오 생성을 위해 REST 인터페이스 사용
Foundry REST 인터페이스를 사용하여 비디오 생성 작업을 요청하고 완성된 MP4를 프로그래밍 방식으로검색할 수 있습니다. 프로그래밍 방식의 비디오 생성을 통해 비디오 생성 프로세스를 자동화할 수 있습니다.
비고
REST API(표현 상태 전송 API)는 프로그램이 HTTP를 사용하여 통신할 수 있는 웹 인터페이스입니다. 해당 인터페이스를 기반으로 빌드된 개발자 친화적인 도구 키트로서의 SDK입니다. 특히 익숙한 프로그래밍 언어의 SDK가 없는 경우 항상 기본 REST API를 사용할 수 있습니다. curl(클라이언트 URL의 경우 약식)을 사용하여 REST API를 호출하거나 통신할 수 있습니다. Curl은 인터넷을 통해 데이터를 보내고 받는 데 사용되는 명령줄 도구입니다. curl: 핵심은 HTTP 요청(및 기타 프로토콜)을 만들고, 데이터를 서버로 보내고, 서버의 응답을 수신하고 출력합니다.
비디오 생성은 리소스를 많이 사용하며 일반적으로 비동기 작업으로 실행됩니다.
비동기란 다음을 의미합니다.
- 작업 생성
- 작업 상태 조회
- 작업이 완료되면 비디오를 다운로드합니다.
비디오 생성 시간은 설정에 따라 1~5분 정도입니다. Foundry REST 인터페이스를 사용하여 비동기 작업을 실행하려면 다음이 필요합니다.
- 지원되는 지역의 Azure OpenAI/Foundry 리소스와 Foundry의 모델 및 엔드포인트를 통한 Sora 배포.
- 권한 부여 방법: API 키 또는 Microsoft Entra ID
Sora 2 모델에서 Azure OpenAI v1 API 를 사용하는 방법에 대해 살펴보겠습니다.
Sora 2 API는 다음에 대한 고유한 엔드포인트를 제공합니다.
- 렌더링 작업 시작
- 작업 상태에 대한 조회
- 비디오 다운로드
1. 비디오 작업 만들기
이 예제에서 스크립트는 비동기 렌더링 작업을 시작하고 폴링할 비디오 ID 를 포함하는 응답을 반환합니다.
비고
Bash 는 명령줄 셸 및 스크립팅 언어입니다. Curl은 Bash 내에서 실행하는 명령입니다.
curl -X POST "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/videos" \
-H "Content-Type: application/json" \
-H "api-key: $AZURE_OPENAI_API_KEY" \
-d '{
"model": "sora-2",
"prompt": "A cinematic close-up of raindrops sliding down a neon-lit window at night.",
"size": "1280x720",
"seconds": "8"
}'
2. 완료될 때까지 작업 상태를 주기적으로 확인
이 예제에서 스크립트는 작업이 completed (또는 failed)에 도달할 때까지 엔드포인트를 폴링합니다.
curl -X GET "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/videos/{video_id}" \
-H "api-key: $AZURE_OPENAI_API_KEY"
3. 완성된 비디오 다운로드
비디오는 상태가 completed이 된 후에만 다운로드됩니다.
curl -L "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/videos/{video_id}/content?variant=video" \
-H "api-key: $AZURE_OPENAI_API_KEY" \
--output output.mp4
비디오 모델은 항상 개선되고 있으며 Microsoft Foundry를 사용하면 창의적인 솔루션에 쉽게 통합할 수 있습니다. 다음으로, Foundry에서 비전 지원 모델, 이미지 생성 및 비디오 생성을 직접 사용해 보세요.