비디오 생성 모델

완료됨

비고

자세한 내용은 텍스트 및 이미지 탭을 참조하세요.

정적 이미지 외에도 시각적 콘텐츠를 비디오로 사용하는 것이 점점 더 늘어나고 있습니다.

Foundry에서 비디오 생성 모델 사용

Microsoft Foundry에는 원본 비디오 콘텐츠를 만드는 데 사용할 수 있는 비디오 생성 모델이 포함되어 있습니다.

세 개의 비디오 생성 모델이 표시된 Foundry 모델 카탈로그의 스크린샷.

Foundry의 비디오 생성 모델은 다음과 같습니다.

  • Sora 1: Sora 는 Microsoft Foundry에서 제공되는 OpenAI의 첫 번째 텍스트-비디오 모델입니다. 텍스트 프롬프트에서 짧은 비디오 클립을 생성하고 이미지를 입력으로 사용하여 비디오 만들기를 안내할 수도 있습니다. Sora 1은 여러 해상도와 기간을 지원하며 실험을 위해 Azure OpenAI 서비스 및 파운드리 비디오 플레이그라운드 를 통해 노출됩니다.

일반적인 용도:

  • 개념 비디오 및 스토리보드
  • 텍스트 설명의 짧은 애니메이션
  • 창의적인 워크플로를 위한 시각적 프로토타입 만들기

Sora 2(공개 미리 보기): Sora 2 는 Foundry 의 차세대 비디오 생성 모델 이며 Sora 1을 통해 상당한 업그레이드를 나타냅니다. 텍스트 → 비디오, 이미지 → 비디오, 비디오 → 비디오(리믹스) 등 여러 형식을 지원합니다. Sora 2는 전체 비디오를 다시 생성하는 대신 대상 편집을 허용하는 오디오 생성, 향상된 리얼리즘 및 리믹스 기능을 소개합니다. Azure OpenAI v1 API 및 Foundry 비디오 플레이그라운드를 통해 사용할 수 있으며, 책임 있는 AI 보호 기능이 기본 제공됩니다.

일반적인 용도:

  • 마케팅 및 홍보 동영상
  • 시네마틱 컨셉 미리 보기 및 예고편
  • 교육 및 몰입형 미디어 콘텐츠

비고

중요한 것은, Sora 모델은 현재 Foundry를 통해 직접 제공되는 유일한 네이티브 비디오 생성 모델입니다. 다른 Foundry 모델은 멀티모달(텍스트, 이미지, 오디오)일 수 있지만 비디오 출력을 생성 하지는 않습니다. Sora 1과 Sora 2에는 실제 사용자에 대한 제한, 저작권이 있는 문자 및 특정 콘텐츠 형식과 같은 책임 있는 AI 제한이 모두 포함됩니다.

Foundry 놀이터의 비디오 생성

적절한 비디오 생성 모델을 배포한 후에는 Foundry 포털 플레이그라운드에서 테스트할 수 있습니다. 플레이그라운드에서 비디오 차원 및 기간과 같은 매개 변수를 지정할 수도 있습니다.

매개 변수 및 프롬프트가 있는 Foundry Playground의 Sora 모델 스크린샷

비디오 생성 모델에 대한 프롬프트에는 원하는 비디오의 콘텐츠에 대한 설명이 포함되어야 합니다. 몇 분 후 모델은 비디오를 생성합니다.

플레이그라운드의 샘플 코드를 살펴볼 수 있습니다.

샘플 코드가 있는 Foundry Playground의 Sora 모델 스크린샷

샘플 코드는 비디오 생성을 위해 REST 인터페이스를 사용합니다.

비디오 생성을 위해 REST 인터페이스 사용

Foundry REST 인터페이스를 사용하여 비디오 생성 작업을 요청하고 완성된 MP4를 프로그래밍 방식으로검색할 수 있습니다. 프로그래밍 방식의 비디오 생성을 통해 비디오 생성 프로세스를 자동화할 수 있습니다.

비고

REST API(표현 상태 전송 API)는 프로그램이 HTTP를 사용하여 통신할 수 있는 웹 인터페이스입니다. 해당 인터페이스를 기반으로 빌드된 개발자 친화적인 도구 키트로서의 SDK입니다. 특히 익숙한 프로그래밍 언어의 SDK가 없는 경우 항상 기본 REST API를 사용할 수 있습니다. curl(클라이언트 URL의 경우 약식)을 사용하여 REST API를 호출하거나 통신할 수 있습니다. Curl은 인터넷을 통해 데이터를 보내고 받는 데 사용되는 명령줄 도구입니다. curl: 핵심은 HTTP 요청(및 기타 프로토콜)을 만들고, 데이터를 서버로 보내고, 서버의 응답을 수신하고 출력합니다.

비디오 생성은 리소스를 많이 사용하며 일반적으로 비동기 작업으로 실행됩니다.

비동기란 다음을 의미합니다.

  1. 작업 생성
  2. 작업 상태 조회
  3. 작업이 완료되면 비디오를 다운로드합니다.

비디오 생성 시간은 설정에 따라 1~5분 정도입니다. Foundry REST 인터페이스를 사용하여 비동기 작업을 실행하려면 다음이 필요합니다.

  • 지원되는 지역의 Azure OpenAI/Foundry 리소스와 Foundry의 모델 및 엔드포인트를 통한 Sora 배포.
  • 권한 부여 방법: API 키 또는 Microsoft Entra ID

Sora 2 모델에서 Azure OpenAI v1 API 를 사용하는 방법에 대해 살펴보겠습니다.

Sora 2 API는 다음에 대한 고유한 엔드포인트를 제공합니다.

  • 렌더링 작업 시작
  • 작업 상태에 대한 조회
  • 비디오 다운로드

1. 비디오 작업 만들기

이 예제에서 스크립트는 비동기 렌더링 작업을 시작하고 폴링할 비디오 ID 를 포함하는 응답을 반환합니다.

비고

Bash 는 명령줄 셸 및 스크립팅 언어입니다. Curl은 Bash 내에서 실행하는 명령입니다.

curl -X POST "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/videos" \
  -H "Content-Type: application/json" \
  -H "api-key: $AZURE_OPENAI_API_KEY" \
  -d '{
    "model": "sora-2",
    "prompt": "A cinematic close-up of raindrops sliding down a neon-lit window at night.",
    "size": "1280x720",
    "seconds": "8"
  }'

2. 완료될 때까지 작업 상태를 주기적으로 확인

이 예제에서 스크립트는 작업이 completed (또는 failed)에 도달할 때까지 엔드포인트를 폴링합니다.

curl -X GET "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/videos/{video_id}" \
  -H "api-key: $AZURE_OPENAI_API_KEY"

3. 완성된 비디오 다운로드

비디오는 상태가 completed이 된 후에만 다운로드됩니다.

curl -L "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/videos/{video_id}/content?variant=video" \
  -H "api-key: $AZURE_OPENAI_API_KEY" \
  --output output.mp4

비디오 모델은 항상 개선되고 있으며 Microsoft Foundry를 사용하면 창의적인 솔루션에 쉽게 통합할 수 있습니다. 다음으로, Foundry에서 비전 지원 모델, 이미지 생성 및 비디오 생성을 직접 사용해 보세요.