Microsoft Foundry의 모델에 즉시 액세스(미리 보기)

모델에 즉시 액세스하면 지원되는 모든 모델을 이름으로 호출할 수 있으며 배포가 필요하지 않습니다. Foundry 프로젝트를 만들고 코딩을 시작하고 사용 가능한 모든 모델을 즉시 사용합니다.

사전 요구 사항

  • Azure 구독입니다. 체험 계정 만들기
  • Microsoft Foundry에 로그인합니다. New Foundry 토글이 설정되었는지 확인합니다. 이러한 단계는 Foundry(신규)를 참조합니다.
  • 미국 서부 3의 Foundry 프로젝트(미리 보기 중에 즉시 액세스가 지원되는 유일한 지역). 프로젝트를 만들어야 하는 경우 프로젝트 만들기를 참조하세요.
  • 프로젝트 또는 계정의 Foundry 사용자 역할입니다.

Important

Foundry RBAC 역할의 이름이 최근에 바뀌었습니다. Foundry User, Foundry OwnerFoundry 계정 소유자Foundry Project Manager는 이전에 Azure AI 사용자, Azure AI 소유자, Azure AI 계정 소유자 및 Azure AI Project Manager로 이름이 지정되었습니다. 이름 바꾸기가 롤아웃되는 동안 일부 위치에서는 이전 이름이 계속 표시될 수 있습니다. 역할 ID 및 핵심 권한은 이름 바꾸기에 의해 변경되지 않습니다.

즉시 모델 사용 시작

즉시 액세스하면 워크플로가 간단합니다. 코드에서 지원되는 인스턴트 모델 이름을 사용합니다. 배포가 필요하지 않습니다. 배포에 이미 사용하는 동일한 API, SDK 및 클라이언트는 인스턴트 액세스 모델에서 작동합니다. 두 번째 SDK, 별도의 클라이언트 없음, 구성 변경 없음

인스턴트 액세스에 대한 지원은 시간이 지남에 따라 계속 확장됩니다. 사용할 수 있는 모델 이름의 예는 다음과 같습니다.

  • gpt-chat-latest
  • gpt-5.1-codex-max
  • gpt-5.2-codex
  • gpt-5.3-codex
  • gpt-5.5

정확한 집합은 자주 변경됩니다. 전체 목록을 보는 방법은 지원되는 모델을 참조하세요.

배포 기반 코드에서 유일한 변경 내용은 매개 변수입니다 model . 아래 코드에서 "gpt-5-mini"(배포된 모델)을 chat-gpt-latest와 같은 임의의 인스턴트 액세스 모델 이름으로 바꾸세요.

from azure.identity import DefaultAzureCredential
from azure.ai.projects import AIProjectClient

# Format: "https://resource_name.ai.azure.com/api/projects/project_name"
PROJECT_ENDPOINT = "your_project_endpoint"

# Create project and openai clients to call Foundry API
project = AIProjectClient(
    endpoint=PROJECT_ENDPOINT,
    credential=DefaultAzureCredential(),
)
openai = project.get_openai_client()

# Run a responses API call
response = openai.responses.create(
    model="gpt-5-mini",
    input="What is the size of France in square miles?",
)
print(f"Response output: {response.output_text}")

인스턴트 액세스 모델을 위한 플레이그라운드

즉시 액세스 모델에 대한 플레이그라운드에 도달하려면 다음 경로 중 하나를 사용합니다.

  1. 집에서플레이그라운드를 선택합니다.
  2. 집에서카탈로그를 선택한 다음, 플레이그라운드를 선택합니다.
  3. 모델 세부 정보 페이지에서 플레이그라운드를 선택합니다.

카탈로그 및 모델 경로를 포함하여 홈에서 플레이그라운드까지의 탐색 경로 다이어그램

플레이그라운드에 있는 경우 모델 드롭다운을 사용하여 다른 즉시 액세스 또는 배포된 모델로 전환합니다.

즉각적인 액세스가 중요한 이유

  • 하나의 문자열을 변경하여 모델을 전환 합니다. 배포를 만들거나 삭제하지 않고 줄에 model= 있는 모든 인스턴트 모델 이름을 사용합니다.
  • 동일한 API 및 SDK - 즉시 액세스 및 배포 모두에 대해 동일한 호출이 작동합니다.
  • 개발 도구에서 작동 합니다. 즉, 즉시 액세스는 배포와 동일한 방식으로 Foundry CLI, VS Code 및 CI/CD 파이프라인과 통합됩니다.

배포는 없어지지 않을 것입니다. 예약된 처리량, 사용자 지정 콘텐츠 필터, 데이터 상주 또는 고급 엔터프라이즈 구성이 필요한 경우 올바른 선택으로 유지됩니다. 즉시 액세스는 시작 경험을 간소화하여, 배포가 모델을 사용하기 전에 반드시 거쳐야 하는 관문이 아니라 점차 수준을 높여 가며 도달하는 다음 단계가 되도록 합니다.

지원되는 모델

새 모델은 릴리스될 때 기본적으로 즉시 액세스를 지원합니다. 제품 팀은 고객 수요에 따라 추가 모델에 대한 지원을 고려합니다. 목록은 시간이 지남에 따라 증가하고 표시되는 모델의 예는 다음과 같습니다.

  • chat-gpt-latest
  • gpt-5.1-codex
  • gpt-5.1-codex-mini
  • gpt-5.1-codex-max
  • gpt-5.2-codex
  • gpt-5.3-codex
  • gpt-5.5

즉시 액세스를 지원하는 모든 모델을 보려면 다음을 수행합니다.

  1. 새 Foundry 환경에서 미국 서부 3 에서 프로젝트를 엽니다.
  2. 오른쪽 위 탐색에서 검색 을 선택한 다음 왼쪽 창의 모델을 선택합니다.
  3. 모델 카탈로그에서 개발 옵션에서 인스턴트를 선택하여 사용 가능한 인스턴트 액세스 모델을 봅니다.

프로그래밍 방식으로 인스턴트 액세스 모델을 나열할 수도 있습니다.

SUBSCRIPTION_ID="<your-subscription-id>"
LOCATION="westus3"

az rest --method get \
  --url "https://management.azure.com/subscriptions/$SUBSCRIPTION_ID/providers/Microsoft.CognitiveServices/locations/$LOCATION/models?api-version=2025-06-01" \
  --output json \
| jq -r '(.value // .models // .)[]
  | select((.model.capabilities.instant // "false" | tostring | ascii_downcase) == "true")
  | .model.name' \
| sort -u

메모

미리 보기 중에는 즉시 액세스 모델을 미국 서부 3 의 프로젝트에서만 사용할 수 있습니다.

구독에 할당량이 없는 경우에도 일부 인스턴트 액세스 모델이 목록에 표시될 수 있습니다. 자세한 내용은 Foundry 모델의 할당량 및 제한을 참조하세요.

즉시 액세스 및 배포를 사용해야 하는 경우

Scenario 권장되는 접근 방식
시작, 프로토타입 생성 또는 실험 즉시 액세스
릴리스 직후 최신 모델 사용 즉시 액세스
예약된 용량 또는 예측 가능한 처리량 필요 Deployment
프로비전된 처리량 필요(PTU) Deployment
특정 지역에서 데이터 보존 필요 Deployment
모델당 사용자 지정 콘텐츠 필터링 정책 Deployment
모델당 사용자 지정 가드레일 Deployment
엔드포인트별 구성(예: 엔드포인트당 버전 잠금) Deployment
팀 간 세분화된 할당량 분할 Deployment
미세 조정된 모델 Deployment

즉시 액세스 및 배포는 동일한 프로젝트에서 공존할 수 있습니다. 즉시 액세스 모델로 시작하고 요구 사항이 진화함에 따라 나중에 배포를 만들 수 있습니다.

모델 버전

기본적으로 인스턴트 액세스는 모델의 최신 상록 버전을 사용합니다. 특정 버전에 고정하려면 모델 이름에 하이픈을 넣은 접미사로 버전 날짜를 추가합니다.

model로 전달하는 항목 Behavior
model-name 최신 버전으로 경로 지정
model-name-2025-04-01 해당 특정 버전으로 경로 지정

버전 고정은 옵트인입니다. 애플리케이션에 안정성이 필요한 경우 버전 접미사를 포함합니다. 그렇지 않으면 항상 최신 버전을 자동으로 가져옵니다.

할당량 사용 방법

인스턴트 액세스는 구독에 할당된 모델별 전역 할당량 풀에서 가져옵니다. 이 할당량은 표준 배포에서 사용하는 지역 할당량과 별개입니다.

  • 전역 할당량을 할당하거나 분할하지 않습니다. 구독의 모든 인스턴트 모델 사용에서 자동으로 공유됩니다.
  • 글로벌 표준 배포는 전역 할당량의 일부를 예약합니다. 인스턴트 액세스 모델은 남은 용량을 사용합니다.
  • 다른 배포 유형(지역 표준, 프로비전됨)은 별도의 지역 할당량을 사용하며 인스턴트 모델 용량에 영향을 주지 않습니다.
  • 인스턴트 모델 요청이 제한되는 경우 할당량 증가를 요청하거나 예약된 용량으로 배포를 만들 수 있습니다.

전역 및 지역 할당량이 상호 작용하는 방법에 대한 자세한 내용은 할당량 관리 및 증가를 참조하세요.

엔터프라이즈 컨트롤

Capability 작동 방식
특정 모델 또는 공급자 차단 Azure Policy 정의는 배포에 적용되는 것과 동일한 방식으로 즉시 액세스에 적용됩니다.
모델 버전에 고정하기 모델 이름에 버전 접미사 추가( 모델 버전 참조)
즉시 액세스를 완전히 사용하지 않도록 설정 관리자는 Azure Policy 통해 구독 수준에서 즉시 액세스를 해제할 수 있습니다.

계정에서 즉시 액세스를 제거하려면 Bicep 또는 ARM REST를 통해 설정을 구성합니다.

다음을 사용하여 계정을 업데이트합니다.

PATCH https://management.azure.com/subscriptions/{sub}/resourceGroups/{rg}/providers/Microsoft.CognitiveServices/accounts/{account}?api-version=2026-01-15-preview
Authorization: Bearer {arm_token}
Content-Type: application/json

이 요청 본문을 사용하여 인스턴트 모델 액세스를 효과적으로 차단합니다.

{
  "properties": {
    "instant": {
      "raiPolicyName": "Microsoft.DefaultV2",
      "modelAllowList": []
    }
  }
}

Important

모든 인스턴트 액세스 모델은 기본 가드레일 및 콘텐츠 필터를 사용합니다. 그러나 즉시 액세스하기 위해 모델별로 사용자 지정 가드레일 또는 RAI(책임 있는 AI) 정책을 구성할 수는 없습니다. API를 통해 계정 수준에서 기본 RAI 정책을 설정할 수 있지만 해당 정책은 모든 인스턴트 액세스 모델에 균일하게 적용됩니다. 개별 모델에 대해 다른 콘텐츠 필터링 정책이 필요한 경우 배포를 사용합니다.

배포 이름 충돌

새 배포는 기존 모델 이름과 일치하는 이름을 사용할 수 없습니다. 이름이 모델 이름과 충돌하는 기존 배포가 있는 경우 배포가 우선하며 해당 프로젝트에서 해당 모델 이름에 대한 인스턴트 모델 액세스를 사용할 수 없습니다.

미리 보기 중 제한 사항

  • 미국 서부 3에서만 사용할 수 있습니다.
  • 미세 조정된 모델은 지원되지 않습니다. 파인튜닝된 모델을 사용하려면 배포를 생성합니다.
  • 가드레일, 사용자 지정 RAI 정책 및 콘텐츠 필터는 즉시 액세스할 수 있도록 구성할 수 없습니다.
  • 지원되는 모델에 나열된 모델만 사용할 수 있습니다.