Foundation Model API에서 사용할 수 있는 Databricks 호스팅 기본 모델

이 문서에서는 Databricks Foundation 모델 API에서 지원하는 최신 오픈 모델에 대해 설명합니다.

비고

이러한 모델의 지역 가용성 및 지원되는 기능 영역에 대한 모델 제공 에 대한 지원되는 기본 모델을 참조하세요.

비고

OpenAI 및 Google Gemini 모델은 Databricks에서 제공하는 ADI 서비스를 통해서만 사용할 수 있습니다. Azure Databricks 환경에서 이러한 모델에 액세스하려면 ADI Services 참조하세요.

Databricks 작업 영역에서 사용할 수 있는 토큰당 종량제 엔드포인트를 사용하여 이러한 모델에 쿼리 요청을 보낼 수 있습니다. 사용할 모델 엔드포인트의 이름은 기본 모델 및 토큰당 종량제 지원 모델 테이블을 참조하세요.

토큰당 종량제 모드에서 모델을 지원하는 것 외에도 Foundation Model API는 프로비전된 처리량 모드를 제공합니다. Databricks는 프로덕션 워크로드에 프로비전된 처리량을 권장합니다. 이 모드는 토큰당 종량제 모드에서 지원되는 미세 조정된 모델 및 사용자 지정 미리 학습된 모델을 포함하여 모델 아키텍처 제품군의 모든 모델을 지원합니다. 지원되는 아키텍처 목록은 프로비전된 처리량 Foundation Model API 를 참조하세요.

AI Playground를 사용하여 지원되는 이러한 모델과 상호 작용할 수 있습니다.

Google Gemini 3.1 Flash Lite

중요하다

Gemini 3.1 Flash Lite에 대한 적용 가능한 모델 용어를 참조하세요.

이 모델은 전역 엔드포인트에서 호스트되며 지리 간 라우팅을 사용하도록 설정해야 합니다.

엔드포인트 이름: databricks-gemini-3-1-flash-lite

지원되는 입력: 텍스트, 이미지, 비디오, 오디오

Gemini 3.1 Flash Lite는 Google에서 개발하고 학습한 Gemini 3 시리즈에서 가장 빠르고 비용 효율적인 모델입니다. 대규모 인텔리전스를 위해 빌드된 이 모델은 이미지 기능, 함수 호출 및 구조화된 출력을 사용하는 멀티모달 입력을 지원합니다. Gemini 3.1 Flash Lite는 처리량이 높고 비용 효율적인 배포에 최적화되어 있습니다. Gemini 3.1 Flash Lite에 대해 자세히 알아보세요.

다른 큰 언어 모델과 마찬가지로 Gemini 3.1 Flash Lite 출력은 일부 사실을 생략하고 때때로 거짓 정보를 생성할 수 있습니다. Databricks는 정확도가 특히 중요한 시나리오에서 RAG(검색 보강 생성)를 사용하는 것이 좋습니다.

이 엔드포인트는 Databricks 보안 경계 내에서 Databricks에 의해 호스팅됩니다.

Alibaba Cloud Qwen3.5 122B A10B

중요하다

Qwen3.5 122B A10B 모델은 공개 미리 보기로 제공됩니다.

엔드포인트 이름: databricks-qwen35-122b-a10b

지원되는 입력: 텍스트

Qwen3.5 122B A10B는 Alibaba Cloud에서 빌드하고 학습한 하이브리드 MoE(혼합 전문가) 추론 모델로, 총 매개 변수는 1,220억 개, 유추당 활성 매개 변수는 100억 개입니다. 이 모델은 256K 컨텍스트 창과 최대 8,000개의 출력 토큰을 지원하며 추론, 코딩 및 에이전트 작업에 대한 강력한 성능을 제공합니다. 추론 전용 모델인 Qwen3.5 122B A10B는 응답하기 전에 항상 이유를 지정하며 추론을 사용하지 않도록 설정할 수 없습니다.

다른 큰 언어 모델과 마찬가지로 Qwen3.5 122B A10B 출력은 일부 사실을 생략하고 때때로 거짓 정보를 생성할 수 있습니다. Databricks는 정확도가 특히 중요한 시나리오에서 RAG(검색 보강 생성)를 사용하는 것이 좋습니다.

Alibaba Cloud Qwen3-Embedding-0.6B (알리바바 클라우드의 Qwen3-Embedding-0.6B 제품)

중요하다

Qwen3-Embedding-0.6B 모델은 공개 미리 보기로 제공됩니다.

엔드포인트 이름: databricks-qwen3-embedding-0-6b

지원되는 입력: 텍스트

Qwen3-Embedding-0.6B 는 검색, 유사성 검색, 클러스터링 및 분류와 같은 의미 체계 작업을 위해 설계된 600M 매개 변수가 있는 컴팩트 텍스트 포함 모델입니다. 텍스트를 표면 형태가 아닌 의미를 나타내는 조밀한 벡터로 인코딩합니다.

이 모델은 100개 이상의 언어(코드 포함)를 지원하고 최대 32K 토큰까지 긴 컨텍스트를 처리하므로 긴 문서를 포함하는 데 적합합니다. 구성 가능한 차원이 최대 1024까지 가능하며, 임베딩을 생성하고 지시 인식 기능이 있어 프롬프트를 통해 작업에 특화된 편향을 설정할 수 있습니다.

트랜스포머 인코더를 기반으로 하며 임베딩 생성을 위해 특별히 미세 조정된 Qwen3-Embedding-0.6B는 효율적인 추론과 임베딩 품질을 균형 있게 제공합니다.

임베딩 모델은 검색 증강 생성(RAG) 사용 사례에서 LLM과 함께 사용할 때 특히 효과적입니다. Qwen3-Embedding-0.6B를 사용하여 LLM의 컨텍스트에서 사용할 수 있는 문서의 큰 청크에서 관련 텍스트 조각을 찾을 수 있습니다.

Alibaba Cloud Qwen3-Next 80B A3B 지시

중요하다

Qwen3-Next 80B A3B 지시 모델은 공개 미리 보기로 제공됩니다.

엔드포인트 이름: databricks-qwen3-next-80b-a3b-instruct

지원되는 입력: 텍스트

Qwen3-Next-80B-A3B-Instruct Alibaba Cloud에서 빌드하고 학습한 명령 다음 작업에 최적화된 매우 효율적인 대규모 언어 모델입니다. 이 모델은 매우 긴 컨텍스트를 처리하고, 처리량이 높은 결정적 출력을 요구하는 다단계 워크플로, 검색 보강 생성 및 엔터프라이즈 애플리케이션에서 뛰어난 성능을 발휘하도록 설계되었습니다.

다른 큰 언어 모델과 마찬가지로 Qwen3-Next 80B A3B 지시 출력은 일부 사실을 생략하고 때때로 거짓 정보를 생성할 수 있습니다. Databricks는 정확도가 특히 중요한 시나리오에서 RAG(검색 보강 생성)를 사용하는 것이 좋습니다.

OpenAI GPT OSS 120B

엔드포인트 이름: databricks-gpt-oss-120b

지원되는 입력: 텍스트

GPT OSS 120B는 OpenAI에서 빌드하고 학습한 사고 체인 및 조정 가능한 추론 노력 수준을 갖춘 최첨단 추론 모델입니다. OpenAI의 주력 오픈 웨이트 모델이며 128K 토큰 컨텍스트 창을 갖추고 있습니다. 이 모델은 고품질 추론 작업을 위해 빌드되었습니다.

다른 큰 언어 모델과 마찬가지로 GPT OSS 120B 출력은 일부 사실을 생략하고 때때로 거짓 정보를 생성할 수 있습니다. Databricks는 정확도가 특히 중요한 시나리오에서 RAG(검색 보강 생성)를 사용하는 것이 좋습니다.

OpenAI GPT OSS 20B

엔드포인트 이름: databricks-gpt-oss-20b

지원되는 입력: 텍스트

GPT OSS 20B는 OpenAI에서 빌드하고 학습한 최신 경량 추론 모델입니다. 이 모델에는 128K 토큰의 컨텍스트 창이 있으며 실시간 AI 도우미 및 일괄 처리 추론 작업에서 탁월합니다.

다른 큰 언어 모델과 마찬가지로 GPT OSS 20B 출력은 일부 사실을 생략하고 때때로 거짓 정보를 생성할 수 있습니다. Databricks는 정확도가 특히 중요한 시나리오에서 RAG(검색 보강 생성)를 사용하는 것이 좋습니다.

Google Gemma 3 12B

중요하다

Gemma 3 용어 및 허용 가능한 사용 정책에 대한 적용 가능한 모델 용어를 참조하세요.

엔드포인트 이름: databricks-gemma-3-12b

지원되는 입력: 텍스트, 이미지

Gemma 3 12B는 젬마 3 제품군의 일환으로 구글이 개발한 120억 개의 매개 변수 멀티모달 및 비전 언어 모델입니다. Gemma 3에는 최대 128K 토큰 컨텍스트가 있으며 140개 이상의 언어에 대한 다국어 지원을 제공합니다. 이 모델은 텍스트 및 이미지 입력을 모두 처리하고 텍스트 출력을 생성하도록 설계되었으며, 질문 답변을 포함한 대화 상자 사용 사례, 텍스트 생성 및 이미지 이해 작업에 최적화되어 있습니다.

다른 큰 언어 모델과 마찬가지로, Gemma 3 출력은 몇 가지 사실을 생략하고 때때로 거짓 정보를 생성 할 수 있습니다. Databricks는 정확도가 특히 중요한 시나리오에서 RAG(검색 보강 생성)를 사용하는 것이 좋습니다.

메타 라마 4 매버릭

중요하다

Llama 4 커뮤니티 라이선스 및 허용 가능한 사용 정책에 대한 적용 가능한 모델 용어를 참조하세요.

엔드포인트 이름: databricks-llama-4-maverick

지원되는 입력: 텍스트, 이미지

라마 4 매버릭은 메타가 빌드하고 학습한 최첨단 대형 언어 모델입니다. 컴퓨팅 효율성을 위해 전문가 아키텍처를 혼합하여 사용하는 첫 번째 라마 모델 제품군입니다. Llama 4 Maverick는 여러 언어를 지원하며 정확한 이미지 및 텍스트 이해 사용 사례에 최적화되어 있습니다. 라마 4 매버릭에 대해 자세히 알아보세요.

다른 큰 언어 모델과 마찬가지로, Llama 4 출력은 일부 사실을 생략하고 때때로 거짓 정보를 생성할 수 있습니다. Databricks는 정확도가 특히 중요한 시나리오에서 RAG(검색 보강 생성)를 사용하는 것이 좋습니다.

메타 라마 3.3 70B 지시

중요하다

2024년 12월 11일부터 Meta-Llama-3.3-70B-Instruct가 Meta-Llama-3.1-70B-Instruct에 대한 지원을 대체하여, 토큰당 종량제를 기반으로 하는 Foundation Model API 엔드포인트에서 사용됩니다.

LLama 3.3 커뮤니티 라이선스 및 허용 가능한 사용 정책에 대한 적용 가능한 모델 용어를 참조하세요.

엔드포인트 이름: databricks-meta-llama-3-3-70b-instruct

지원되는 입력: 텍스트

Meta-Llama-3.3-70B-Instruct는 Meta에서 빌드하고 학습한 128,000개의 토큰 컨텍스트를 가진 최첨단 대규모 언어 모델입니다. 이 모델은 여러 언어를 지원하며 대화 사용 사례에 최적화되어 있습니다. 메타 라마 3.3에 대해 자세히 알아보세요.

다른 큰 언어 모델과 마찬가지로, Llama-3의 출력은 일부 사실을 생략하고 때때로 거짓 정보를 생성할 수 있습니다. Databricks는 정확도가 특히 중요한 시나리오에서 RAG(검색 보강 생성)를 사용하는 것이 좋습니다.

메타 라마 3.1 405B 지시

중요하다

Meta-Llama-3.1-405B-Instruct는 사용 중지됩니다.

토큰당 종량제 워크로드의 경우 2026년 2월 15일부터
프로비전된 처리량 워크로드의 경우 2026년 5월 15일부터

사용 중단 중에 마이그레이션하는 방법에 대한 권장 대체 모델 및 지침은 사용되지 않는 모델 및 사용 중지된 모델을 참조하세요.

중요하다

파운데이션 모델 API와 함께 이 모델을 사용하는 방법은 공개 미리 보기로 제공됩니다. 이 모델을 사용할 때 엔드포인트 오류 또는 안정화 오류가 발생하는 경우 Databricks 계정 팀에 문의하세요.

Llama 3.1 커뮤니티 라이선스 및 허용 가능한 사용 정책에 대한 적용 가능한 모델 용어를 참조하세요.

엔드포인트 이름: databricks-meta-llama-3-1-405b-instruct

지원되는 입력: 텍스트

Meta-Llama-3.1-405B-Instruct는 메타에서 빌드 및 학습한 가장 큰 공개적으로 사용 가능한 최신 대형 언어 모델이며 AzureML 모델 카탈로그를 사용하여 Azure Machine Learning 배포합니다. 이 모델을 사용하면 고객이 고급 다단계 추론 및 고품질 가상 데이터 생성같은 새로운 기능을 잠금 해제할 수 있습니다. 이 모델은 품질 측면에서 GPT-4-Turbo와 경쟁력이 있습니다.

Meta-Llama-3.1-70B-Instruct와 마찬가지로 이 모델은 10개 언어에서 128,000개의 토큰 및 지원 컨텍스트를 가지고 있습니다. 이는 유용성과 안전을 위한 인간의 선호도에 부합하며 대화 사용 사례에 최적화되어 있습니다. Meta Llama 3.1 모델에 대해 자세히 알아봅니다.

다른 큰 언어 모델과 마찬가지로, Llama-3.1의 출력은 일부 사실을 생략하고 때때로 거짓 정보를 생성할 수 있습니다. Databricks는 정확도가 특히 중요한 시나리오에서 RAG(검색 보강 생성)를 사용하는 것이 좋습니다.

Meta Llama 3.1 8B 지시

중요하다

LLama 3.1 커뮤니티 라이선스 및 허용 가능한 사용 정책에 대한 적용 가능한 모델 용어를 참조하세요.

엔드포인트 이름: databricks-meta-llama-3-1-8b-instruct

지원되는 입력: 텍스트

Meta-Llama-3.1-8B-Instruct는 메타가 빌드하고 학습한 128,000개의 토큰 컨텍스트를 가진 최첨단 대규모 언어 모델입니다. 이 모델은 여러 언어를 지원하며 대화 사용 사례에 최적화되어 있습니다. 메타 라마 3.1에 대해 자세히 알아보세요.

인류 클로드 하이쿠 4.5

중요하다

고객은 Anthropic의 사용 정책 약관 준수를 보장할 책임이 있습니다. Databricks Master Cloud Services 계약 및 해당하는 경우 Databricks Business Associate Agreement도 참조하세요.

엔드포인트 이름: databricks-claude-haiku-4-5

지원되는 입력: 텍스트, 이미지

Claude Haiku 4.5는 Anthropic에서 가장 빠르고 비용 효율적인 모델로, 뛰어난 속도와 효율성으로 거의 프론티어 코딩 품질을 제공합니다. 채팅 도우미, 고객 서비스 에이전트, 쌍 프로그래밍 및 빠른 프로토타입 생성을 비롯한 대기 시간이 짧은 실시간 애플리케이션에서 탁월합니다. 이 모델은 반응형 AI 지원이 필요한 비용에 민감한 프로덕션 배포 및 에이전트 시스템에 이상적입니다.

다른 큰 언어 모델과 마찬가지로 Claude Haiku 4.5 출력은 일부 사실을 생략하고 때때로 거짓 정보를 생성할 수 있습니다. Databricks는 정확도가 특히 중요한 시나리오에서 RAG(검색 보강 생성)를 사용하는 것이 좋습니다.

이 엔드포인트는 Databricks 보안 경계 내에서 Databricks에 의해 호스팅됩니다.

Anthropic Claude 소네트 5

중요하다

엔드포인트 이름: databricks-claude-sonnet-5

지원되는 입력: 텍스트, 이미지

비고

Claude Sonnet 5는 또는 temperaturetop_p 샘플링 매개 변수를 top_k지원하지 않습니다. 이러한 매개 변수를 포함하는 요청은 400 오류를 반환합니다.

Claude Sonnet 5는 코딩, 에이전트 워크플로 및 대규모 전문 작업을 위해 설계된 Anthropic 가장 유능한 Sonnet 모델입니다. 거의 Opus 수준 인텔리전스와 Sonnet의 비용 효율성 및 속도를 결합하여 고객 관련 에이전트, 프로덕션 코딩 워크플로 및 정교한 콘텐츠 생성 작업에 적합합니다.

다른 큰 언어 모델과 마찬가지로 Claude Sonnet 5 출력은 일부 사실을 생략하고 때때로 거짓 정보를 생성할 수 있습니다. Databricks는 정확도가 특히 중요한 시나리오에서 RAG(검색 보강 생성)를 사용하는 것이 좋습니다.

이 엔드포인트는 Databricks 보안 경계 내에서 Databricks에 의해 호스팅됩니다.

인류 클로드 소네트 4.6

중요하다

엔드포인트 이름: databricks-claude-sonnet-4-6

지원되는 입력: 텍스트, 이미지

Claude Sonnet 4.6은 Anthropic의 가장 고급 하이브리드 추론 모델입니다. 작업의 복잡성에 따라 심층 추론을 위해 거의 즉각적인 응답과 확장된 사고의 두 가지 모드를 제공합니다. Claude Sonnet 4.6은 고객 지향 에이전트, 프로덕션 코딩 워크플로 및 대규모 콘텐츠 생성과 같은 실용적인 처리량과 고급 사고의 균형을 필요로 하는 애플리케이션을 전문으로 합니다.

다른 큰 언어 모델과 마찬가지로 Claude Sonnet 4.6 출력은 일부 사실을 생략하고 때때로 거짓 정보를 생성할 수 있습니다. Databricks는 정확도가 특히 중요한 시나리오에서 RAG(검색 보강 생성)를 사용하는 것이 좋습니다.

이 엔드포인트는 Databricks 보안 경계 내에서 Databricks에 의해 호스팅됩니다.

인류 클로드 소네트 4.5

중요하다

엔드포인트 이름: databricks-claude-sonnet-4-5

지원되는 입력: 텍스트, 이미지

Claude Sonnet 4.5는 Anthropic의 가장 고급 하이브리드 추론 모델입니다. 작업의 복잡성에 따라 심층 추론을 위해 거의 즉각적인 응답과 확장된 사고의 두 가지 모드를 제공합니다. Claude Sonnet 4.5는 고객 지향 에이전트, 프로덕션 코딩 워크플로 및 대규모 콘텐츠 생성과 같은 실용적인 처리량과 고급 사고의 균형을 필요로 하는 애플리케이션을 전문으로 합니다.

다른 큰 언어 모델과 마찬가지로 Claude Sonnet 4.5 출력은 일부 사실을 생략하고 때때로 거짓 정보를 생성할 수 있습니다. Databricks는 정확도가 특히 중요한 시나리오에서 RAG(검색 보강 생성)를 사용하는 것이 좋습니다.

이 엔드포인트는 Databricks 보안 경계 내에서 Databricks에 의해 호스팅됩니다.

Anthropic Claude Fable 5

중요하다

Claude Fable 5의 경우 신뢰와 안전을 위해 프롬프트 및 응답이 30일 동안 유지됩니다. 이 데이터는 자동화된 안전 시스템에서 처리되며 특정 상황에서는 사용자 검토를 위해 플래그가 지정될 수 있습니다. 데이터는 안전 조사 또는 30일 이후 데이터를 보존하기 위한 법적 요구 사항을 제외하고 30일 후에 자동으로 삭제됩니다. Anthropic 이 안전 보존 목적을 위한 제한된 하위 프로세서입니다.

엔드포인트 이름: databricks-claude-fable-5

지원되는 입력: 텍스트

Claude Fable 5는 자율 지식 작업 및 코딩을 위해 설계된 Anthropic 신화급 모델입니다. 강력한 보호 기능이 내장되어 있으므로 이전 모델보다 사용자 체크 인에 대한 필요성이 적은 장기 실행, 복잡하고 비동기 작업을 처리할 수 있으므로 확장된 컨텍스트에서 지속적인 포커스가 필요한 에이전트 워크플로에 적합합니다.

다른 큰 언어 모델과 마찬가지로 Claude Fable 5 출력은 일부 사실을 생략하고 때때로 거짓 정보를 생성할 수 있습니다. Databricks는 정확도가 특히 중요한 시나리오에서 RAG(검색 보강 생성)를 사용하는 것이 좋습니다.

이 엔드포인트는 Databricks 보안 경계 내에서 Databricks에 의해 호스팅됩니다.

Anthropic Claude Opus 4.8

중요하다

엔드포인트 이름: databricks-claude-opus-4-8

지원되는 입력: 텍스트, 이미지

Claude Opus 4.8은 정확도, 효율성 및 추론 기능이 더욱 개선된 Opus 시리즈를 기반으로 하는 Anthropic 가장 유능한 하이브리드 추론 모델입니다. 이 모델은 이미지 지원을 통해 복잡한 추출 및 에이전트 추론 작업에 탁월하므로 심층 분석, 문서 이해 및 정교한 다단계 워크플로가 필요한 엔터프라이즈 애플리케이션에 이상적입니다.

다른 큰 언어 모델과 마찬가지로 Claude Opus 4.8 출력은 일부 사실을 생략하고 때때로 거짓 정보를 생성할 수 있습니다. Databricks는 정확도가 특히 중요한 시나리오에서 RAG(검색 보강 생성)를 사용하는 것이 좋습니다.

이 엔드포인트는 Databricks 보안 경계 내에서 Databricks에 의해 호스팅됩니다.

인류 클로드 오푸스 4.7

중요하다

엔드포인트 이름: databricks-claude-opus-4-7

지원되는 입력: 텍스트, 이미지

Claude Opus 4.7은 Anthropic의 가장 유능한 하이브리드 추론 모델로, 향상된 정확도, 효율성 및 향상된 비전 기능으로 Opus 시리즈를 발전시켰습니다. 이 모델은 이전 모델보다 적은 출력 토큰을 사용하는 동시에 복잡한 추출 및 에이전트 추론 작업에 대해 더 강력한 성능을 제공합니다. Claude Opus 4.7은 100만 개의 토큰 컨텍스트 창과 향상된 이미지 해상도 지원을 제공하므로 심층 분석, 문서 이해 및 정교한 다단계 워크플로가 필요한 엔터프라이즈 애플리케이션에 이상적입니다.

다른 큰 언어 모델과 마찬가지로 Claude Opus 4.7 출력은 일부 사실을 생략하고 때때로 거짓 정보를 생성할 수 있습니다. Databricks는 정확도가 특히 중요한 시나리오에서 RAG(검색 보강 생성)를 사용하는 것이 좋습니다.

이 엔드포인트는 Databricks 보안 경계 내에서 Databricks에 의해 호스팅됩니다.

인류 클로드 오푸스 4.6

중요하다

엔드포인트 이름: databricks-claude-opus-4-6

지원되는 입력: 텍스트, 이미지

Claude Opus 4.6은 적응형 사고 기능을 갖춘 인류의 가장 유능한 하이브리드 추론 모델입니다. 이 모델은 가장 까다로운 작업에 대해 새로운 최대 작업 수준을 도입하며, 높은 노력이 최적의 성능을 위한 기본값으로 설정됩니다. Claude Opus 4.6은 복잡한 추론, 심층 분석, 코드 생성, 연구 및 정교한 다단계 워크플로에 탁월합니다. 100만 개의 토큰 컨텍스트 창을 제공하므로 광범위한 분석과 포괄적인 출력이 모두 필요한 엔터프라이즈 애플리케이션에 적합합니다.

다른 큰 언어 모델과 마찬가지로 Claude Opus 4.6 출력은 일부 사실을 생략하고 때때로 거짓 정보를 생성할 수 있습니다. Databricks는 정확도가 특히 중요한 시나리오에서 RAG(검색 보강 생성)를 사용하는 것이 좋습니다.

이 엔드포인트는 Databricks 보안 경계 내에서 Databricks에 의해 호스팅됩니다.

인류 클로드 오푸스 4.5

중요하다

엔드포인트 이름: databricks-claude-opus-4-5

지원되는 입력: 텍스트, 이미지

Claude Opus 4.5는 심층 분석 및 확장된 사고를 필요로 하는 가장 복잡한 작업을 위해 빌드된 인류의 가장 유능한 하이브리드 추론 모델입니다. 이 모델은 강력한 범용 기능을 고급 추론과 결합하여 코드 생성, 연구, 콘텐츠 만들기 및 정교한 다단계 에이전트 워크플로에서 뛰어난 성능을 발휘합니다. Claude Opus 4.5는 200K 토큰 컨텍스트 창을 사용하여 텍스트 및 비전 입력을 지원하므로 폭과 깊이를 모두 요구하는 엔터프라이즈 애플리케이션에 이상적입니다.

다른 큰 언어 모델과 마찬가지로 Claude Opus 4.5 출력은 일부 사실을 생략하고 때때로 거짓 정보를 생성할 수 있습니다. Databricks는 정확도가 특히 중요한 시나리오에서 RAG(검색 보강 생성)를 사용하는 것이 좋습니다.

이 엔드포인트는 Databricks 보안 경계 내에서 Databricks에 의해 호스팅됩니다.

인류 클로드 소네트 4

중요하다

엔드포인트 이름: databricks-claude-sonnet-4

지원되는 입력: 텍스트, 이미지

클로드 소넷 4는 인류가 빌드하고 학습한 최신 하이브리드 추론 모델입니다. 이 모델은 작업의 복잡성에 따라 심층 추론을 위해 거의 즉각적인 응답과 확장된 사고의 두 가지 모드를 제공합니다. Claude Sonnet 4는 코드 개발, 대규모 콘텐츠 분석 및 에이전트 애플리케이션 개발과 같은 다양한 작업에 최적화되어 있습니다.

다른 큰 언어 모델과 마찬가지로 Claude Sonnet 4 출력은 일부 사실을 생략하고 때때로 거짓 정보를 생성할 수 있습니다. Databricks는 정확도가 특히 중요한 시나리오에서 RAG(검색 보강 생성)를 사용하는 것이 좋습니다.

이 엔드포인트는 Databricks 보안 경계 내에서 Databricks에 의해 호스팅됩니다.

인류 클로드 오푸스 4.1

중요하다

엔드포인트 이름: databricks-claude-opus-4-1

지원되는 입력: 텍스트, 이미지

클로드 오푸스 4.1은 인류가 제작하고 학습한 최신 하이브리드 추론 모델입니다. 이 범용 큰 언어 모델은 복잡한 추론 및 엔터프라이즈 규모의 실제 애플리케이션을 위해 설계되었습니다. 200K 토큰 컨텍스트 창과 32K 출력 토큰 기능을 사용하여 텍스트 및 이미지 입력을 지원합니다. 이 모델은 지속적인 사용자 개입 없이 코드 생성, 연구 및 콘텐츠 만들기, 다단계 에이전트 워크플로와 같은 작업에서 탁월합니다.

다른 큰 언어 모델과 마찬가지로 Claude Opus 4.1 출력은 일부 사실을 생략하고 때때로 거짓 정보를 생성할 수 있습니다. Databricks는 정확도가 특히 중요한 시나리오에서 RAG(검색 보강 생성)를 사용하는 것이 좋습니다.

이 엔드포인트는 Databricks 보안 경계 내에서 Databricks에 의해 호스팅됩니다.

GTE Large(En)

엔드포인트 이름: databricks-gte-large-en

지원되는 입력: 텍스트

GTE(일반 텍스트 포함) 는 텍스트를 1024차원 포함 벡터와 8192 토큰의 포함 창에 매핑할 수 있는 텍스트 포함 모델입니다. 이러한 벡터는 LLM의 벡터 인덱스 및 검색, 분류, 질문 답변, 클러스터링 또는 의미 체계 검색과 같은 작업에 사용할 수 있습니다. 이 엔드포인트는 영어 버전의 모델을 제공하며 정규화된 포함을 생성하지 않습니다.

임베딩 모델은 검색 증강 생성(RAG) 사용 사례에서 LLM과 함께 사용할 때 특히 효과적입니다. GTE를 사용하여 LLM에서 사용하기 위한 컨텍스트에서 활용할 수 있는 대량 문서의 관련 텍스트 조각을 찾을 수 있습니다.

BGE Large(En)

엔드포인트 이름: databricks-bge-large-en

지원되는 입력: 텍스트

BAAI BGE(일반 포함) 는 모든 텍스트를 1024차원 포함 벡터 및 512 토큰의 포함 창에 매핑할 수 있는 텍스트 포함 모델입니다. 이러한 벡터는 LLM의 벡터 인덱스 및 검색, 분류, 질문 답변, 클러스터링 또는 의미 체계 검색과 같은 작업에 사용할 수 있습니다. 이 엔드포인트는 영어 버전의 모델을 제공하고 정규화된 포함을 생성합니다.

임베딩 모델은 검색 증강 생성(RAG) 사용 사례에서 LLM과 함께 사용할 때 특히 효과적입니다. BGE를 사용하여 LLM의 컨텍스트에서 사용할 수 있는 큰 문서 청크에서 관련 텍스트 조각을 찾을 수 있습니다.

RAG 애플리케이션에서는 명령 매개 변수를 포함하여 검색 시스템의 성능을 향상시킬 수 있습니다. BGE 작성자는 도메인에 따라 성능 영향이 달라질 수 있지만 쿼리 임베딩에 대해 명령 "Represent this sentence for searching relevant passages:"을 시도해 볼 것을 권장합니다.

추가 리소스

피드백

이 페이지가 도움이 되었나요?

Last updated on 2026-07-02