Databricks 앱 에이전트 프로덕션화

에이전트를 작성하고 Databricks 앱에 배포한 후에는 다음 순서대로 프로덕션으로 이동합니다.

페이지 Description
1. Databricks Apps 에이전트에 대한 CI/CD 설정 GitHub Actions에서 Databricks Apps 배포를 자동화합니다. 워크로드 ID 페더레이션(수명이 긴 비밀 없음) 및 에이전트 템플릿에 제공된 시작 워크플로를 사용합니다.
2. Databricks 앱 에이전트 부하 테스트 에이전트가 유지할 수 있는 최대 QPS를 찾습니다. 에이전트의 mock-LLM 빌드를 대상으로 포화 상태까지 점진적으로 부하를 높이는 부하 테스트를 실행하여 모델 지연 시간의 영향을 배제하고 Databricks Apps 인프라 처리량을 분리해 측정합니다.
3. Unity AI Gateway를 사용하여 LLM 사용 관리 Unity AI 게이트웨이를 통해 LLM 호출을 라우팅합니다. 에이전트 코드를 수정하지 않고 권한, 앱당 특성 비용, 모델 교환, 트래픽 검사 또는 재생을 중앙 집중화합니다.

에이전트별이 아닌 일반적인 Databricks 앱 CI/CD에 대해서는 GitHub Actions를 사용한 Databricks 앱용 CI/CD를 참조하세요.