에이전트를 작성하고 Databricks 앱에 배포한 후에는 다음 순서대로 프로덕션으로 이동합니다.
| 페이지 | Description |
|---|---|
| 1. Databricks Apps 에이전트에 대한 CI/CD 설정 | GitHub Actions에서 Databricks Apps 배포를 자동화합니다. 워크로드 ID 페더레이션(수명이 긴 비밀 없음) 및 에이전트 템플릿에 제공된 시작 워크플로를 사용합니다. |
| 2. Databricks 앱 에이전트 부하 테스트 | 에이전트가 유지할 수 있는 최대 QPS를 찾습니다. 에이전트의 mock-LLM 빌드를 대상으로 포화 상태까지 점진적으로 부하를 높이는 부하 테스트를 실행하여 모델 지연 시간의 영향을 배제하고 Databricks Apps 인프라 처리량을 분리해 측정합니다. |
| 3. Unity AI Gateway를 사용하여 LLM 사용 관리 | Unity AI 게이트웨이를 통해 LLM 호출을 라우팅합니다. 에이전트 코드를 수정하지 않고 권한, 앱당 특성 비용, 모델 교환, 트래픽 검사 또는 재생을 중앙 집중화합니다. |
에이전트별이 아닌 일반적인 Databricks 앱 CI/CD에 대해서는 GitHub Actions를 사용한 Databricks 앱용 CI/CD를 참조하세요.