이 문서는 프로덕션 작업 스케줄링에 대한 명확하고 구체적인 지침을 제공하는 것을 목표로 합니다. 모범 사례를 사용하면 비용을 절감하고 성능을 개선하며 보안을 강화할 수 있습니다.
| 모범 사례 | 영향 | 문서 |
|---|---|---|
| 작업에 서버리스 컴퓨팅 사용 | 비용: 서버리스 작업에는 클러스터 구성이 필요하지 않습니다. Azure Databricks 자동으로 프로비전 및 크기 조정을 관리합니다. | |
| 가능하면 언제든지 오케스트레이션에 Lakeflow 작업 사용 | Cost: Azure Databricks 워크로드만 오케스트레이션하는 경우 외부 도구를 사용하여 오케스트레이션할 필요가 없습니다. | |
| 프로덕션 작업 실행 시 사용자 계정 대신 서비스 주체 사용 | 보안: 개별 사용자가 작업을 소유한 경우 해당 사용자가 조직을 떠나면 작업이 중단될 수 있습니다. | |
| 클래식 컴퓨팅의 경우: 자동화된 워크플로에 작업 클러스터 사용 | 비용: 작업 클러스터는 대화형 클러스터보다 저렴한 요금으로 청구됩니다. |
|
| 클래식 컴퓨팅의 경우: 장기 실행 클러스터 다시 시작 | 보안: 클러스터를 다시 시작하여 Databricks Runtime에 대한 패치 및 버그 수정을 활용합니다. |
|
| 클래식 컴퓨팅의 경우: 최신 LTS 버전의 Databricks 런타임 사용 | 사용성 및 비용: Azure Databricks 항상 유용성, 성능 및 보안을 위해 Databricks 런타임을 개선합니다. |
|
| 클래식 컴퓨팅의 경우: DBFS 루트에 프로덕션 데이터를 저장하지 마세요. | 보안: DBFS 루트에 데이터가 저장되면 모든 사용자가 액세스할 수 있습니다. |