Unity 카탈로그란?

Unity 카탈로그는 Azure Databricks 기본 제공되는 통합 거버넌스 계층입니다. 작업 영역에 대해 사용하도록 설정된 경우 Unity 카탈로그는 작업 영역의 모든 데이터 상호 작용 아래에서 자동으로 작동합니다. 즉, 테이블을 쿼리할 때 액세스 제어를 적용하고, 데이터가 이동함에 따라 계보를 추적하고, 감사를 위한 활동 로깅 등을 수행합니다. Unity 카탈로그가 Catalog Explorer, SQL, Azure Databricks CLI 및 REST API를 통해 관리하는 개체를 사용해 작업합니다.

Unity 카탈로그는 2023년 11월 9일 이후에 만든 모든 Azure Databricks 작업 영역에 대해 자동으로 사용하도록 설정됩니다.

Unity 카탈로그는 오픈 소스 구현으로도 사용할 수 있습니다. 공지 블로그 및 공용 Unity 카탈로그 GitHub 리포지토리를 참조하세요.

Unity 카탈로그 개체 모델

Unity 카탈로그에서 관리하는 모든 자산은 사용자, 서비스 주체 또는 그룹에 권한을 부여할 수 있는 개체인 보안 개체로 모델링됩니다. 테이블, 뷰, 볼륨, 함수 및 모델과 같은 데이터 자산은 3단계 네임스페이스(catalog.schema.object)를 따릅니다. 테이블과 볼륨은 관리형일 수도 있으며, 이 경우 Unity Catalog가 거버넌스와 기본 파일 스토리지의 수명 주기를 모두 처리합니다. 또는 외부일 수도 있으며, 이 경우 Unity Catalog는 거버넌스만 처리합니다. 스토리지 자격 증명, 외부 위치, 연결 및 공유와 같은 다른 개체는 메타스토어 바로 아래에 있습니다.

Unity Catalog 개체 모델 다이어그램

다음 페이지에서는 핵심 Unity 카탈로그 개념 및 워크플로를 자세히 설명합니다.

주제 Description
보호 가능한 개체 Unity 카탈로그 계층 구조의 각 개체 유형과 사용 권한이 적용되는 방법에 대해 알아봅니다.
관리되는 자산과 외부 자산 관리 테이블과 외부 테이블 및 볼륨 간의 차이점과 각 테이블의 사용 시기를 이해합니다.
요구 사항 및 제한 사항 컴퓨팅 요구 사항, 지원되는 파일 형식, 명명 제약 조건 및 알려진 제한 사항을 검토합니다.

Unity 카탈로그 기능

Unity 카탈로그는 데이터 및 AI 환경의 모든 차원을 관리하기 위한 기본 제공 도구를 제공합니다. 다음 항목에서는 주요 기능 영역을 다룹니다.

주제 Description
액세스 제어 권한, 특성 기반 정책, 행 및 열 필터 및 작업 영역 바인딩을 사용하여 액세스할 수 있는 사용자를 관리합니다.
데이터 검색 Unity 카탈로그에 등록된 데이터 및 AI 자산을 검색하고 관리하기 위한 Azure Databricks UI인 카탈로그 탐색기를 사용하여 보안 개체와 상호 작용합니다.
데이터 계보 데이터가 원본에서 최종 보기 및 대시보드로 흐르고 변환되는 방식을 자동으로 추적합니다.
회계 감사 감사 로그 시스템 테이블을 사용하여 모든 데이터 액세스 및 시스템 작업의 전체 레코드를 유지 관리합니다.
데이터 분류 카탈로그에서 중요한 데이터를 자동으로 분류하고 태그를 지정합니다.
데이터 품질 모니터링 다운스트림 소비자에게 도달하기 전에 변칙을 catch하는 기본 제공 프로파일링 및 경고를 사용하여 데이터 상태를 사전에 추적합니다.
데이터 공유 개방형 델타 공유 프로토콜을 사용하여 조직 및 클라우드 간에 라이브 데이터 및 AI 자산을 안전하게 공유합니다.
AI 거버넌스 Unity 카탈로그 및 AI 게이트웨이를 사용하여 AI 자산 및 AI 트래픽을 관리합니다.

Get started

다음 리소스는 Unity 카탈로그를 시작하는 데 도움이 됩니다. 2023년 11월 9일 이후에 작업 영역을 만든 경우 Unity 카탈로그에서 자동으로 사용하도록 설정됩니다.

주제 Description
Unity 카탈로그 시작 Unity 카탈로그가 작업 영역에 대해 이미 사용하도록 설정되어 있는지 확인하고 첫 번째 카탈로그, 스키마 및 데이터 액세스 제어를 구성합니다.
Unity 카탈로그 업그레이드 아직 Unity 카탈로그를 사용하지 않는 작업 영역을 업그레이드하는 방법을 알아봅니다.

추가 리소스