중요합니다
이 기능은 공개 미리보기 단계에 있습니다.
이 페이지에서는 Lakeflow Designer에서 시각적 데이터 준비로 데이터를 가져오는 데 사용할 수 있는 옵션을 설명합니다. 디자이너는 Azure Databricks 통해 액세스할 수 있는 모든 데이터로 작업할 수 있습니다.
디자이너의 모든 데이터 수집은 원본 연산자에서 시작합니다. 원본 연산자의 구성 창을 열면 다음과 같은 옵션이 있습니다.
기존 테이블 찾아보기
기존 항목 찾아보기를 클릭하여 자산 선택기를 엽니다. 여기서 다음을 수행할 수 있습니다.
- Unity 카탈로그에서 테이블 및 볼륨을 찾아봅니다.
- 작업 영역 파일 시스템에서 파일을 찾습니다.
데이터가 이미 Azure Databricks 있는 경우 이 옵션을 사용합니다.
로컬 파일 끌어서 놓기
CSV 또는 Excel 파일을 로컬 컴퓨터에서 캔버스로 직접 끌어옵니다. 디자이너는 작업 영역 파일 시스템에 파일을 업로드하고 원본 연산자를 자동으로 만듭니다.
메모
Excel 파일을 끌어서 놓려면 Excel 파일 형식 지원을 사용하도록 설정해야 합니다. Excel 파일 읽기를 참조하세요.
파일에서 테이블 만들기
원본 구성 창에서 파일에서 테이블 만들기를 선택하여 로컬 CSV 또는 Excel 파일을 업로드하고 해당 파일에서 Unity 카탈로그 테이블을 만듭니다. 데이터를 작업 영역 파일로 저장하지 않고 관리되는 테이블로 유지하려는 경우 이 옵션을 사용합니다. 또한 많은 양의 데이터의 경우 최상의 성능을 제공합니다.
Google 드라이브에서 가져오기
Google 드라이브에서 파일을 가져오려면 다음을 수행합니다.
- 원본 구성 창에서 Google 드라이브에서 가져오기를 선택합니다.
- Google 드라이브에 대한 액세스 권한이 있는 Unity 카탈로그 연결을 선택합니다.
- 파일 URL을 제공합니다.
이렇게 하려면 Google 드라이브 액세스를 위해 구성된 Unity 카탈로그 연결이 필요합니다. 연결을 설정하는 방법은 Google Drive에서 파일 수집 을 참조하세요.
SharePoint에서 가져오기
SharePoint 파일을 가져오려면 다음을 수행합니다.
- 원본 구성 창에서 SharePoint에서 가져오기를 선택합니다.
- SharePoint 사이트에 대한 액세스 권한이 있는 Unity 카탈로그 연결을 선택합니다.
- 직접 파일 링크를 제공합니다.
Warning
올바른 URL을 얻으려면 SharePoint 파일을 마우스 오른쪽 단추로 클릭하고 Preview를 선택하고 브라우저 주소 표시줄에서 URL을 복사합니다. 공유 링크를 사용하지 마세요.
이렇게 하려면 SharePoint 액세스를 위해 구성된 Unity 카탈로그 연결이 필요합니다. 연결을 설정하는 방법은 SharePoint에서 파일 수집을 참조하세요.
추가 소스에 Lakeflow Connect를 사용
디자이너에서 데이터 원본을 직접 사용할 수 없는 경우 관리되는 커넥터에 대한 Lakeflow Connect 를 확인합니다. Lakeflow Connect는 SaaS 애플리케이션(Salesforce, Workday, HubSpot 등), 데이터베이스, 클라우드 스토리지 및 스트리밍 원본에서 수집을 지원합니다. Lakeflow Connect를 사용하여 데이터를 Unity 카탈로그 테이블에 수집한 후, 디자이너에서 원본으로 사용할 수 있습니다.