중요합니다
이 기능은 공개 미리보기 단계에 있습니다.
메모
Azure Databricks Excel 추가 기능은 Azure Government 또는 Azure 중국 지역에서 사용할 수 없습니다.
Azure Databricks Excel 추가 기능은 Azure Databricks 작업 영역을 Microsoft Excel 연결하여 관리되는 Lakehouse 데이터를 스프레드시트로 직접 가져와 데이터에서 의사 결정으로 더 빠르게 이동할 수 있도록 합니다.
이 페이지에서는 Azure Databricks Excel 추가 기능을 사용하여 Excel Azure Databricks 데이터를 가져오고 분석하는 방법을 설명합니다. SQL 지식이 필요하지 않은 직관적인 인터페이스를 통해 Azure Databricks 테이블을 찾아서 가져올 수 있습니다. 추가 기능은 사용자 지정 SQL 쿼리를 실행할 수 있는 유연성을 제공하지만 선택 사항입니다.
필수 구성 요소
Excel 추가 기능을 사용하기 전에 set up 있는지 확인합니다.
SQL 웨어하우스 선택
사용할 SQL 웨어하우스를 선택합니다.
- Excel Azure Databricks 추가 기능 창의 오른쪽 위에서 드롭다운 메뉴를 클릭합니다.
- 사용할 SQL 웨어하우스를 선택합니다.
Azure Databricks 데이터 가져오기
테이블을 선택하거나 SQL 쿼리를 작성하거나 피벗 테이블을 가져와서 Excel Azure Databricks 데이터를 가져옵니다.
메모
피벗 테이블, SQL 쿼리 및 사용자 지정 함수를 사용하여 Unity 카탈로그 메트릭 뷰를 가져올 수 있습니다.
피벗 테이블 만들기
Excel Unity 카탈로그 테이블 및 뷰에서 피벗 테이블을 만들려면 다음을 수행합니다.
Azure Databricks Excel 추가 기능 창의 새 가져오기 탭에서 데이터 선택을 가져오기 방법으로 선택합니다.
카탈로그에서 피벗 테이블을 만들 테이블을 선택하고 선택을 클릭합니다.
피벗 데이터 확인란을 선택합니다.
필요에 따라 행, 열, 값 및 필터를 구성합니다 .
(선택 사항) 가져오기 샘플을 보려면 미리 보기를 클릭합니다.
(선택 사항) 가져오기에 대한 행 제한을 설정합니다.
결과를 가져옵니다. 다음 중 하나를 선택합니다.
- 저장 및 가져오기를 클릭하여 Excel 통합 문서에서 다시 사용할 쿼리를 저장하고 결과를 가져옵니다.
- 아래쪽 화살표를 클릭한 다음 결과 가져오기 를 클릭하여 쿼리를 저장하지 않고 결과를 가져옵니다. 가져오기 편집을 계속하려면 이 옵션을 사용합니다.
메모
피벗 테이블은 새 시트로만 가져올 수 있습니다.
피벗 테이블에서 Unity 카탈로그 메트릭을 사용하는 경우 Sum(measure)가 결과에 표시될 수 있습니다. 이는 예상되는 동작이며 추가 집계가 발생하지 않습니다. Excel 값에 집계 함수가 필요하지만 데이터에 고유 값이 포함되어 있으므로 집계가 발생하지 않습니다.
테이블 선택
데이터는 Excel 표 개체로 가져옵니다. 테이블을 이동하거나 시트 이름을 바꿀 수 있으며 Excel 추가 기능은 새 위치에서 데이터를 새로 고칩니다.
Azure Databricks 테이블에서 데이터를 가져오려면 다음을 수행합니다.
Azure Databricks Excel 추가 기능 창의 새 가져오기 탭에서 데이터 선택을 가져오기 방법으로 선택합니다.
카탈로그 탐색기에서 가져올 테이블을 선택합니다.
을 사용하여 소유자, 인증 상태 및 기타 속성별로 카탈로그를 필터링할 수 있습니다.
선택을 클릭합니다.
열 아래에서 아래쪽 화살표를 클릭하고 가져오지 않을 열의 선택을 취소하거나 모든 열을 선택하여 전체 테이블을 가져옵니다.
(선택 사항) 필터를 설정하려면 + 옆을 클릭하고 필터를 적용할 열을 선택한 다음 필터 조건을 입력합니다. 사용 가능한 필터 목록은 지원되는 필터를 참조하세요.
값이 필요한 필터의 경우 다음 중 하나를 수행할 수 있습니다.
- 값을 입력합니다.
- 사용할 수 있는 최대 75개의 고유 필터 값 목록을 생성하려면 값을 클릭한 다음 필터 값을 가져옵니다. 아래쪽 화살표를 클릭하고 목록에서 하나 이상의 값을 선택합니다.
- 셀 참조를 사용하려면 셀을 클릭하고 셀 또는 셀 범위를 선택한 다음 커서 단추를 클릭합니다.
메모
필터 값에는 쉼표가 포함될 수 없습니다. 쉼표가 포함된 값을 필터링하려면 쓰기 SQL 가져오기 메서드 를 대신 사용합니다.
(선택 사항) 가져오기 샘플을 보려면 미리 보기를 클릭합니다.
(선택 사항) 가져온 행 수를 제한하도록 행 제한을 설정할 수 있습니다.
(선택 사항) 가져온 데이터를 쉽게 식별하려면 가져오기 이름을 입력할 수 있습니다.
출력 대상에서 데이터를 새 시트 또는 현재 시트로 가져오도록 선택합니다. 현재 시트로 가져오면 입력한 셀 참조에서 데이터가 시작됩니다(기본적으로 A1).
결과를 가져옵니다. 다음 중 하나를 선택합니다.
- 저장 및 가져오기를 클릭하여 Excel 통합 문서에서 다시 사용할 쿼리를 저장하고 결과를 가져옵니다.
- 아래쪽 화살표를 클릭한 다음 결과 가져오기 를 클릭하여 쿼리를 저장하지 않고 결과를 가져옵니다. 가져오기 편집을 계속하려면 이 옵션을 사용합니다.
지원되는 필터
테이블을 선택하여 데이터를 가져올 때 필터를 적용하여 결과의 범위를 좁힐 수 있습니다. 다음 표에서는 사용 가능한 각 필터와 예상 입력에 대해 설명합니다.
| 필터 | 예상 입력 | 설명 |
|---|---|---|
IS NULL |
없음 | 열 값이 null인 행을 찾습니다. |
IS NOT NULL |
없음 | 열 값이 null이 아닌 행을 찾습니다. |
EQUALS |
숫자 또는 텍스트 문자열 1개 | 열 값이 지정된 값과 정확히 일치하는 행을 찾습니다. |
NOT EQUALS |
숫자 또는 텍스트 문자열 1개 | 열 값이 지정된 값과 일치하지 않는 행을 찾습니다. |
IN |
쉼표로 구분된 하나 이상의 숫자 또는 텍스트 문자열 | 열 값이 지정된 값과 일치하는 행을 찾습니다. |
NOT IN |
쉼표로 구분된 하나 이상의 숫자 또는 텍스트 문자열 | 열 값이 지정된 값과 일치하지 않는 행을 찾습니다. |
LIKE |
% (모든 문자)와 _ (단일 문자)를 와일드카드로 사용하여 하나의 패턴입니다.%smith 는 "smith"로 끝나는 모든 값과 일치합니다.t_p 는 "tap", "tip" 또는 "top"와 같은 값과 일치합니다. |
열 값이 패턴과 일치하는 행을 찾습니다. 대소문자를 구분합니다. |
NOT LIKE |
% (모든 문자)와 _ (단일 문자)를 와일드카드로 사용하여 하나의 패턴입니다.%test% 는 "test"를 포함하는 값을 제외합니다._at 는 "bat", "cat" 또는 "hat"와 같은 값을 제외합니다. |
열 값이 패턴과 일치하지 않는 행을 찾습니다. 대소문자를 구분합니다. |
ILIKE |
% (모든 문자)와 _ (단일 문자)를 와일드카드로 사용하여 하나의 패턴입니다.%Smith 는 "smith", "Smith" 또는 "SMITH"와 같은 값과 일치합니다._ob 는 "Bob", "rob"와 "Rob" 중 하나와 일치합니다. |
열 값이 패턴과 일치하는 행을 찾습니다. 대소문자 구분 안 함. |
STARTS WITH |
하나의 텍스트 문자열 | 열 값이 지정된 텍스트로 시작하는 행을 찾습니다. |
ENDS WITH |
하나의 텍스트 문자열 | 열 값이 지정된 텍스트로 끝나는 행을 찾습니다. |
CONTAINS |
하나의 텍스트 문자열 | 열 값에 문자열의 아무 곳이나 지정된 텍스트가 포함된 행을 찾습니다. |
SQL 쿼리 작성
Write SQL 가져오기 메서드는 SQL 함수 및 저장 프로시저를 지원합니다.
Azure Databricks 작업 영역에 대해 사용자 지정 SQL 쿼리를 실행하려면 다음을 수행합니다.
Azure Databricks Excel 추가 기능 창의
새 가져오기 탭에서Import 메서드 >로Write SQL를 선택합니다. 쿼리의 이름을 입력하여 나중에 식별합니다.
새 쿼리를 작성하거나 Azure Databricks 작업 영역에서 기존 쿼리를 사용합니다.
편집기에서 SQL 쿼리를 작성합니다. 액세스 권한이 있는 Unity 카탈로그의 모든 테이블을 쿼리할 수 있습니다.
-
을 클릭합니다. 카탈로그 탐색기를 사용하여 스키마 및 테이블을 봅니다.
-
Azure Databricks 작업 영역 또는 Excel 기존 쿼리에서 쿼리를 사용하려면 폴더를
클릭합니다. Azure Databricks 작업 영역에서 기존 쿼리를 사용하는 경우 Excel 편집한 내용은 Azure Databricks 반영되지 않습니다.
메모
쿼리는 Excel에 표시되기 전에 쿼리 편집기에서 저장 단추를 사용하여 Azure Databricks에 명시적으로 저장해야 합니다.
(선택 사항) 쿼리 매개 변수를 추가하려면 매개 변수 옆에 있는 +추가를 클릭합니다. 매개 변수를 클릭하고 매개 변수 이름 및 매개 변수 값을 입력합니다.
- 매개 변수 값의 경우 특정 값을 입력하거나 상자 및 화살표 단추를 클릭하여 셀 참조를 지정할 수 있습니다. 셀 또는 셀 범위를 선택하고 화살표를 클릭하여 매개 변수 값을 자동으로 채웁니다.
출력 대상에서 데이터를 새 시트 또는 현재 시트로 가져오도록 선택합니다. 현재 시트로 가져오면 입력한 셀 참조에서 데이터가 시작됩니다(기본적으로 A1).
쿼리 결과를 미리 보려면 실행을 클릭합니다.
결과를 가져옵니다. 다음 중 하나를 선택합니다.
- 저장 및 가져오기를 클릭하여 Excel 통합 문서에서 다시 사용할 쿼리를 저장하고 결과를 가져옵니다.
- 아래쪽 화살표를 클릭한 다음 결과 가져오기 를 클릭하여 쿼리를 저장하지 않고 결과를 가져옵니다. 가져오기 편집을 계속하려면 이 옵션을 사용합니다.
사용자 지정 함수를 사용하여 쿼리 매개 변수를 추가할 수도 있습니다. SQL 작성을 참조하세요.
Excel 사용자 지정 함수 사용
Excel 추가 기능은 Excel 수식에서 Azure Databricks 데이터를 가져오는 데 사용할 수 있는 사용자 지정 함수를 제공합니다.
테이블 선택
이 함수는 DATABRICKS.Table Unity 카탈로그 테이블에서 데이터를 가져옵니다.
Syntax:
=DATABRICKS.Table(catalog_name.schema_name.table_name, [column1, ...], [limit])
매개 변수:
-
catalog_name.schema_name.table_name(필수): 정규화된 테이블 이름입니다. -
columns(선택 사항): 가져올 열 이름의 배열입니다. 모든 열을 가져오려면 이 매개 변수를 생략합니다. -
limit(선택 사항): 가져올 최대 행 수입니다. 이 매개 변수를 생략하여 최대 10MB 제한까지 모든 행을 가져옵니다.
Example:
=DATABRICKS.Table("main.default.customers", {"customer_id", "customer_name"}, 100)
이 수식은 customer_id 테이블에서 customer_name 열과 main.default.customers 열을 가져오며, 100개의 행으로 제한됩니다.
SQL 작성
이 함수는 DATABRICKS.SQL 쿼리 매개 변수를 사용하고 결과를 반환하는 SQL 쿼리를 실행합니다.
Syntax:
값을 사용하여 매개 변수를 지정합니다.
=DATABRICKS.SQL("query_text", {parameter1_name, parameter1_value; ...})
셀 범위를 사용하여 매개 변수를 지정합니다. 이름과 값 매개 변수는 동일한 행에 있는 셀에 정의되어야 합니다.
=DATABRICKS.SQL("query_text", {param_name_cell: param_value_cell; ...})
매개 변수:
-
query_text(필수): 실행할 SQL 쿼리입니다. -
parameters(필수): 쿼리로 대체할 매개 변수 값의 매핑입니다.
Example:
=DATABRICKS.SQL("SELECT * FROM samples.bakehouse.sales_suppliers WHERE longitude > :long_param AND latitude > :lat_param LIMIT 10", {"long_param",20; "lat_param",10})
=DATABRICKS.SQL("SELECT * FROM samples.bakehouse.sales_suppliers WHERE city = :city", M4:N4)
제공된 매개 변수 값을 사용하여 판매 데이터를 longitude 및 latitude로 필터링하는 쿼리를 실행합니다.
쿼리 관리
가져오기 페이지에서 기존 가져오기를 관리합니다.
기존 가져오기 편집
기존 가져오기를 편집하려면 다음을 수행합니다.
- Excel Azure Databricks 추가 기능 창에서 임포트 탭을 클릭합니다.
- 편집할 임포트를 찾으세요.
- 가져오기 옆에 있는 세 개의 점 메뉴를 클릭합니다.
- 편집을 클릭하여 가져오기를 편집합니다.
데이터 새로 고침
Excel 추가 기능은 가져온 데이터를 자동으로 새로 고치지 않습니다. Azure Databricks 최신 값으로 데이터를 업데이트하려면 다음을 수행합니다.
- 단일 가져오기를 새로 고치려면 다음을 수행합니다.
- Excel Azure Databricks 추가 기능 창에서 임포트 탭을 클릭합니다.
-
을 클릭하여 새로 고치려는 가져오기 옆에 새로 고칩니다.
- 모든 가져오기를 새로 고치려면 다음을 수행합니다.
- Azure Databricks 추가 기능 창에서 모두 새로 고침을 클릭합니다.
추가 기능은 원래 쿼리 또는 테이블 선택을 다시 실행하고 워크시트를 새 데이터로 업데이트합니다.
중요합니다
데이터를 새로 고치면 Excel 추가 기능은 지정된 테이블의 모든 기존 데이터를 지우고 Azure Databricks 최신 데이터를 다시 로드합니다. 새로 고침 프로세스 중에 테이블에 추가한 모든 사용자 지정 열이 삭제됩니다.
의미 공유
Azure Databricks 데이터가 포함된 Excel 통합 문서를 공유하는 경우 다음 데이터 액세스 및 보안 영향을 고려합니다.
가져온 데이터에 대한 가시성
받는 사람이 가져오기를 새로 고치면 추가 기능은 받는 사람의 Unity 카탈로그 권한을 사용합니다. 기본 데이터에 액세스할 수 없는 경우 새로 고침이 실패합니다.
통합 문서에서 데이터 프라이버시가 우려되는 경우 다음 임시 해결책을 사용할 수 있습니다.
- 필요한 모든 수식과 가져오기를 포함하여 통합 문서를 만듭니다.
- 시트에서 가져온 데이터를 삭제합니다.
- 통합 문서를 받는 사람에게 공유하세요.
- 받는 사람에게 데이터를 새로 고치도록 하세요.
받는 사람은 Unity 카탈로그 권한에 따라 액세스할 수 있는 데이터만 볼 수 있습니다.
작업 영역 및 데이터 자산에 대한 액세스
- 통합 문서에서 참조된 Unity 카탈로그 개체에 액세스할 수 없는 사용자는 데이터를 새로 고칠 수 없습니다. 데이터를 새로 고치려면 사용자는 Unity 카탈로그의 기본 테이블 및 뷰에 대한 읽기 권한이 있어야 합니다.
- 사용자는 기존 가져오기를 편집하려면 Azure Databricks 기본 테이블에 액세스할 수 있어야 합니다.
쿼리 표시 유형
통합 문서에 대한 편집 액세스 권한이 있는 사용자는 Unity 카탈로그의 기본 데이터에 액세스할 수 없더라도 Azure Databricks 추가 기능을 통해 데이터를 생성하는 데 사용되는 쿼리를 볼 수 있습니다.
제한점
- 사용자 지정 함수: 사용자 지정 함수의 경우 SQL 실행 API의 제한으로 인해 쿼리 결과가 25MiB로 제한됩니다.
- 데이터 로드: 통합 문서의 셀이 편집 모드인 경우 데이터 로드가 실패할 수 있습니다.
- Excel Desktop 행 제한: Excel Desktop은 시트당 최대 1,048,576개의 행을 지원합니다.
- 웹용 Excel 파일 크기 제한: 웹용 Excel 보기 및 편집을 위해 약 25MB의 최대 통합 문서 파일 크기를 지원합니다.