매핑 데이터 흐름의 유니온 변환

적용 대상: Azure Data Factory Azure Synapse Analytics

Microsoft Fabric의 데이터 팩토리는 더 간단한 아키텍처, 기본 제공 AI 및 새로운 기능을 갖춘 차세대 Azure 데이터 팩토리입니다. 데이터 통합을 접하는 경우 Fabric Data Factory부터 시작합니다. 기존 ADF 워크로드는 Fabric 업그레이드하여 데이터 과학, 실시간 분석 및 보고 전반에 걸쳐 새로운 기능에 액세스할 수 있습니다.

데이터 흐름은 Azure Data Factory 파이프라인과 Azure Synapse Analytics 파이프라인 모두에서 사용할 수 있습니다. 이 문서는 매핑 데이터 흐름에 적용됩니다. 변환을 접하는 경우 매핑 데이터 흐름을 사용하여 데이터 변환 소개 문서를 참조하세요.

Dataflow Gen2의 동등한 변환(쿼리 추가)은 데이터 흐름 사용자 매핑에 대한 Dataflow Gen2 가이드를 참조하세요.

Union은 여러 데이터 스트림을 하나로 결합하고, 이러한 스트림의 SQL Union을 Union 변환의 새 출력으로 결합합니다. 조인 키가 없어도 각 입력 스트림의 모든 스키마가 데이터 흐름 내에서 결합됩니다.

데이터 흐름의 기존 변환에서 원본 데이터와 스트림을 포함하여 구성된 각 행 옆에 있는 "+" 아이콘을 선택하여 설정 테이블의 n개 스트림을 결합할 수 있습니다.

다음은 매핑 데이터 흐름에서 병합 변환에 대한 간단한 비디오 안내입니다.

통합 변환

이 경우 여러 원본(이 예제에서는 3개의 다른 원본 파일)의 서로 다른 메타데이터를 결합하여 단일 스트림으로 결합할 수 있습니다.

유니언 변환 개요

이렇게 하려면 추가하고자 하는 모든 소스를 포함하여 Union 설정에 행을 더 추가합니다. 일반적인 조회 또는 조인 키는 필요하지 않습니다.

유니온 변환 설정

유니온 다음에 셀렉트 변환을 설정하면, 헤더가 없는 소스에서 이름이 지정되지 않은 필드나 겹치는 필드의 이름을 변경할 수 있습니다. "검사"를 선택하여 세 가지 원본에서 이 예제의 총 열이 132개인 결합된 메타데이터를 확인합니다.

합집합 변환 최종

이름 및 위치

“이름 기준 결합”을 선택하면 각 열 값이 각 데이터 원본의 대응되는 열에 들어가며, 새로 연결된 메타데이터 스키마가 생성됩니다.

"위치별 통합"을 선택하면 각 열 값이 각 해당 원본의 원래 위치로 떨어지면서 각 원본의 데이터가 동일한 스트림에 추가되는 새로운 결합된 데이터 스트림이 생성됩니다.

결합 출력

JoinExists를 비롯한 유사한 변환을 탐색합니다.