Azure Data Factory 사용하여 Microsoft 365(Office 365)에서 데이터 로드

적용 대상: Azure Data Factory Azure Synapse Analytics

Microsoft Fabric의 데이터 팩토리는 더 간단한 아키텍처, 기본 제공 AI 및 새로운 기능을 갖춘 차세대 Azure 데이터 팩토리입니다. 데이터 통합을 접하는 경우 Fabric Data Factory부터 시작합니다. 기존 ADF 워크로드는 Fabric 업그레이드하여 데이터 과학, 실시간 분석 및 보고 전반에 걸쳐 새로운 기능에 액세스할 수 있습니다.

이 문서에서는 Data Factory Microsoft 365(Office 365)의 데이터를 Azure Blob Storage로 로드하는 방법을 보여 줍니다. 비슷한 단계에 따라 Gen1 또는 Gen2 Azure Data Lake 데이터를 복사할 수 있습니다. 일반적으로 Microsoft 365(Office 365)에서 데이터를 복사하는 Microsoft 365(Office 365 커넥터 문서를 참조하세요.

데이터 팩터리 만들기

  1. 데이터 팩터리를 아직 만들지 않은 경우 Quickstart: Azure 포털을 사용하여 데이터 팩터리를 만들고 Azure Data Factory Studio 단계를 수행하여 만듭니다. 만든 후 Azure 포털에서 데이터 팩터리로 이동합니다.

    Azure Data Factory의 홈 페이지, Open Azure Data Factory Studio 타일과 함께.

  2. 열기 단추를 Azure Data Factory Studio 열기 타일에서 선택하여 별도의 탭에서 데이터 통합 애플리케이션을 시작합니다.

파이프라인을 만듭니다.

  1. 홈페이지에서 오케스트레이션을 선택합니다.

    ADF 홈페이지를 보여 주는 스크린샷

  2. 파이프라인의 일반 탭에서 파이프라인의 이름으로 "CopyPipeline"을 입력합니다.

  3. 활동 도구 상자 > 이동 및 변환 범주 >에서 Copy activity를 도구 상자에서 파이프라인 디자이너 화면으로 끌어서 놓습니다. 활동 이름으로 "CopyFromOffice365ToBlob"를 지정합니다.

참고

원본 및 싱크 연결된 서비스에서 Azure 통합 런타임을 사용하세요. 자체 호스팅 통합 런타임과 관리형 가상 네트워크 통합 런타임은 지원되지 않습니다.

소스 구성

  1. 파이프라인 >원본 탭으로 이동하고 + 새로 만들기를 선택하여 원본 데이터 세트를 만듭니다.

  2. 새 데이터 세트 창에서 Microsoft 365(Office 365)을 선택한 다음, Continue 선택합니다.

  3. 이제 복사 작업 구성 탭에 있습니다. Microsoft 365(Office 365) 데이터 세트 옆에 있는 Edit 단추를 선택하여 데이터 구성을 계속합니다.

    Microsoft 365(Office 365) 데이터 세트 일반 구성을 하십시오.

  4. Microsoft 365(Office 365) 데이터 세트에 대해 열린 새 탭이 표시됩니다. Properties 창의 아래쪽 일반 탭에서 이름에 "SourceOffice365Dataset"를 입력합니다.

  5. 커넥션 탭이 있는 Properties 창으로 이동합니다. 연결된 서비스 텍스트 상자 옆에 있는 + 새로 만들기를 선택합니다.

  6. 새로 연결된 서비스 창에서 이름으로 "Office365LinkedService"를 입력하고 서비스 주체 ID 및 서비스 주체 키를 입력한 다음, 연결을 테스트하고 만들기를 선택하여 연결된 서비스를 배포합니다.

    새 Microsoft 365(Office 365) 연결된 서비스.

  7. 연결된 서비스를 만든 후에 데이터 세트 설정으로 돌아갑니다. Table 옆에 있는 아래 화살표를 클릭하여 Microsoft 365(Office 365) 데이터 세트 목록을 확장하고, 드롭다운 목록에서 "BasicDataSet_v0.Message_v0"를 선택합니다.

    Microsoft 365(Office 365) 데이터셋 테이블을 구성합니다.

  8. 이제 pipeline>Source 탭로 돌아가서 Microsoft 365(Office 365) 데이터 추출에 대한 추가 속성을 계속 구성합니다. 사용자 범위 및 사용자 범위 필터는 Microsoft 365(Office 365)에서 추출하려는 데이터를 제한하기 위해 정의할 수 있는 선택적 조건자입니다. 이러한 설정을 구성하는 방법은 Microsoft 365(Office 365) 데이터 세트 속성 섹션을 참조하세요.

  9. 날짜 필터 중 하나를 선택하고 시작 시간 및 종료 시간 값을 제공해야 합니다.

  10. 스키마 가져오기 탭을 선택하여 메시지 데이터 세트에 대한 스키마를 가져옵니다.

    Microsoft 365(Office 365) 데이터 세트 스키마 구성.

싱크 구성

  1. 파이프라인 >싱크 탭으로 이동하고 + 새로 만들기를 선택하여 싱크 데이터 세트를 만듭니다.

  2. 새 데이터 세트 창에서 Microsoft 365(Office 365)에서 복사할 때 지원되는 대상만 선택됩니다. Azure Blob Storage을 선택하고 이진 형식을 선택한 다음 Continue 선택합니다. 이 자습서에서는 Microsoft 365(Office 365) 데이터를 Azure Blob Storage 복사합니다.

  3. Azure Blob Storage 데이터 세트 옆에 있는 Edit 단추를 선택하여 데이터 구성을 계속합니다.

  4. Properties window의 일반 탭에서, 이름에 "OutputBlobDataset"을 입력합니다.

  5. 커넥션 탭이 있는 Properties 창으로 이동합니다. 연결된 서비스 텍스트 상자 옆에 있는 + 새로 만들기를 선택합니다.

  6. 새로 연결된 서비스 창에서 이름으로 "AzureStorageLinkedService"를 입력하고 인증 방법 드롭다운 목록에서 "서비스 주체"를 선택하고 서비스 엔드포인트, 테넌트 서비스 주체 ID, 서비스 주체 키를 입력한 다음, 저장을 클릭하여 연결된 서비스를 배포합니다. Azure Blob Storage 대한 서비스 주체 인증을 설정하는 방법은 here 참조하세요.

    새 연결된 Blob 서비스

파이프라인 유효성 검사

파이프라인에 대한 유효성을 검사하려면 도구 모음에서 유효성 검사를 선택합니다.

오른쪽 위에서 코드를 클릭하여 파이프라인과 연결된 JSON 코드를 확인할 수도 있습니다.

파이프라인을 게시하다

위쪽 도구 모음에서 모두 게시를 선택합니다. 이 작업은 사용자가 생성된 엔터티(데이터 세트 및 파이프라인)를 Data Factory에 게시합니다.

변경 내용 게시

파이프라인을 수동으로 시작

도구 모음에서 트리거 추가를 선택한 다음, 지금 트리거를 선택합니다. 파이프라인 실행 페이지에서 마침을 선택합니다.

파이프라인 모니터링

왼쪽의 모니터 탭으로 이동합니다. 수동으로 트리거된 파이프라인 실행 현황이 표시됩니다. 작업 열의 링크를 사용하여 활동 세부 정보를 보고 파이프라인을 다시 실행할 수 있습니다.

파이프라인 모니터링

파이프라인 실행과 연결된 활동 실행을 확인하려면 작업 열에서 활동 실행 보기 링크를 선택합니다. 이 예에서는 활동이 하나뿐이므로 목록에 하나의 항목만 표시됩니다. 복사 작업 관련 세부 정보를 확인하려면 작업 열에서 세부 정보 링크(안경 아이콘)를 선택합니다.

활동 모니터링

이 컨텍스트(액세스하려는 데이터 테이블, 데이터를 로드할 대상 계정, 데이터 액세스 요청을 수행하는 사용자 ID의 조합)에 대해 처음으로 데이터를 요청하는 경우, 복사 작업 상태는 진행 중으로 표시됩니다. 그리고 작업에서 "세부 정보" 링크를 선택해야만 상태가 RequestingConsent로 표시됩니다. 데이터 액세스 승인자 그룹의 구성원이 Privileged Access Management에서 요청을 승인해야 데이터 추출을 진행할 수 있습니다.

동의 요청 상태:활동 실행 세부 정보 - 동의 요청

데이터 추출 중 상태:

활동 실행 세부 정보 - 데이터 추출

동의하면 데이터 추출이 계속되며 일정 시간이 지나면 파이프라인 실행이 성공한 것으로 표시됩니다.

파이프라인 모니터링 - 성공

이제 대상 Azure Blob Storage 이동하여 Microsoft 365(Office 365) 데이터가 이진 형식으로 추출되었는지 확인합니다.

Azure Synapse Analytics 지원에 대해 알아보려면 다음 문서로 진행하세요.