Document Intelligence Studio 사용

완료됨

Tip

자세한 내용은 텍스트 및 이미지 탭을 참조하세요.

Azure Document Intelligence Studio는 문서 인텔리전스 서비스의 기능을 시각적으로 탐색, 이해 및 통합하기 위한 온라인 도구입니다. Studio를 사용하여 양식 레이아웃을 분석하고, 미리 빌드된 모델에서 데이터를 추출하고, 시각적 인터페이스를 통해 사용자 지정 모델을 학습할 수 있습니다.

documentintelligence.ai.azure.com Studio에 액세스할 수 있습니다.

Document Intelligence Studio 홈페이지를 보여 주는 스크린샷.

스튜디오 기능

Document Intelligence Studio는 다음과 같은 프로젝트 형식을 지원합니다.

  • 문서 분석 모델: 사용자 고유의 문서에 대해 읽기 및 레이아웃 모델을 테스트하여 추출된 텍스트, 테이블 및 구조를 확인합니다.

  • 미리 빌드된 모델: 청구서, 영수증, ID 문서 및 세금 양식과 같은 사용 가능한 미리 빌드된 모델을 사용하여 문서를 분석합니다.

  • 사용자 지정 모델: 사용자 지정 추출 모델 및 사용자 지정 분류자를 빌드, 레이블 지정, 학습 및 테스트합니다.

미리 빌드된 모델을 사용하여 문서 분석

Studio에서 미리 빌드된 모델을 사용하여 문서에서 데이터를 추출하려면 다음을 수행합니다.

  1. Azure Portal에서 Azure Document Intelligence 또는 Foundry Tools 리소스를 만듭니다.
  2. Document Intelligence Studio를 열고 미리 빌드된 모델(예: 청구서, 영수증 또는 ID 문서)을 선택합니다.
  3. 리소스 엔드포인트 및 키를 제공합니다.
  4. 분석하려는 문서에 URL을 업로드하거나 제공합니다.
  5. 추출된 필드와 해당 신뢰도 점수를 검토합니다.

사용자 지정 모델 프로젝트 빌드

Studio를 사용하여 JSON 파일을 수동으로 만들지 않고도 사용자 지정 모델의 레이블 지정, 학습 및 테스트의 전체 프로세스를 처리할 수 있습니다. Studio는 필요한 ocr.jsonlabels.json파일과 fields.json 파일을 자동으로 생성합니다.

개략적인 워크플로는 다음과 같습니다.

  1. Azure Document Intelligence 또는 Foundry 리소스를 만듭니다.
  2. Azure Blob Storage 컨테이너에 5-6개 이상의 샘플 양식을 업로드합니다.
  3. Studio에서 스토리지 컨테이너에 액세스할 수 있도록 CORS(원본 간 리소스 공유)를 구성합니다.
  4. Studio에서 사용자 지정 모델 프로젝트를 만들어 스토리지 컨테이너와 Document Intelligence 리소스를 연결합니다.
  5. Studio의 시각적 인터페이스를 사용하여 샘플 문서의 필드에 레이블을 지정합니다.
  6. 모델을 학습시키고 정확도 메트릭을 검토합니다.
  7. 학습 중에 사용되지 않은 새 문서에 대해 모델을 테스트합니다.

학습 및 사용자 지정 모델 단위 사용 에서 사용자 지정 모델 유형 및 대체 REST API/SDK 학습 워크플로에 대해 자세히 알아봅니다.

추가 기능

Document Intelligence는 추출 시나리오에 따라 사용하도록 설정할 수 있는 선택적 기능을 지원합니다.

역량 설명
고해상도 추출 정확도가 높은 고해상도 문서에서 텍스트를 추출합니다.
수식 추출 문서에서 수식 검색 및 추출
Font 속성 추출 스타일, 두께 및 색과 같은 글꼴 정보를 추출합니다.
바코드 추출 문서에서 바코드를 검색하고 읽습니다.
검색 가능한 PDF 스캔한 문서를 검색 가능한 PDF 파일로 변환합니다.
쿼리 필드 자연어 쿼리를 사용하여 문서에서 특정 필드를 추출합니다.
키 값 쌍 레이아웃 모델을 사용하여 문서에서 키-값 쌍 관계를 추출합니다.

메모

일부 추가 기능으로는 추가 비용이 발생하는 프리미엄 기능이 있습니다. 자세한 내용은 가격 책정 페이지를 확인하세요.

자세히 알아보기