Document Intelligence Studio 사용
Tip
자세한 내용은 텍스트 및 이미지 탭을 참조하세요.
Azure Document Intelligence Studio는 문서 인텔리전스 서비스의 기능을 시각적으로 탐색, 이해 및 통합하기 위한 온라인 도구입니다. Studio를 사용하여 양식 레이아웃을 분석하고, 미리 빌드된 모델에서 데이터를 추출하고, 시각적 인터페이스를 통해 사용자 지정 모델을 학습할 수 있습니다.
documentintelligence.ai.azure.com Studio에 액세스할 수 있습니다.
스튜디오 기능
Document Intelligence Studio는 다음과 같은 프로젝트 형식을 지원합니다.
문서 분석 모델: 사용자 고유의 문서에 대해 읽기 및 레이아웃 모델을 테스트하여 추출된 텍스트, 테이블 및 구조를 확인합니다.
미리 빌드된 모델: 청구서, 영수증, ID 문서 및 세금 양식과 같은 사용 가능한 미리 빌드된 모델을 사용하여 문서를 분석합니다.
사용자 지정 모델: 사용자 지정 추출 모델 및 사용자 지정 분류자를 빌드, 레이블 지정, 학습 및 테스트합니다.
미리 빌드된 모델을 사용하여 문서 분석
Studio에서 미리 빌드된 모델을 사용하여 문서에서 데이터를 추출하려면 다음을 수행합니다.
- Azure Portal에서 Azure Document Intelligence 또는 Foundry Tools 리소스를 만듭니다.
- Document Intelligence Studio를 열고 미리 빌드된 모델(예: 청구서, 영수증 또는 ID 문서)을 선택합니다.
- 리소스 엔드포인트 및 키를 제공합니다.
- 분석하려는 문서에 URL을 업로드하거나 제공합니다.
- 추출된 필드와 해당 신뢰도 점수를 검토합니다.
사용자 지정 모델 프로젝트 빌드
Studio를 사용하여 JSON 파일을 수동으로 만들지 않고도 사용자 지정 모델의 레이블 지정, 학습 및 테스트의 전체 프로세스를 처리할 수 있습니다. Studio는 필요한 ocr.jsonlabels.json파일과 fields.json 파일을 자동으로 생성합니다.
개략적인 워크플로는 다음과 같습니다.
- Azure Document Intelligence 또는 Foundry 리소스를 만듭니다.
- Azure Blob Storage 컨테이너에 5-6개 이상의 샘플 양식을 업로드합니다.
- Studio에서 스토리지 컨테이너에 액세스할 수 있도록 CORS(원본 간 리소스 공유)를 구성합니다.
- Studio에서 사용자 지정 모델 프로젝트를 만들어 스토리지 컨테이너와 Document Intelligence 리소스를 연결합니다.
- Studio의 시각적 인터페이스를 사용하여 샘플 문서의 필드에 레이블을 지정합니다.
- 모델을 학습시키고 정확도 메트릭을 검토합니다.
- 학습 중에 사용되지 않은 새 문서에 대해 모델을 테스트합니다.
학습 및 사용자 지정 모델 단위 사용 에서 사용자 지정 모델 유형 및 대체 REST API/SDK 학습 워크플로에 대해 자세히 알아봅니다.
추가 기능
Document Intelligence는 추출 시나리오에 따라 사용하도록 설정할 수 있는 선택적 기능을 지원합니다.
| 역량 | 설명 |
|---|---|
| 고해상도 추출 | 정확도가 높은 고해상도 문서에서 텍스트를 추출합니다. |
| 수식 추출 | 문서에서 수식 검색 및 추출 |
| Font 속성 추출 | 스타일, 두께 및 색과 같은 글꼴 정보를 추출합니다. |
| 바코드 추출 | 문서에서 바코드를 검색하고 읽습니다. |
| 검색 가능한 PDF | 스캔한 문서를 검색 가능한 PDF 파일로 변환합니다. |
| 쿼리 필드 | 자연어 쿼리를 사용하여 문서에서 특정 필드를 추출합니다. |
| 키 값 쌍 | 레이아웃 모델을 사용하여 문서에서 키-값 쌍 관계를 추출합니다. |
메모
일부 추가 기능으로는 추가 비용이 발생하는 프리미엄 기능이 있습니다. 자세한 내용은 가격 책정 페이지를 확인하세요.