이 콘텐츠는 :
v4.0(GA) | 이전 버전:
v3.1(GA)
v3.0(사용 중지)
v2.1(사용 중지)에 적용됩니다.
::: moniker-end
이 콘텐츠는 :
v3.0(사용 중지) | 최신 버전:
v4.0(GA)
v3.1 | 이전 버전:
v2.1(사용 중지)에 적용됩니다.
이 콘텐츠는 :
v2.1 | 최신 버전:
v4.0(GA)에 적용됩니다.
중요
v4.0 2024-11-30 (GA) model compose 작업은 분석을 위한 암시적 분류자 대신 명시적으로 학습된 분류자를 추가합니다. 이전 작성 모델 버전은 작성 사용자 지정 모델 v3.1을 참조 하세요. 현재 구성된 모델을 사용하는 경우 최신 구현으로 업그레이드하는 것이 좋습니다.
구성된 모델이란?
구성된 모델을 사용하면 여러 사용자 지정 모델을 단일 모델 ID로 호출된 구성된 모델로 그룹화할 수 있습니다. 예를 들어 구성 모델에는 공급, 장비 및 가구 구매 주문을 분석하도록 학습된 사용자 지정 모델이 포함될 수 있습니다. 적절한 모델을 수동으로 선택하는 대신, 구성된 모델을 사용하여 각 분석 및 추출에 적절한 사용자 지정 모델을 결정할 수 있습니다.
일부 시나리오에서는 먼저 문서를 분류한 다음 모델에서 필드를 추출하는 데 가장 적합한 모델을 사용하여 문서를 분석해야 합니다. 이러한 시나리오에는 사용자가 문서를 업로드하지만 문서 형식이 명시적으로 알려지지 않은 시나리오가 포함될 수 있습니다. 또 다른 시나리오는 여러 문서를 단일 파일로 함께 스캔하고 처리를 위해 파일을 제출하는 경우일 수 있습니다. 그런 다음 애플리케이션은 구성 요소 문서를 식별하고 각 문서에 가장 적합한 모델을 선택해야 합니다.
이전 버전 model compose 에서는 암시적 분류를 수행하여 제출된 문서를 가장 잘 나타내는 사용자 지정 모델을 결정했습니다.
작업의 2024-11-30(GA) 구현 model compose 은 이전 버전의 암시적 분류를 명시적 분류 단계로 바꾸고 조건부 라우팅을 추가합니다.
새 모델 작성 작업의 이점
새 model compose 작업을 수행하려면 명시적 분류자를 학습해야 하며 몇 가지 이점을 제공합니다.
지속적인 증분 개선. 샘플을 더 추가하고 분류를 증분 방식으로 개선하여 분류자의 품질을 지속적으로 향상시킬 수 있습니다. 이 미세 조정을 통해 문서는 항상 추출을 위해 올바른 모델로 라우팅됩니다.
라우팅을 완전히 제어합니다. 신뢰도 기반 라우팅을 추가하여 문서 유형 및 분류 응답에 대한 신뢰도 임계값을 제공합니다.
작업 중에 문서 특정 문서 유형을 무시합니다. 작업의 이전 구현
model compose에서는 가장 높은 신뢰도 점수가 상대적으로 낮은 경우에도 신뢰도 점수를 기반으로 추출에 가장 적합한 분석 모델을 선택했습니다. 신뢰도 임계값을 제공하거나 분류에서 추출 모델로 알려진 문서 형식을 명시적으로 매핑하지 않으면 특정 문서 유형을 무시할 수 있습니다.동일한 문서 형식의 여러 인스턴스를 분석합니다. 분류자
splitMode옵션과 쌍을 이루는model compose경우 작업은 파일에서 동일한 문서의 여러 인스턴스를 검색하고 파일을 분할하여 각 문서를 독립적으로 처리할 수 있습니다. 사용하면splitMode단일 요청에서 문서의 여러 인스턴스를 처리할 수 있습니다.기능 추가를 지원합니다. 쿼리 필드 또는 바코드와 같은 기능을 분석 모델 매개 변수의 일부로 지정할 수도 있습니다.
할당된 사용자 지정 모델 최대값이 500으로 확장되었습니다. 작업의 새 구현을
model compose사용하면 단일 구성 모델에 최대 500개의 학습된 사용자 지정 모델을 할당할 수 있습니다.
모델 컴포즈 사용 방법
먼저 추출하거나 무시해야 하는 정보가 포함된 샘플을 포함하여 필요한 모든 문서의 샘플을 수집합니다.
폴더 이름이 구성된 모델 정의에서 사용하려는 문서 유형인 폴더에 문서를 구성하여 분류자를 학습시킵니다.
마지막으로 사용하려는 각 문서 형식에 대한 추출 모델을 학습합니다.
분류 및 추출 모델이 학습되면 Document Intelligence Studio, 클라이언트 라이브러리 또는 REST API 를 사용하여 분류 및 추출 모델을 구성된 모델로 구성합니다.
매개 변수를 splitMode 사용하여 파일 분할 동작을 제어합니다.
- 없음. 전체 파일은 단일 문서로 처리됩니다.
- perPage. 파일의 각 페이지는 별도의 문서로 처리됩니다.
- auto. 파일이 자동으로 문서로 분할됩니다.
청구 및 가격 책정
구성된 모델은 개별 사용자 지정 모델과 동일하게 청구됩니다. 가격은 다운스트림 분석 모델에서 분석한 페이지 수를 기반으로 합니다. 청구는 추출 모델로 라우팅된 페이지의 추출 가격을 기반으로 합니다. 명시적 분류 요금이 추가되면 입력 파일의 모든 페이지 분류에 대해 비용이 부과됩니다. 자세한 내용은 문서 인텔리전스 가격 책정 페이지를 참조하세요.
모델 작성 작업 사용
먼저 단일 모델로 작성하려는 모든 모델 ID 목록을 만듭니다.
Studio, REST API 또는 클라이언트 라이브러리를 사용하여 모델을 단일 모델 ID로 작성합니다.
구성된 모델 ID를 사용하여 문서를 분석합니다.
결제
구성된 모델은 개별 사용자 지정 모델과 동일하게 청구됩니다. 가격은 분석된 페이지 수를 기반으로 합니다. 청구는 추출 모델로 라우팅된 페이지의 추출 가격을 기반으로 합니다. 자세한 내용은 문서 인텔리전스 가격 책정 페이지를 참조하세요.
- 개별 사용자 지정 모델 또는 구성된 사용자 지정 모델을 사용하여 문서를 분석하기 위한 가격 책정은 변경되지 않습니다.
구성된 모델 기능
Custom template및custom neural모델은 여러 API 버전에서 단일 구성 모델로 함께 구성될 수 있습니다.응답에는 어떤 작성된 모델이 문서를 분석하는 데 사용되었는지를 나타내는 속성
docType이 포함됩니다.모델의 경우
custom template사용자 지정 템플릿 또는 다른 양식 형식의 변형을 사용하여 구성된 모델을 만들 수 있습니다. 이 작업은 들어오는 양식이 여러 템플릿 중 하나에 속하는 경우에 유용합니다.모델의 경우
custom neural단일 문서 형식의 다양한 변형을 단일 학습 데이터 세트에 추가하고 사용자 지정 신경망 모델을 학습하는 것이 가장 좋습니다. 이model compose작업은 분석을 위해 제출되는 다양한 형식의 문서가 있는 시나리오에 가장 적합합니다.
모델 작성 제한
작업을 사용하면
model compose단일 모델 ID에 최대 500개의 모델을 할당할 수 있습니다. 작성하려는 모델 수가 구성된 모델의 상한을 초과하는 경우 다음 대안 중 하나를 사용할 수 있습니다.사용자 지정 모델을 호출하기 전에 문서를 분류합니다. 코드, 정규식 또는 검색과 같은 소스를 사용하여 읽기 모델을 사용하고 문서에서 추출된 텍스트 및 특정 구를 기반으로 분류를 작성할 수 있습니다.
다양한 구조적, 반구조적 및 비구조적 문서에서 동일한 필드를 추출하려면 딥 러닝 사용자 지정 신경망 모델을 사용하는 것이 좋습니다. 사용자 지정 템플릿 모델과 사용자 지정 신경망 모델 간의 차이점에 대해 자세히 알아봅니다.
작성 모델을 사용하여 문서를 분석하는 것은 단일 모델을 사용하여 문서를 분석하는 것과 동일합니다.
Analyze Document결과는 문서를 분석하기 위해 선택한 구성 요소 모델을 나타내는 속성을 반환합니다docType.이
model compose작업은 현재 레이블로 학습된 사용자 지정 모델에만 사용할 수 있습니다.
구성된 모델 호환성
| 사용자 지정 모델 유형 | v2.1 및 v2.0으로 학습된 모델 | 사용자 지정 템플릿 및 신경망 모델 v3.1 및 v3.0 | 사용자 지정 템플릿 및 신경망 모델 v4.0 2024-11-30 (GA) |
|---|---|---|---|
| 버전 2.1 및 v2.0으로 학습된 모델 | 지원되지 않음 | 지원되지 않음 | 지원되지 않음 |
| 사용자 지정 템플릿 및 신경망 모델 v3.0 및 v3.1 | 지원되지 않음 | 지원 | 지원 |
| 사용자 지정 템플릿 및 신경망 모델 v4.0 | 지원되지 않음 | 지원됨 | 지원 |
이전 버전의 API(v2.1 이하)로 학습된 모델을 작성하려면 동일한 레이블이 지정된 데이터 세트를 사용하여 v3.0 API를 사용하여 모델을 학습시킵니다. 이렇게 추가하면 v2.1 모델을 다른 모델로 구성할 수 있습니다.
API의 v2.1을 사용하여 구성된 모델은 계속 지원되며 업데이트가 필요하지 않습니다.
개발 옵션
Document Intelligence v4.0:2024-11-30(GA) 은 다음 도구, 애플리케이션 및 라이브러리를 지원합니다.
| 기능 | 리소스 |
|---|---|
| 사용자 지정 모델 | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
| 구성된 모델 | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Document Intelligence v3.1:2023-07-31(GA) 은 다음 도구, 애플리케이션 및 라이브러리를 지원합니다.
| 기능 | 리소스 |
|---|---|
| 사용자 지정 모델 | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
| 구성된 모델 | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Document Intelligence v3.0:2022-08-31(GA) 은 다음 도구, 애플리케이션 및 라이브러리를 지원합니다.
| 기능 | 리소스 |
|---|---|
| 사용자 지정 모델 | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
| 구성된 모델 | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Document Intelligence v2.1은 다음 리소스를 지원합니다.
| 기능 | 리소스 |
|---|---|
| 사용자 지정 모델 | • 문서 인텔리전스 레이블 지정 도구 • REST API • 클라이언트 라이브러리 SDK • 문서 인텔리전스 Docker 컨테이너 |
| 구성된 모델 | • Document Intelligence 레이블 지정 도구 • REST API • C# SDK • Java SDK • • Python SDK |
다음 단계
사용자 지정 모델을 만들고 작성하는 방법을 알아봅니다.