문서 인텔리전스 청구서 모델

이 콘텐츠는 :v4.0(GA) | 이전 버전:v3.1(GA)v3.0(사용 중지)v2.1(사용 중지)에 적용됩니다.

::: moniker-end

이 콘텐츠는 다음에 적용됩니다:v3.1 (GA) | 최신 버전:v4.0 (GA) | 이전 버전:v3.0v2.1

이 콘텐츠는 :v3.0(사용 중지) | 최신 버전:v4.0(GA)v3.1 | 이전 버전:v2.1(사용 중지)에 적용됩니다.

이 콘텐츠는 :v2.1 | 최신 버전:v4.0(GA)에 적용됩니다.

문서 인텔리전스 청구서 모델은 강력한 OCR(광학 인식) 기능을 사용하여 판매 청구서, 공과금 및 구매 주문에서 주요 필드 및 품목을 분석하고 추출합니다. 송장은 휴대폰 캡처 이미지, 스캔한 문서 및 디지털 PDF를 비롯한 다양한 형식과 품질일 수 있습니다. API는 청구서 텍스트를 분석하여 고객 이름, 청구 주소, 기한 및 청구 금액과 같은 주요 정보를 추출하고, 이를 구조화된 JSON 데이터 형식으로 반환합니다. 이 모델은 현재 27개 언어로 된 청구서를 지원합니다.

지원되는 문서 유형:

송장
공과금 청구서
판매 주문
구매 주문

자동화된 청구서 처리

자동화된 청구서 처리는 청구 계정 문서에서 키 accounts payable 필드를 추출하는 프로세스입니다. 추출된 데이터에는 검토 및 결제를 위해 귀하의 미지급금(AP) 워크플로와 통합된 청구서의 항목이 포함됩니다. 지금까지 계정 지불 프로세스는 수동으로 수행되므로 시간이 많이 걸립니다. 청구서에서 키 데이터를 정확하게 추출하는 것은 일반적으로 청구서 자동화 프로세스에서 가장 중요한 단계 중 첫 번째이자 가장 중요한 단계 중 하나입니다.

Document Intelligence Studio로 처리된 샘플 청구서:

문서 인텔리전스 샘플 레이블 지정 도구를 사용하여 처리된 샘플 청구서:

샘플 청구서의 스크린샷.

개발 옵션

문서 인텔리전스 v4.0: 2024-11-30 (GA)은 다음 도구, 애플리케이션 및 라이브러리를 지원합니다.

기능	리소스	모델 ID
청구서 모델	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	사전 구축된 인보이스

Document Intelligence v3.1은 다음 도구, 애플리케이션 및 라이브러리를 지원합니다.

기능	리소스	모델 ID
청구서 모델	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	사전 구축된 인보이스

Document Intelligence v3.0은 다음 도구, 애플리케이션 및 라이브러리를 지원합니다.

기능	리소스	모델 ID
청구서 모델	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	사전 구축된 인보이스

Document Intelligence v2.1은 다음 도구, 애플리케이션 및 라이브러리를 지원합니다.

기능	리소스
청구서 모델	• 문서 인텔리전스 레이블 지정 도구 • REST API • 클라이언트 라이브러리 SDK • 문서 인텔리전스 Docker 컨테이너

입력 요구 사항

지원되는 파일 형식은 다음과 같습니다.

모델	Pdf	이미지: JPEG/JPG, PNG, BMP, TIFF, HEIF	Office: Word(DOCX), Excel(XLSX), PowerPoint(PPTX), HTML
읽기	✔	✔	✔
레이아웃	✔	✔	✔
일반 문서	✔	✔
사전 구축된	✔	✔
사용자 지정 추출	✔	✔
사용자 지정 분류	✔	✔	✔

사진 및 스캔: 최상의 결과를 위해 문서당 하나의 명확한 사진 또는 고품질 스캔을 제공합니다.
PDF 및 TIFF: PDF 및 TIFF의 경우 최대 2,000페이지를 처리할 수 있습니다. (무료 계층 구독을 사용하면 처음 두 페이지만 처리됩니다.)
파일 크기: 문서를 분석하기 위한 파일 크기는 유료(S0) 계층의 경우 500MB, 무료(F0) 계층의 경우 4MB입니다.
이미지 차원: 크기는 50픽셀 x 50픽셀에서 10,000픽셀 x 10,000픽셀 사이여야 합니다.
암호 잠금: PDF가 암호로 잠긴 경우 제출하기 전에 잠금을 제거해야 합니다.
텍스트 높이: 추출할 텍스트의 최소 높이는 1024 x 768픽셀 이미지의 경우 12픽셀입니다. 이 차원은 인치당 150개 점의 약 8포인트 텍스트에 해당합니다.
사용자 지정 모델 학습: 학습 데이터의 최대 페이지 수는 사용자 지정 템플릿 모델의 경우 500개, 사용자 지정 신경망 모델의 경우 50,000개입니다.
사용자 지정 추출 모델 학습: 학습 데이터의 총 크기는 템플릿 모델의 경우 50MB, 신경망 모델의 경우 1GB입니다.
사용자 지정 분류 모델 학습: 학습 데이터의 총 크기는 1GB이며 최대 10,000페이지입니다. 2024-11-30(GA)의 경우 학습 데이터의 총 크기는 2GB이며 최대 10,000페이지입니다.
Office 파일 형식(DOCX, XLSX, PPTX) : 최대 문자열 길이 제한은 8백만 자입니다.

지원되는 파일 형식: JPEG, PNG, PDF 및 TIFF.
지원되는 PDF 및 TIFF는 최대 2,000페이지가 처리됩니다. 무료 계층 구독자의 경우 처음 두 페이지만 처리됩니다.
지원되는 파일 크기는 50MB 미만이어야 하며 크기는 50 x 50픽셀 이상, 최대 10,000 x 10,000픽셀이어야 합니다.

청구서 모델 데이터 추출

고객 정보, 공급업체 세부 정보 및 품목을 포함한 데이터가 청구서에서 추출되는 방법을 확인합니다. 다음 리소스가 필요합니다.

Azure 구독: 무료로 하나를 만들 수 있습니다.
Azure 포털의 Document Intelligence 인스턴스. 무료 가격 책정 계층(F0)을 사용하여 서비스를 사용해 볼 수 있습니다. 리소스가 배포된 후 리소스로 이동하여 키와 엔드포인트를 가져옵니다.

Azure 포털에서 키 및 엔드포인트 위치의 스크린샷

Document Intelligence Studio 홈페이지에서 청구서를 선택합니다.
샘플 청구서를 분석하거나 사용자 고유의 파일을 업로드할 수 있습니다.
분석 실행 단추를 선택하고 필요한 경우 분석 옵션을 구성합니다.

Document Intelligence Studio 사용해 보기

문서 인텔리전스 샘플 레이블 지정 도구

문서 인텔리전스 샘플 도구로 이동합니다.
샘플 도구 홈페이지에서 미리 빌드된 모델 사용을 선택하여 데이터 타일을 가져옵니다 .
드롭다운 메뉴에서 분석할 양식 유형을 선택합니다.
아래 옵션에서 분석하려는 파일의 URL을 선택합니다.
원본 필드의 드롭다운 메뉴에서 URL을 선택하고, 선택한 URL을 붙여넣고, 가져오기 단추를 선택합니다.
문서 인텔리전스 서비스 엔드포인트 필드에 문서 인텔리전스 구독을 사용하여 얻은 엔드포인트를 붙여넣습니다.
키 필드에 문서 인텔리전스 리소스에서 가져온 키를 붙여넣습니다.
분석 실행을 선택합니다. 문서 인텔리전스 샘플 레이블 지정 도구는 미리 빌드된 분석 API를 호출하고 문서를 분석합니다.
결과 보기 - 추출된 키-값 쌍, 줄 항목, 강조 표시된 텍스트 추출 및 검색된 테이블을 참조하세요.

참고

샘플 레이블 지정 도구는 BMP 파일 형식을 지원하지 않습니다. 이는 문서 인텔리전스 서비스가 아닌 도구의 제한 사항입니다.

지원되는 언어 및 로캘

지원되는 언어의 전체 목록은 미리 빌드된 모델 언어 지원 페이지를 참조하세요.

필드 추출

지원되는 문서 추출 필드의 경우 GitHub 샘플 리포지토리의 인보이스 모델 스키마 페이지를 참조하세요.
추출된 청구서 키-값 쌍 및 품목은 JSON 출력의 documentResults 섹션에 있습니다.

키-값 쌍

미리 빌드된 청구서 모델은 키-값 쌍의 선택적 반환을 지원합니다. 기본적으로 키-값 쌍의 반환은 사용하지 않도록 설정됩니다. 키-값 쌍은 레이블 또는 키와 관련 응답 또는 값을 식별하는 청구서 내의 특정 범위입니다. 청구서에서 이러한 쌍은 해당 필드 또는 전화 번호에 대해 사용자가 입력한 레이블 및 값일 수 있습니다. AI 모델은 다양한 문서 유형, 형식 및 구조를 기반으로 식별 가능한 키와 값을 추출하도록 학습됩니다.

키는 모델이 연결된 값 없이 또는 선택적 필드를 처리할 때 키가 존재하는 것을 감지할 때 격리 상태로 존재할 수도 있습니다. 예를 들어 일부 경우에는 폼에 중간 이름 필드를 비워 둘 수 있습니다. 키-값 쌍은 항상 문서에 포함된 텍스트 범위입니다. 고객/사용자와 같은 다양한 방법으로 동일한 값이 설명되는 문서의 경우 연결된 키는 고객 또는 사용자(컨텍스트 기반)입니다.

JSON 출력

JSON 출력에는 다음 세 부분이 있습니다.

"readResults" 노드에는 인식된 모든 텍스트와 선택 표시가 포함됩니다. 텍스트는 페이지, 줄, 개별 단어로 구성됩니다.
"pageResults" 노드에는 경계 상자, 신뢰도 및 readResults의 줄과 단어에 대한 참조로 추출된 테이블과 셀이 포함됩니다.
"documentResults" 노드에는 모델이 검색한 청구서별 값 및 품목이 포함됩니다. 청구서의 모든 필드를 찾을 수 있습니다. 여기에는 청구서 ID, 배송지, 청구지, 고객, 총액, 품목, 기타 여러 항목이 포함됩니다.

마이그레이션 가이드

문서 인텔리전스 v3.1 마이그레이션 가이드에 따라 애플리케이션 및 워크플로에서 v3.0 버전을 사용하는 방법을 알아봅니다.