이 콘텐츠는 :
v4.0(GA) | 이전 버전:
v3.1(GA)
v3.0(사용 중지)
v2.1(사용 중지)에 적용됩니다.
::: moniker-end
이 콘텐츠는 :
v3.0(사용 중지) | 최신 버전:
v4.0(GA)
v3.1 | 이전 버전:
v2.1(사용 중지)에 적용됩니다.
이 콘텐츠는 :
v2.1 | 최신 버전:
v4.0(GA)에 적용됩니다.
참고
미리 빌드된 ID(ID) 모델에 대한 문서 인텔리전스 v4.0 2024-11-30 (GA) API는 이제 북미, 남미, 아시아, 유럽, 아프리카 및 오세아니아에 걸쳐 확장된 범위를 포함하여 전 세계 모든 지역의 식별 문서를 지원합니다.
문서 인텔리전스 ID(ID) 모델은 OCR(광학 문자 인식)과 딥 러닝 모델을 결합하여 ID 문서에서 주요 정보를 분석하고 추출합니다. API는 ID 문서(다음 포함)를 분석하고 구조화된 JSON 데이터 표현을 반환합니다.
| 지역 | 문서 형식 |
|---|---|
| 전세계 | 여권책, 여권카드 |
| 미국 | 운전 면허증, 신분증, 거주 허가증 (그린 카드), 사회 보장 카드, 군인 ID |
| 인도 | 운전 면허증, PAN 카드, 아드하어 카드 |
| 오스트레일리아 | 운전 면허증, 사진 카드, 키 패스 ID(디지털 버전 포함) |
| 기타 | 운전 면허증, 신분증, 거주 허가증 |
Document Intelligence는 미리 빌드된 ID 모델을 사용하여 정부에서 발급한 ID(ID)에서 정보를 분석하고 추출할 수 있습니다. 강력한 OCR(광학 인식) 기능과 ID 인식 기능을 결합하여 전 세계 여권 및 미국 운전 면허증(모든 50개 주 및 DC)에서 주요 정보를 추출합니다. ID API는 이름, 성, 생년월일, 문서 번호 등과 같은 ID 문서에서 주요 정보를 추출합니다. 이 API는 Document Intelligence v2.1에서 클라우드 서비스로 사용할 수 있습니다.
ID 문서 처리
ID 문서 처리에는 수동으로 또는 OCR 기반 기술을 사용하여 ID 문서에서 데이터를 추출하는 작업이 포함됩니다. ID 문서 처리는 ID 증명이 필요한 비즈니스 작업에서 중요한 단계입니다. 예를 들어 은행 및 기타 금융 기관의 고객 확인, 모기지 신청, 의료 방문, 청구 처리, 호스피탈리티 산업 등이 있습니다. 개인은 서비스 및 혜택을 제공하기 전에 비즈니스에서 효율적으로 확인할 수 있도록 운전 면허증, 여권 및 기타 유사한 문서를 통해 신원 증명을 제공합니다.
Document Intelligence Studio에서 처리된 샘플 미국 운전 면허증
데이터 추출
미리 빌드된 ID 서비스는 전 세계 여권 및 미국 운전 면허증에서 주요 값을 추출하여 구조화된 JSON 응답으로 반환합니다.
운전 면허증 예제
Passport 예제
개발 옵션
문서 인텔리전스 v4.0: 2024-11-30 (GA)은 다음 도구, 애플리케이션 및 라이브러리를 지원합니다.
| 기능 | 리소스 | 모델 ID |
|---|---|---|
| ID 문서 모델 | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-idDocument |
Document Intelligence v3.1은 다음 도구, 애플리케이션 및 라이브러리를 지원합니다.
| 기능 | 리소스 | 모델 ID |
|---|---|---|
| ID 문서 모델 | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-idDocument |
Document Intelligence v3.0은 다음 도구, 애플리케이션 및 라이브러리를 지원합니다.
| 기능 | 리소스 | 모델 ID |
|---|---|---|
| ID 문서 모델 | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-idDocument |
Document Intelligence v2.1은 다음 도구, 애플리케이션 및 라이브러리를 지원합니다.
| 기능 | 리소스 |
|---|---|
| ID 문서 모델 | • 문서 인텔리전스 레이블 지정 도구 • REST API • 클라이언트 라이브러리 SDK • 문서 인텔리전스 Docker 컨테이너 |
입력 요구 사항
지원되는 파일 형식은 다음과 같습니다.
| 모델 | 이미지: JPEG/JPG, PNG, BMP, TIFF, HEIF |
Office: Word(DOCX), Excel(XLSX), PowerPoint(PPTX), HTML |
|
|---|---|---|---|
| 읽기 | ✔ | ✔ | ✔ |
| 레이아웃 | ✔ | ✔ | ✔ |
| 일반 문서 | ✔ | ✔ | |
| 사전 구축된 | ✔ | ✔ | |
| 사용자 지정 추출 | ✔ | ✔ | |
| 사용자 지정 분류 | ✔ | ✔ | ✔ |
- 사진 및 스캔: 최상의 결과를 위해 문서당 하나의 명확한 사진 또는 고품질 스캔을 제공합니다.
- PDF 및 TIFF: PDF 및 TIFF의 경우 최대 2,000페이지를 처리할 수 있습니다. (무료 계층 구독을 사용하면 처음 두 페이지만 처리됩니다.)
- 파일 크기: 문서를 분석하기 위한 파일 크기는 유료(S0) 계층의 경우 500MB, 무료(F0) 계층의 경우 4MB입니다.
- 이미지 차원: 크기는 50픽셀 x 50픽셀에서 10,000픽셀 x 10,000픽셀 사이여야 합니다.
- 암호 잠금: PDF가 암호로 잠긴 경우 제출하기 전에 잠금을 제거해야 합니다.
- 텍스트 높이: 추출할 텍스트의 최소 높이는 1024 x 768픽셀 이미지의 경우 12픽셀입니다. 이 차원은 인치당 150개 점의 약 8포인트 텍스트에 해당합니다.
- 사용자 지정 모델 학습: 학습 데이터의 최대 페이지 수는 사용자 지정 템플릿 모델의 경우 500개, 사용자 지정 신경망 모델의 경우 50,000개입니다.
- 사용자 지정 추출 모델 학습: 학습 데이터의 총 크기는 템플릿 모델의 경우 50MB, 신경망 모델의 경우 1GB입니다.
- 사용자 지정 분류 모델 학습: 학습 데이터의 총 크기는 1GB이며 최대 10,000페이지입니다. 2024-11-30(GA)의 경우 학습 데이터의 총 크기는 2GB이며 최대 10,000페이지입니다.
- Office 파일 형식(DOCX, XLSX, PPTX) : 최대 문자열 길이 제한은 8백만 자입니다.
지원되는 파일 형식: JPEG, PNG, PDF 및 TIFF.
PDF 및 TIFF 파일에 지원되는 페이지 수: 최대 2,000페이지 또는 무료 계층 구독자를 위한 처음 두 페이지만 지원됩니다.
지원되는 파일 크기: 총 50MB 미만; 최소 픽셀: 50 x 50 px; 최대 픽셀은 10,000 x 10,000px입니다.
ID 문서 모델 데이터 추출
ID 문서에서 이름, 생년월일 및 만료 날짜를 포함한 데이터를 추출합니다. 다음 리소스가 필요합니다.
Azure 구독: 무료로 하나를 만들 수 있습니다.
Azure 포털의 Document Intelligence 인스턴스. 무료 가격 책정 계층(
F0)을 사용하여 서비스를 사용해 볼 수 있습니다. 리소스가 배포된 후 리소스로 이동하여 키와 엔드포인트를 가져옵니다.
참고
Document Intelligence Studio는 v3.1 및 v3.0 API 이상 버전에서 사용할 수 있습니다.
Document Intelligence Studio 홈페이지에서 ID 문서를 선택합니다.
샘플 청구서를 분석하거나 사용자 고유의 파일을 업로드할 수 있습니다.
분석 실행 단추를 선택하고 필요한 경우 분석 옵션을 구성합니다.
문서 인텔리전스 샘플 레이블 지정 도구
문서 인텔리전스 샘플 도구로 이동합니다.
샘플 도구 홈페이지에서 미리 빌드된 모델 사용을 선택하여 데이터 타일을 가져옵니다 .
드롭다운 메뉴에서 분석할 양식 유형을 선택합니다.
아래 옵션에서 분석하려는 파일의 URL을 선택합니다.
원본 필드의 드롭다운 메뉴에서 URL을 선택하고, 선택한 URL을 붙여넣고, 가져오기 단추를 선택합니다.
문서 인텔리전스 서비스 엔드포인트 필드에 문서 인텔리전스 구독을 사용하여 얻은 엔드포인트를 붙여넣습니다.
키 필드에 문서 인텔리전스 리소스에서 가져온 키를 붙여넣습니다.
분석 실행을 선택합니다. 문서 인텔리전스 샘플 레이블 지정 도구는 미리 빌드된 분석 API를 호출하고 문서를 분석합니다.
결과 보기 - 추출된 키-값 쌍, 줄 항목, 강조 표시된 텍스트 추출 및 검색된 테이블을 참조하세요.
자세한 결과를 보려면 JSON 출력 파일을 다운로드합니다.
- ‘readResults’ 노드에는 페이지의 각 경계 상자 배치가 있는 모든 텍스트 줄이 포함되어 있습니다.
- "selectionMarks" 노드는 모든 선택 표시(확인란, 라디오 표시) 및 해당 상태가 선택 또는선택 취소되었는지 여부를 표시합니다.
- "pageResults" 섹션에는 추출된 테이블이 포함됩니다. 각 테이블에 대해 Document Intelligence는 텍스트, 행 및 열 인덱스, 행 및 열 스패닝, 경계 상자 등을 추출합니다.
- "documentResults" 필드에는 문서의 가장 관련성이 큰 부분에 대한 키/값 쌍 정보 및 품목 정보가 포함됩니다.
참고
샘플 레이블 지정 도구는 BMP 파일 형식을 지원하지 않습니다. 이 제한은 문서 인텔리전스 서비스가 아닌 도구의 제한 사항입니다.
필드 추출
지원되는 문서 추출 필드에 대한 정보는 GitHub 샘플 리포지토리의 ID 문서 모델 스키마 페이지를 참조하십시오.
지원되는 문서 형식
ID 문서 모델은 현재 미국 운전 면허증과 외국 여권의 신상 정보 페이지(비자 및 기타 여행 문서는 제외하고) 추출을 지원합니다.
추출된 필드
| 이름 | 형식 | 설명 | 값 |
|---|---|---|---|
| 국가 | 국가 | ISO 3166 표준을 준수하는 국가 코드 | "USA" |
| 생년월일 | 날짜 | 생년월일은 YYYY-MM-DD 형식으로 작성하세요 | "1980-01-01" |
| 만료일 | 날짜 | 만료 날짜(YYYY-MM-DD 형식) | "2019-05-05" |
| 문서 번호 | 문자열 | 관련 여권 번호, 운전 면허증 번호 등 | "340020013" |
| 이름(성) | 문자열 | 지정된 이름 및 중간 이니셜이 추출되었습니다(해당하는 경우). | "제니퍼" |
| LastName | 문자열 | 추출된 성 | "브룩스" |
| 국적 | 국가 | ISO 3166 표준을 준수하는 국가 코드 | "USA" |
| 섹스 | 성별 | 추출 가능한 값에는 "M" "F" "X"가 포함됩니다. | "F" |
| 기계 판독 가능 영역 | 개체 | 각각 44자인 두 줄을 포함한 여권 MRZ 추출 |
"P<USABROOKS<<제니퍼<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816" |
| DocumentType | 문자열 | 문서 유형(예: Passport, 운전 면허증) | 여권 |
| 주소 | 문자열 | 추출된 주소(운전 면허증에만 해당) | "123 STREET ADDRESS YOUR CITY WA 99999-1234" |
| 지역 | 문자열 | 추출된 지역, 주, 지방 등(운전 면허증만 해당) | "워싱턴" |
마이그레이션 가이드
- 문서 인텔리전스 v3.1 마이그레이션 가이드에 따라 애플리케이션 및 워크플로에서 v3.0 버전을 사용하는 방법을 알아봅니다.
다음 단계
Document Intelligence Studio를 사용하여 사용자 고유의 양식 및 문서를 처리해 보세요.
Document Intelligence 빠른 시작을 완료하고 원하는 개발 언어로 문서 처리 앱을 만들기 시작합니다.
문서 인텔리전스 샘플 레이블 지정 도구를 사용하여 사용자 고유의 양식 및 문서를 처리해 보세요.
Document Intelligence 빠른 시작을 완료하고 원하는 개발 언어로 문서 처리 앱을 만들기 시작합니다.