Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Dieser Inhalt gilt für:
v4.0 (GA) | Frühere Versionen:
v3.1 (GA)
v3.0 (wird eingestellt)
v2.1 (wird eingestellt)
Dieser Inhalt gilt für:
v3.0 (wird eingestellt) | Neueste Versionen:
v4.0 (GA)
v3.1 | Vorherige Version:
v2.1 (wird eingestellt)
Dieser Inhalt gilt für:
v2.1 | Neueste Version:
v4.0 (GA)
Das Dokumentintelligenz-Belegmodell kombiniert leistungsstarke OCR-Funktionen (Optical Character Recognition) mit Deep Learning-Modellen, um wichtige Informationen aus Verkaufsbestätigungen zu analysieren und zu extrahieren. Belege können von verschiedenen Formaten und Qualität sein, einschließlich gedruckter und handschriftlicher Quittungen. Die API extrahiert wichtige Informationen wie Händlername, Händlertelefonnummer, Transaktionsdatum, Steuern und Transaktionssumme und gibt strukturierte JSON-Daten zurück. Das Belegmodell v4.0 (GA) unterstützt andere Felder, einschließlich ReceiptType, TaxDetails.NetAmount, TaxDetails.DescriptionTaxDetails.Rateund CountryRegion zusammen mit der Mehrwertsteuertabellenextraktion für allgemeine Hotelbestätigungen.
Extraktion von Belegdaten
Die Belegdigitisierung umfasst die Transformation verschiedener Arten von Quittungen, darunter gescannte, fotografierte und gedruckte Kopien, in ein digitales Format für eine optimierte nachgelagerte Verarbeitung. Beispiele hierfür sind Spesenmanagement, Verbraucherverhaltensanalyse, Steuerautomatisierung usw. Die Verwendung der Dokumentintelligenz mit OCR -Technologie (Optische Zeichenerkennung) kann Daten aus diesen verschiedenen Belegformaten extrahieren und interpretieren. Die Dokumentintelligenzverarbeitung vereinfacht den Konvertierungsprozess, verringert aber auch erheblich den erforderlichen Zeit- und Aufwand, wodurch eine effiziente Datenverwaltung und ein Abruf erleichtert wird.
Beispielbestätigung, die mit Document Intelligence Studio verarbeitet wird:
Beispielbestätigung, die mit dem Dokumentintelligenz-Beispielbeschriftungstool verarbeitet wird:
Entwicklungsoptionen
Document Intelligence v4.0: 2024-11-30 (GA) unterstützt die folgenden Tools, Anwendungen und Bibliotheken:
| Feature | Ressourcen | Modell-ID |
|---|---|---|
| Belegmodell | • Document Intelligence Studio • REST-API • C#SDK • Python SDK • Java SDK • JavaScript SDK |
Vorgefertigte Quittung |
Document Intelligence v3.1 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:
| Feature | Ressourcen | Modell-ID |
|---|---|---|
| Belegmodell | • Document Intelligence Studio • REST-API • C#SDK • Python SDK • Java SDK • JavaScript SDK |
Vorkonfigurierte Quittung |
Document Intelligence v3.0 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:
| Feature | Ressourcen | Modell-ID |
|---|---|---|
| Belegmodell | • Document Intelligence Studio • REST-API • C#SDK • Python SDK • Java SDK • JavaScript SDK |
Vorgefertigte Quittung |
Document Intelligence v2.1 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:
| Feature | Ressourcen |
|---|---|
| Belegmodell | • Document Intelligence-Kennzeichnungstool • REST-API • Client-Bibliotheks-SDK • Document Intelligence Docker-Container |
Eingabeanforderungen
Die folgenden Dateiformate werden unterstützt.
| Modell | Bild: JPEG/JPG, PNG, BMP, TIFF, HEIF |
Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML |
|
|---|---|---|---|
| Lesen | ✔ | ✔ | ✔ |
| Gestaltung | ✔ | ✔ | ✔ |
| Allgemeines Dokument | ✔ | ✔ | |
| Vorkonfiguriert | ✔ | ✔ | |
| Benutzerdefinierte Extraktion | ✔ | ✔ | |
| Benutzerdefinierte Klassifizierung | ✔ | ✔ | ✔ |
- Fotos und Scans: Um optimale Ergebnisse zu erzielen, stellen Sie ein klares Foto oder eine qualitativ hochwertige Überprüfung pro Dokument bereit.
- PDFs und TIFFs: Für PDFs und TIFFs können bis zu 2.000 Seiten verarbeitet werden. (Bei einem kostenlosen Abonnement werden nur die ersten beiden Seiten verarbeitet.)
- Dateigröße: Die Dateigröße für die Analyse von Dokumenten beträgt 500 MB für die kostenpflichtige Stufe (S0) und 4 MB für die kostenlose Stufe (F0).
- Bildabmessungen: Die Abmessungen müssen zwischen 50 Pixel x 50 Pixel und 10.000 Pixel x 10.000 Pixel betragen.
- Kennwortsperrungen: Wenn Ihre PDF-Dateien kennwortgesperrt sind, müssen Sie die Sperre vor der Übermittlung entfernen.
- Texthöhe: Die minimale Höhe des zu extrahierenden Texts beträgt 12 Pixel für ein Bild von 1024 x 768 Pixeln. Diese Dimension entspricht einem 8-Punkt-Text bei 150 Punkten pro Zoll.
- Schulung für benutzerdefinierte Modelle: Die maximale Anzahl von Seiten für Schulungsdaten beträgt 500 für das benutzerdefinierte Vorlagenmodell und 50.000 für das benutzerdefinierte neurale Modell.
- Schulung des benutzerdefinierten Extraktionsmodells: Die Gesamtgröße der Schulungsdaten beträgt 50 MB für das Vorlagenmodell und 1 GB für das neurale Modell.
- Schulung des benutzerdefinierten Klassifizierungsmodells: Die Gesamtgröße der Schulungsdaten beträgt 1 GB mit maximal 10.000 Seiten. Für 2024-11-30 (GA) beträgt die Gesamtgröße der Schulungsdaten 2 GB mit maximal 10.000 Seiten.
- Office-Dateitypen (DOCX, XLSX, PPTX):Die maximale Zeichenfolgenlängenbeschränkung beträgt 8 Millionen Zeichen.
- Unterstützte Dateiformate: JPEG, PNG, PDF und TIFF.
- Unterstützte Seitenzuteilung für PDF und TIFF: Document Intelligence kann bis zu 2.000 Seiten für Standardabonnenten oder nur die ersten beiden Seiten für Freistufenabonnenten verarbeiten.
- Unterstützte Dateigröße: weniger als 50 MB; Mindestpixel 50 x 50 px; Maximale Pixel 10.000 x 10.000 px.
Modell zur Datenextraktion von Belegen
Erfahren Sie, wie Document Intelligence Daten extrahiert, einschließlich Uhrzeit und Datum von Transaktionen, Händlerinformationen und Summen aus Quittungen. Sie benötigen die folgenden Ressourcen:
Ein Azure-Abonnement – Sie können eine kostenlos erstellen.
Eine Document Intelligence-Instanz im Azure-Portal. Sie können das kostenlose Preisniveau (
F0) verwenden, um den Dienst zu testen. Nachdem Ihre Ressource bereitgestellt wurde, wählen Sie "Zur Ressource wechseln " aus, um Ihren Schlüssel und Endpunkt abzurufen.
Hinweis
Document Intelligence Studio ist mit v3.1- und v3.0-APIs und höheren Versionen verfügbar.
Wählen Sie auf der Startseite von Document Intelligence Studiodie Option "Bestätigungen" aus.
Sie können den Beispielbeleg analysieren oder Eigene Dateien hochladen.
Wählen Sie die Schaltfläche " Analyse ausführen " aus, und konfigurieren Sie ggf. die Analyseoptionen:
Dokument Intelligenz-Tool für die Beschriftung von Beispielen
Navigieren Sie zum Dokumentintelligenz-Beispieltool.
Wählen Sie auf der Startseite des Beispieltools die Kachel Vordefiniertes Modell zur Datenerfassung verwenden aus.
Wählen Sie den Zu analysierenden Formulartyp aus dem Dropdownmenü aus.
Wählen Sie eine URL für die Datei aus, die Sie aus den folgenden Optionen analysieren möchten:
Wählen Sie im Feld "Quelle " im Dropdownmenü die URL aus, fügen Sie die ausgewählte URL ein, und wählen Sie die Schaltfläche " Abrufen " aus.
Fügen Sie im Feld "Document Intelligence-Dienstendpunkt " den Endpunkt ein, den Sie mit Ihrem Document Intelligence-Abonnement erhalten haben.
Fügen Sie im Schlüsselfeld den Schlüssel ein, den Sie aus Ihrer Document Intelligence-Ressource abgerufen haben.
Wählen Sie "Analyse ausführen" aus. Das Dokument Intelligenz-Tool für die Beschriftung von Beispielen ruft die „Analyze Prebuilt“-API auf und analysiert das Dokument.
Zeigen Sie die Ergebnisse an – sehen Sie sich die extrahierten Schlüsselwertpaare, Zeilenelemente, hervorgehobenen Text, extrahierten Text und erkannte Tabellen an.
Hinweis
Das Beispielbezeichnungstool unterstützt das BMP-Dateiformat nicht. Dies ist eine Einschränkung des Tools, nicht der Dokumentintelligenzdienst.
Unterstützte Sprachen und Gebietsschemas
Eine vollständige Liste der unterstützten Sprachen finden Sie auf unserer vordefinierten Sprachunterstützungsseite für Modelle .
Feldextraktion
Informationen zu unterstützten Dokumentextraktionsfeldern finden Sie auf der Seite receipt-Modellschema in unserem GitHub Beispiel-Repository
| Namen | Typ | Beschreibung | Standardisierte Ausgabe |
|---|---|---|---|
| ReceiptType | Schnur | Art des Verkaufsbelegs | Aufgeschlüsselt |
| MerchantName | Schnur | Name des Händlers, der den Beleg ausgibt | |
| Händlertelefonnummer | Telefonnummer | Aufgeführte Telefonnummer des Händlers | +1 xxx xxx xxxx |
| Händleradresse | Schnur | Angegebene Adresse des Händlers | |
| Transaktionsdatum | Datum | Datum der Ausstellung des Belegs | yyyy-mm-dd |
| Transaktionszeit | Zeit | Zeitpunkt der Ausstellung des Belegs | hh-mm-ss (24-Stunden) |
| Gesamt | Zahl (USD) | Die Gesamttransaktion des Belegs | Gleitkommazahl mit zwei Dezimalstellen |
| Teilsumme | Zahl (USD) | Die Zwischensumme des Belegs, oft vor Steuern | Gleitkommazahl mit zwei Dezimalstellen |
| Steuer | Zahl (USD) | Gesamtsteuer nach Erhalt (häufig Mehrwertsteuer oder gleichwertig). Umbenannt in "TotalTax" in version 2022-06-30. | Gleitkommazahl mit zwei Dezimalstellen |
| Tipp | Zahl (USD) | Vom Käufer eingeschlossener Tipp | Gleitkommazahl mit zwei Dezimalstellen |
| Elemente | Array von Objekten | Extrahierte Positionen mit Name, Menge, Stückpreis und extrahierter Gesamtpreis | |
| Namen | Schnur | Elementbeschreibung. Umbenannt in "Beschreibung" in version 2022-06-30. | |
| Menge | Nummer | Anzahl der einzelnen Artikel | Gleitkommazahl mit zwei Dezimalstellen |
| Preis | Nummer | Individueller Preis jeder Einzelstückeinheit | Gleitkommazahl mit zwei Dezimalstellen |
| Gesamtpreis | Nummer | Gesamtpreis der Position | Gleitkommazahl mit zwei Dezimalstellen |
Migrationshandbuch und REST-API v3.1
- Folgen Sie unserem Dokumentintelligenz v3.1-Migrationshandbuch , um zu erfahren, wie Sie die Version v3.1 in Ihren Anwendungen und Workflows verwenden.
Nächste Schritte
Versuchen Sie, ihre eigenen Formulare und Dokumente mit dem Document Intelligence Studio zu verarbeiten.
Führen Sie eine Schnellstartanleitung für Dokumentintelligenz aus, und beginnen Sie mit dem Erstellen einer Dokumentverarbeitungs-App in der Entwicklungssprache Ihrer Wahl.
Versuchen Sie, Ihre eigenen Formulare und Dokumente mithilfe des Dokument Intelligenz-Stichproben-Bezeichnungstools zu verarbeiten.
Führen Sie eine Schnellstartanleitung für Dokumentintelligenz aus, und beginnen Sie mit dem Erstellen einer Dokumentverarbeitungs-App in der Entwicklungssprache Ihrer Wahl.