Document Intelligence-Rechnungsmodell

Dieser Inhalt gilt für:v4.0 (GA) | Frühere Versionen:v3.1 (GA)v3.0 (wird eingestellt)v2.1 (wird eingestellt)

::: moniker-end

Dieser Inhalt gilt für:v3.1 (GA) | Neueste Version:v4.0 (GA) | Frühere Versionen:v3.0v2.1

Dieser Inhalt gilt für:v3.0 (wird eingestellt) | Neueste Versionen:v4.0 (GA)v3.1 | Vorherige Version:v2.1 (wird eingestellt)

Dieser Inhalt gilt für:v2.1 | Neueste Version:v4.0 (GA)

Das Dokumentintelligenzrechnungsmodell verwendet leistungsstarke OCR-Funktionen (Optical Character Recognition), um Wichtige Felder und Positionen aus Verkaufsrechnungen, Hilfsrechnungen und Bestellungen zu analysieren und zu extrahieren. Rechnungen können von verschiedenen Formaten und Qualität sein, einschließlich von Telefon aufgenommenen Bildern, gescannten Dokumenten und digitalen PDF-Dateien. Die API analysiert Rechnungstext; extrahiert wichtige Informationen wie Kundenname, Rechnungsadresse, Fälligkeitsdatum und fälligen Betrag; und gibt eine strukturierte JSON-Datendarstellung zurück. Das Modell unterstützt derzeit Rechnungen in 27 Sprachen.

Unterstützte Dokumenttypen:

Rechnungen
Stromrechnungen
Verkaufsaufträge
Bestellungen

Automatisierte Rechnungsverarbeitung

Die automatisierte Rechnungsverarbeitung ist der Prozess des Extrahierens von Schlüsselfeldern accounts payable aus Abrechnungskontodokumenten. Extrahierte Daten umfassen Positionen aus Rechnungen, die für Überprüfungen und Zahlungen in Ihren Verbindlichkeits-Workflows integriert sind. Historisch gesehen erfolgt die Kreditorenbuchhaltung manuell und ist daher sehr zeitaufwändig. Die genaue Extraktion von Schlüsseldaten aus Rechnungen ist in der Regel der erste und einer der wichtigsten Schritte im Prozess der Rechnungsautomatisierung.

Beispielrechnung, die mit Document Intelligence Studio verarbeitet wird:

Beispielrechnung, die mit dem Dokumentintelligenz-Beispieletikettentool verarbeitet wird:

Screenshot einer Beispielrechnung.

Entwicklungsoptionen

Document Intelligence v4.0: 2024-11-30 (GA) unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature	Ressourcen	Modell-ID
Rechnungsmodell	• Document Intelligence Studio • REST-API • C#SDK • Python SDK • Java SDK • JavaScript SDK	Vorkonfigurierte Rechnung

Document Intelligence v3.1 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature	Ressourcen	Modell-ID
Rechnungsmodell	• Document Intelligence Studio • REST-API • C#SDK • Python SDK • Java SDK • JavaScript SDK	Vorkonfigurierte Rechnung

Document Intelligence v3.0 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature	Ressourcen	Modell-ID
Rechnungsmodell	• Document Intelligence Studio • REST-API • C#SDK • Python SDK • Java SDK • JavaScript SDK	Vorkonfigurierte Rechnung

Document Intelligence v2.1 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature	Ressourcen
Rechnungsmodell	• Tool zur Kennzeichnung von Dokumentenintelligenz • REST-API • SDK der Client-Bibliothek • Document Intelligence-Docker-Container

Eingabeanforderungen

Die folgenden Dateiformate werden unterstützt.

Modell	PDF	Bild: JPEG/JPG, PNG, BMP, TIFF, HEIF	Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Lesen	✔	✔	✔
Gestaltung	✔	✔	✔
Allgemeines Dokument	✔	✔
Vorkonfiguriert	✔	✔
Benutzerdefinierte Extraktion	✔	✔
Benutzerdefinierte Klassifizierung	✔	✔	✔

Fotos und Scans: Um optimale Ergebnisse zu erzielen, stellen Sie ein klares Foto oder eine qualitativ hochwertige Überprüfung pro Dokument bereit.
PDFs und TIFFs: Für PDFs und TIFFs können bis zu 2.000 Seiten verarbeitet werden. (Bei einem kostenlosen Abonnement werden nur die ersten beiden Seiten verarbeitet.)
Dateigröße: Die Dateigröße für die Analyse von Dokumenten beträgt 500 MB für die kostenpflichtige Stufe (S0) und 4 MB für die kostenlose Stufe (F0).
Bildabmessungen: Die Abmessungen müssen zwischen 50 Pixel x 50 Pixel und 10.000 Pixel x 10.000 Pixel betragen.
Kennwortsperrungen: Wenn Ihre PDF-Dateien kennwortgesperrt sind, müssen Sie die Sperre vor der Übermittlung entfernen.
Texthöhe: Die minimale Höhe des zu extrahierenden Texts beträgt 12 Pixel für ein Bild von 1024 x 768 Pixeln. Diese Dimension entspricht einem 8-Punkt-Text bei 150 Punkten pro Zoll.
Schulung für benutzerdefinierte Modelle: Die maximale Anzahl von Seiten für Schulungsdaten beträgt 500 für das benutzerdefinierte Vorlagenmodell und 50.000 für das benutzerdefinierte neurale Modell.
Schulung des benutzerdefinierten Extraktionsmodells: Die Gesamtgröße der Schulungsdaten beträgt 50 MB für das Vorlagenmodell und 1 GB für das neurale Modell.
Schulung des benutzerdefinierten Klassifizierungsmodells: Die Gesamtgröße der Schulungsdaten beträgt 1 GB mit maximal 10.000 Seiten. Für 2024-11-30 (GA) beträgt die Gesamtgröße der Schulungsdaten 2 GB mit maximal 10.000 Seiten.
Office-Dateitypen (DOCX, XLSX, PPTX):Die maximale Zeichenfolgenlängenbeschränkung beträgt 8 Millionen Zeichen.

Unterstützte Dateiformate: JPEG, PNG, PDF und TIFF.
Unterstützte PDF- und TIFF-Dateien ermöglichen die Verarbeitung von bis zu 2.000 Seiten. Für Abonnenten der kostenlosen Ebene werden nur die ersten beiden Seiten verarbeitet.
Die unterstützte Dateigröße muss kleiner als 50 MB sein und mindestens 50 x 50 Pixel und höchstens 10.000 x 10.000 Pixel groß sein.

Datenextraktion des Rechnungsmodells

Erfahren Sie, wie Daten, einschließlich Kundeninformationen, Lieferantendetails und Positionen, aus Rechnungen extrahiert werden. Sie benötigen die folgenden Ressourcen:

Ein Azure-Abonnement – Sie können eine kostenlos erstellen.
Eine Document Intelligence-Instanz im Azure-Portal. Sie können das kostenlose Preisniveau (F0) verwenden, um den Dienst zu testen. Nachdem Ihre Ressource bereitgestellt wurde, wählen Sie "Zur Ressource wechseln " aus, um Ihren Schlüssel und Endpunkt abzurufen.

Screenshot von Schlüsseln und Endpunktstandorten im Azure portal.

Wählen Sie auf der Startseite von Document Intelligence Studiodie Option "Rechnungen" aus.
Sie können die Beispielrechnung analysieren oder Eigene Dateien hochladen.
Wählen Sie die Schaltfläche " Analyse ausführen " aus, und konfigurieren Sie ggf. die Analyseoptionen :

Testen von Document Intelligence Studio

Dokumentintelligenz-Beispiel-Beschriftungstool

Navigieren Sie zum Dokumentintelligenz-Beispieltool.
Wählen Sie auf der Startseite des Beispieltools die Kachel Vordefiniertes Modell zur Datenerfassung verwenden aus.
Wählen Sie den Zu analysierenden Formulartyp aus dem Dropdownmenü aus.
Wählen Sie eine URL für die Datei aus, die Sie aus den folgenden Optionen analysieren möchten:
Wählen Sie im Feld "Quelle " im Dropdownmenü die URL aus, fügen Sie die ausgewählte URL ein, und wählen Sie die Schaltfläche " Abrufen " aus.
Fügen Sie im Feld "Document Intelligence-Dienstendpunkt " den Endpunkt ein, den Sie mit Ihrem Document Intelligence-Abonnement erhalten haben.
Fügen Sie im Schlüsselfeld den Schlüssel ein, den Sie aus Ihrer Document Intelligence-Ressource abgerufen haben.
Wählen Sie "Analyse ausführen" aus. Das Dokumentintelligenz-Beispielbeschriftungstool ruft die Analysevorbau-API auf und analysiert das Dokument.
Zeigen Sie die Ergebnisse an – sehen Sie sich die extrahierten Schlüsselwertpaare, Zeilenelemente, hervorgehobenen Text, extrahierten Text und erkannte Tabellen an.

Hinweis

Das Beispielbezeichnungstool unterstützt das BMP-Dateiformat nicht. Dies ist eine Einschränkung des Tools, nicht der Dokumentintelligenzdienst.

Unterstützte Sprachen und Gebietsschemas

Eine vollständige Liste der unterstützten Sprachen finden Sie auf unserer vordefinierten Seite zur Unterstützung von Modellsprachen .

Feldextraktion

Für unterstützte Dokumentextraktionsfelder see die Seite invoice model schema in unserem GitHub Beispiel-Repository.
Die extrahierten Rechnungsschlüssel-Wert-Paare und Zeilenelemente befinden sich im documentResults Abschnitt der JSON-Ausgabe.

Schlüsselwertpaare

Das vorgefertigte Rechnungsmodell unterstützt die optionale Rückgabe von Schlüsselwertpaaren. Standardmäßig ist die Rückgabe von Schlüssel-Wert-Paaren deaktiviert. Schlüsselwertpaare sind bestimmte Spannweiten innerhalb der Rechnung, die eine Bezeichnung oder einen Schlüssel und die zugehörige Antwort oder den zugehörigen Wert identifizieren. In einer Rechnung können diese Paare das Etikett und der Wert sein, den der Benutzer für dieses Feld oder diese Telefonnummer eingegeben hat. Das KI-Modell wird trainiert, identifizierbare Schlüssel und Werte basierend auf einer Vielzahl von Dokumenttypen, Formaten und Strukturen zu extrahieren.

Schlüssel können auch isoliert vorhanden sein, wenn das Modell erkennt, dass ein Schlüssel vorhanden ist, ohne zugeordneten Wert oder beim Verarbeiten optionaler Felder. Beispielsweise kann ein Feld mit mittlerem Namen in einem Formular in einigen Fällen leer gelassen werden. Schlüsselwertpaare umfassen immer Text, der im Dokument enthalten ist. Bei Dokumenten, bei denen derselbe Wert auf unterschiedliche Weise beschrieben wird, z. B. "Kunde/Benutzer", ist der zugeordnete Schlüssel entweder Kunde oder Benutzer (basierend auf dem Kontext).

JSON-Ausgabe

Die JSON-Ausgabe umfasst drei Teile:

"readResults" Knoten enthält alle erkannten Text- und Auswahlmarkierungen. Text wird über eine Seite, dann nach Zeile und dann nach einzelnen Wörtern organisiert.
"pageResults" knoten enthält die Tabellen und Zellen, die mit ihren Begrenzungsrahmen, Vertrauensgrad und einem Verweis auf die Zeilen und Wörter in readResults extrahiert wurden.
"documentResults" Knoten enthält die rechnungsspezifischen Werte und Positionen, die das Modell identifiziert hat. Hier finden Sie alle Felder aus der Rechnung, z. B. Rechnungs-ID, Versand an, Rechnung an, Kunde, Summe, Positionen und vieles mehr.

Migrationshandbuch

Befolgen Sie unseren Migrationsleitfaden für Document Intelligence v3.1 , um zu erfahren, wie Sie die Version v3.0 in Ihren Anwendungen und Workflows verwenden.