Document Intelligence-Rechnungsmodell

Dieser Inhalt gilt für:Häkchenv4.0 (GA) | Frühere Versionen:blaues Häkchenv3.1 (GA)rotes Häkchenv3.0 (wird eingestellt)rotes Häkchenv2.1 (wird eingestellt)

::: moniker-end

Dieser Inhalt gilt für:checkmarkv3.1 (GA) | Neueste Version:purple-checkmarkv4.0 (GA) | Frühere Versionen:blue-checkmarkv3.0blue-checkmarkv2.1

Dieser Inhalt gilt für:red-checkmarkv3.0 (wird eingestellt) | Neueste Versionen:purple-checkmarkv4.0 (GA)purple-checkmarkv3.1 | Vorherige Version:blue-checkmarkv2.1 (wird eingestellt)

Dieser Inhalt gilt für:red-checkmarkv2.1 | Neueste Version:blue-checkmarkv4.0 (GA)

Das Dokumentintelligenzrechnungsmodell verwendet leistungsstarke OCR-Funktionen (Optical Character Recognition), um Wichtige Felder und Positionen aus Verkaufsrechnungen, Hilfsrechnungen und Bestellungen zu analysieren und zu extrahieren. Rechnungen können von verschiedenen Formaten und Qualität sein, einschließlich von Telefon aufgenommenen Bildern, gescannten Dokumenten und digitalen PDF-Dateien. Die API analysiert Rechnungstext; extrahiert wichtige Informationen wie Kundenname, Rechnungsadresse, Fälligkeitsdatum und fälligen Betrag; und gibt eine strukturierte JSON-Datendarstellung zurück. Das Modell unterstützt derzeit Rechnungen in 27 Sprachen.

Unterstützte Dokumenttypen:

  • Rechnungen
  • Stromrechnungen
  • Verkaufsaufträge
  • Bestellungen

Automatisierte Rechnungsverarbeitung

Die automatisierte Rechnungsverarbeitung ist der Prozess des Extrahierens von Schlüsselfeldern accounts payable aus Abrechnungskontodokumenten. Extrahierte Daten umfassen Positionen aus Rechnungen, die für Überprüfungen und Zahlungen in Ihren Verbindlichkeits-Workflows integriert sind. Historisch gesehen erfolgt die Kreditorenbuchhaltung manuell und ist daher sehr zeitaufwändig. Die genaue Extraktion von Schlüsseldaten aus Rechnungen ist in der Regel der erste und einer der wichtigsten Schritte im Prozess der Rechnungsautomatisierung.

Beispielrechnung, die mit Document Intelligence Studio verarbeitet wird:

Screenshot einer im Document Intelligence Studio analysierten Beispielrechnung.

Beispielrechnung, die mit dem Dokumentintelligenz-Beispieletikettentool verarbeitet wird:

Screenshot einer Beispielrechnung.

Entwicklungsoptionen

Document Intelligence v4.0: 2024-11-30 (GA) unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature Ressourcen Modell-ID
Rechnungsmodell Document Intelligence Studio
REST-API
C#SDK
Python SDK
Java SDK
JavaScript SDK
Vorkonfigurierte Rechnung

Document Intelligence v3.1 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature Ressourcen Modell-ID
Rechnungsmodell Document Intelligence Studio
REST-API
C#SDK
Python SDK
Java SDK
JavaScript SDK
Vorkonfigurierte Rechnung

Document Intelligence v3.0 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature Ressourcen Modell-ID
Rechnungsmodell Document Intelligence Studio
REST-API
C#SDK
Python SDK
Java SDK
JavaScript SDK
Vorkonfigurierte Rechnung

Document Intelligence v2.1 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature Ressourcen
Rechnungsmodell • Tool zur Kennzeichnung von Dokumentenintelligenz • REST-API • SDK der Client-Bibliothek • Document Intelligence-Docker-Container

Eingabeanforderungen

Die folgenden Dateiformate werden unterstützt.

Modell PDF Bild:
JPEG/JPG, PNG, BMP, TIFF, HEIF
Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Lesen
Gestaltung
Allgemeines Dokument
Vorkonfiguriert
Benutzerdefinierte Extraktion
Benutzerdefinierte Klassifizierung
  • Fotos und Scans: Um optimale Ergebnisse zu erzielen, stellen Sie ein klares Foto oder eine qualitativ hochwertige Überprüfung pro Dokument bereit.
  • PDFs und TIFFs: Für PDFs und TIFFs können bis zu 2.000 Seiten verarbeitet werden. (Bei einem kostenlosen Abonnement werden nur die ersten beiden Seiten verarbeitet.)
  • Dateigröße: Die Dateigröße für die Analyse von Dokumenten beträgt 500 MB für die kostenpflichtige Stufe (S0) und 4 MB für die kostenlose Stufe (F0).
  • Bildabmessungen: Die Abmessungen müssen zwischen 50 Pixel x 50 Pixel und 10.000 Pixel x 10.000 Pixel betragen.
  • Kennwortsperrungen: Wenn Ihre PDF-Dateien kennwortgesperrt sind, müssen Sie die Sperre vor der Übermittlung entfernen.
  • Texthöhe: Die minimale Höhe des zu extrahierenden Texts beträgt 12 Pixel für ein Bild von 1024 x 768 Pixeln. Diese Dimension entspricht einem 8-Punkt-Text bei 150 Punkten pro Zoll.
  • Schulung für benutzerdefinierte Modelle: Die maximale Anzahl von Seiten für Schulungsdaten beträgt 500 für das benutzerdefinierte Vorlagenmodell und 50.000 für das benutzerdefinierte neurale Modell.
  • Schulung des benutzerdefinierten Extraktionsmodells: Die Gesamtgröße der Schulungsdaten beträgt 50 MB für das Vorlagenmodell und 1 GB für das neurale Modell.
  • Schulung des benutzerdefinierten Klassifizierungsmodells: Die Gesamtgröße der Schulungsdaten beträgt 1 GB mit maximal 10.000 Seiten. Für 2024-11-30 (GA) beträgt die Gesamtgröße der Schulungsdaten 2 GB mit maximal 10.000 Seiten.
  • Office-Dateitypen (DOCX, XLSX, PPTX):Die maximale Zeichenfolgenlängenbeschränkung beträgt 8 Millionen Zeichen.
  • Unterstützte Dateiformate: JPEG, PNG, PDF und TIFF.
  • Unterstützte PDF- und TIFF-Dateien ermöglichen die Verarbeitung von bis zu 2.000 Seiten. Für Abonnenten der kostenlosen Ebene werden nur die ersten beiden Seiten verarbeitet.
  • Die unterstützte Dateigröße muss kleiner als 50 MB sein und mindestens 50 x 50 Pixel und höchstens 10.000 x 10.000 Pixel groß sein.

Datenextraktion des Rechnungsmodells

Erfahren Sie, wie Daten, einschließlich Kundeninformationen, Lieferantendetails und Positionen, aus Rechnungen extrahiert werden. Sie benötigen die folgenden Ressourcen:

  • Ein Azure-Abonnement – Sie können eine kostenlos erstellen.

  • Eine Document Intelligence-Instanz im Azure-Portal. Sie können das kostenlose Preisniveau (F0) verwenden, um den Dienst zu testen. Nachdem Ihre Ressource bereitgestellt wurde, wählen Sie "Zur Ressource wechseln " aus, um Ihren Schlüssel und Endpunkt abzurufen.

Screenshot von Schlüsseln und Endpunktstandorten im Azure portal.

  1. Wählen Sie auf der Startseite von Document Intelligence Studiodie Option "Rechnungen" aus.

  2. Sie können die Beispielrechnung analysieren oder Eigene Dateien hochladen.

  3. Wählen Sie die Schaltfläche " Analyse ausführen " aus, und konfigurieren Sie ggf. die Analyseoptionen :

    Screenshot der Schaltflächen

Dokumentintelligenz-Beispiel-Beschriftungstool

  1. Navigieren Sie zum Dokumentintelligenz-Beispieltool.

  2. Wählen Sie auf der Startseite des Beispieltools die Kachel Vordefiniertes Modell zur Datenerfassung verwenden aus.

    Screenshot des Prozesses zur Analyse der Ergebnisse des Layoutmodells.

  3. Wählen Sie den Zu analysierenden Formulartyp aus dem Dropdownmenü aus.

  4. Wählen Sie eine URL für die Datei aus, die Sie aus den folgenden Optionen analysieren möchten:

  5. Wählen Sie im Feld "Quelle " im Dropdownmenü die URL aus, fügen Sie die ausgewählte URL ein, und wählen Sie die Schaltfläche " Abrufen " aus.

    Screenshot des Dropdownmenüs

  6. Fügen Sie im Feld "Document Intelligence-Dienstendpunkt " den Endpunkt ein, den Sie mit Ihrem Document Intelligence-Abonnement erhalten haben.

  7. Fügen Sie im Schlüsselfeld den Schlüssel ein, den Sie aus Ihrer Document Intelligence-Ressource abgerufen haben.

    Screenshot des Dropdownmenüs

  8. Wählen Sie "Analyse ausführen" aus. Das Dokumentintelligenz-Beispielbeschriftungstool ruft die Analysevorbau-API auf und analysiert das Dokument.

  9. Zeigen Sie die Ergebnisse an – sehen Sie sich die extrahierten Schlüsselwertpaare, Zeilenelemente, hervorgehobenen Text, extrahierten Text und erkannte Tabellen an.

    Screenshot des Layoutmodells zum Analysieren des Ergebnisvorgangs.

Hinweis

Das Beispielbezeichnungstool unterstützt das BMP-Dateiformat nicht. Dies ist eine Einschränkung des Tools, nicht der Dokumentintelligenzdienst.

Unterstützte Sprachen und Gebietsschemas

Eine vollständige Liste der unterstützten Sprachen finden Sie auf unserer vordefinierten Seite zur Unterstützung von Modellsprachen .

Feldextraktion

  • Für unterstützte Dokumentextraktionsfelder see die Seite invoice model schema in unserem GitHub Beispiel-Repository.

  • Die extrahierten Rechnungsschlüssel-Wert-Paare und Zeilenelemente befinden sich im documentResults Abschnitt der JSON-Ausgabe.

Schlüsselwertpaare

Das vorgefertigte Rechnungsmodell unterstützt die optionale Rückgabe von Schlüsselwertpaaren. Standardmäßig ist die Rückgabe von Schlüssel-Wert-Paaren deaktiviert. Schlüsselwertpaare sind bestimmte Spannweiten innerhalb der Rechnung, die eine Bezeichnung oder einen Schlüssel und die zugehörige Antwort oder den zugehörigen Wert identifizieren. In einer Rechnung können diese Paare das Etikett und der Wert sein, den der Benutzer für dieses Feld oder diese Telefonnummer eingegeben hat. Das KI-Modell wird trainiert, identifizierbare Schlüssel und Werte basierend auf einer Vielzahl von Dokumenttypen, Formaten und Strukturen zu extrahieren.

Schlüssel können auch isoliert vorhanden sein, wenn das Modell erkennt, dass ein Schlüssel vorhanden ist, ohne zugeordneten Wert oder beim Verarbeiten optionaler Felder. Beispielsweise kann ein Feld mit mittlerem Namen in einem Formular in einigen Fällen leer gelassen werden. Schlüsselwertpaare umfassen immer Text, der im Dokument enthalten ist. Bei Dokumenten, bei denen derselbe Wert auf unterschiedliche Weise beschrieben wird, z. B. "Kunde/Benutzer", ist der zugeordnete Schlüssel entweder Kunde oder Benutzer (basierend auf dem Kontext).

JSON-Ausgabe

Die JSON-Ausgabe umfasst drei Teile:

  • "readResults" Knoten enthält alle erkannten Text- und Auswahlmarkierungen. Text wird über eine Seite, dann nach Zeile und dann nach einzelnen Wörtern organisiert.
  • "pageResults" knoten enthält die Tabellen und Zellen, die mit ihren Begrenzungsrahmen, Vertrauensgrad und einem Verweis auf die Zeilen und Wörter in readResults extrahiert wurden.
  • "documentResults" Knoten enthält die rechnungsspezifischen Werte und Positionen, die das Modell identifiziert hat. Hier finden Sie alle Felder aus der Rechnung, z. B. Rechnungs-ID, Versand an, Rechnung an, Kunde, Summe, Positionen und vieles mehr.

Migrationshandbuch

::: moniker-end

Nächste Schritte