Zusammengestellte benutzerdefinierte Modelle für Dokumentenintelligenz

Dieser Inhalt gilt für:Häkchenv4.0 (GA) | Frühere Versionen:blaues Häkchenv3.1 (GA)rotes Häkchenv3.0 (wird eingestellt)rotes Häkchenv2.1 (wird eingestellt)

::: moniker-end

Dieser Inhalt gilt für:checkmarkv3.1 (GA) | Neueste Version:purple-checkmarkv4.0 (GA) | Frühere Versionen:blue-checkmarkv3.0blue-checkmarkv2.1

Dieser Inhalt gilt für:red-checkmarkv3.0 (wird eingestellt) | Neueste Versionen:purple-checkmarkv4.0 (GA)purple-checkmarkv3.1 | Vorherige Version:blue-checkmarkv2.1 (wird eingestellt)

Dieser Inhalt gilt für:red-checkmarkv2.1 | Neueste Version:blue-checkmarkv4.0 (GA)

Wichtig

Der v4.0 2024-11-30 -Vorgang (GA) model compose fügt einen explizit trainierten Klassifizierer anstelle eines impliziten Klassifizierers für die Analyse hinzu. Die vorherige zusammengesetzte Modellversion finden Sie unter Zusammengesetzte benutzerdefinierte Modelle v3.1. Wenn Sie derzeit zusammengesetzte Modelle verwenden, sollten Sie ein Upgrade auf die neueste Implementierung in Betracht ziehen.

Was ist ein zusammengesetztes Modell?

Mit zusammengesetzten Modellen können Sie mehrere benutzerdefinierte Modelle in ein zusammengesetztes Modell gruppieren, das mit einer einzelnen Modell-ID aufgerufen wird. Ihr zusammengesetztes Modell kann z. B. benutzerdefinierte Modelle enthalten, die geschult sind, um Ihre Liefer-, Ausrüstungs- und Möbelbestellungen zu analysieren. Anstatt manuell zu versuchen, das entsprechende Modell auszuwählen, können Sie ein zusammengesetztes Modell verwenden, um das entsprechende benutzerdefinierte Modell für jede Analyse und Extraktion zu ermitteln.

Einige Szenarien erfordern zuerst die Klassifizierung des Dokuments und dann die Analyse des Dokuments mit dem Modell, das am besten geeignet ist, um die Felder aus dem Modell zu extrahieren. Solche Szenarien können solche Szenarien umfassen, bei denen ein Benutzer ein Dokument hochlädt, der Dokumenttyp jedoch nicht explizit bekannt ist. Ein weiteres Szenario kann sein, wenn mehrere Dokumente in einer einzigen Datei gescannt werden und die Datei zur Verarbeitung übermittelt wird. Ihre Anwendung muss dann die Komponentendokumente identifizieren und das beste Modell für jedes Dokument auswählen.

In früheren Versionen hat der model compose Vorgang eine implizite Klassifizierung ausgeführt, um zu entscheiden, welches benutzerdefinierte Modell das übermittelte Dokument am besten darstellt. Die Implementierung 2024-11-30 (GA) des model compose Vorgangs ersetzt die implizite Klassifizierung aus den früheren Versionen durch einen expliziten Klassifizierungsschritt und fügt bedingtes Routing hinzu.

Vorteile des neuen Modellerstellungsvorgangs

Der neue model compose Vorgang erfordert, dass Sie einen expliziten Klassifizierer trainieren und mehrere Vorteile bieten.

  • Kontinuierliche inkrementelle Verbesserung. Sie können die Qualität des Klassifizierers konsistent verbessern, indem Sie weitere Beispiele hinzufügen und die Klassifizierung inkrementell verbessern. Durch diese Feinabstimmung wird sichergestellt, dass Ihre Dokumente immer an das richtige Modell zur Extraktion weitergeleitet werden.

  • Vollständige Kontrolle über Routing. Indem Sie konfidenzbasiertes Routing hinzufügen, stellen Sie einen Konfidenzschwellenwert für den Dokumenttyp und die Klassifizierungsantwort bereit.

  • Die spezifischen Dokumenttypen während des Vorgangs ignorieren. Frühere Implementierungen des model compose Vorgangs haben das beste Analysemodell für die Extraktion basierend auf der Konfidenzbewertung ausgewählt, auch wenn die höchsten Konfidenzergebnisse relativ niedrig waren. Indem Sie einen Konfidenzschwellenwert bereitstellen oder einen bekannten Dokumenttyp explizit nicht von der Klassifizierung zu einem Extraktionsmodell zuordnen, können Sie bestimmte Dokumenttypen ignorieren.

  • Analysieren Sie mehrere Instanzen desselben Dokumenttyps. Bei Kombination mit der splitMode Option des Klassifizierers kann der model compose Vorgang mehrere Instanzen desselben Dokuments in einer Datei erkennen und die Datei aufteilen, um jedes Dokument unabhängig voneinander zu verarbeiten. Die Verwendung splitMode ermöglicht die Verarbeitung mehrerer Instanzen eines Dokuments in einer einzigen Anforderung.

  • Unterstützung für Add-On-Features. Zusätzliche Funktionen wie Abfragefelder oder Barcodes können ebenfalls als Teil der Analysemusterparameter angegeben werden.

  • Die Höchstanzahl der zugewiesenen benutzerdefinierten Modelle wurde auf 500 erhöht. Mit der neuen Implementierung des model compose Vorgangs können Sie einem einzelnen zusammengesetzten Modell bis zu 500 trainierte benutzerdefinierte Modelle zuweisen.

Anleitung zur Benutzung von Model Compose

  • Beginnen Sie mit dem Sammeln von Proben aller benötigten Dokumente, einschließlich Proben mit Informationen, die extrahiert oder ignoriert werden sollen.

  • Trainieren Sie einen Klassifizierer, indem Sie die Dokumente in Ordnern organisieren, in denen die Ordnernamen der Dokumenttyp sind, den Sie in Ihrer zusammengesetzten Modelldefinition verwenden möchten.

  • Trainieren Sie schließlich ein Extraktionsmodell für die einzelnen Dokumenttypen, die Sie verwenden möchten.

  • Nachdem Ihre Klassifizierungs- und Extraktionsmodelle trainiert wurden, verwenden Sie Document Intelligence Studio, Clientbibliotheken oder die REST-API , um die Klassifizierungs- und Extraktionsmodelle in einem zusammengesetzten Modell zu erstellen.

Verwenden Sie den splitMode Parameter, um das Verhalten der Dateiaufteilung zu steuern:

  • Keine. Die gesamte Datei wird als einzelnes Dokument behandelt.
  • perPage. Jede Seite in der Datei wird als separates Dokument behandelt.
  • auto. Die Datei wird automatisch in Dokumente aufgeteilt.

Abrechnung und Preise

Zusammengesetzte Modelle werden genauso berechnet wie individuelle benutzerdefinierte Modelle. Die Preise basieren auf der Anzahl der Seiten, die vom nachgelagerten Analysemodell analysiert werden. Die Abrechnung basiert auf dem Extraktionspreis für die Seiten, die an ein Extraktionsmodell weitergeleitet werden. Mit der expliziten Klassifizierung entstehen Gebühren für die Klassifizierung aller Seiten in der Eingabedatei. Weitere Informationen finden Sie auf der Dokumentintelligenz-Preisseite.

Verwenden des Modellzusammenstellungsprozesses

  • Erstellen Sie zunächst eine Liste aller Modell-IDs, die Sie in einem einzigen Modell erstellen möchten.

  • Kombinieren Sie die Modelle zu einer einzigen Modell-ID mithilfe der Studio-, REST-API- oder Clientbibliotheken.

  • Verwenden Sie die zusammengesetzte Modell-ID, um Dokumente zu analysieren.

Abrechnung

Zusammengesetzte Modelle werden in gleicher Weise wie individuelle benutzerdefinierte Modelle in Rechnung gestellt. Die Preise basieren auf der Anzahl der analysierten Seiten. Die Abrechnung basiert auf dem Extraktionspreis für die Seiten, die an ein Extraktionsmodell weitergeleitet werden. Weitere Informationen finden Sie auf der Dokumentintelligenz-Preisseite.

  • Es gibt keine Änderung der Preise für die Analyse eines Dokuments mithilfe eines einzelnen benutzerdefinierten Modells oder eines zusammengesetzten benutzerdefinierten Modells.

Zusammengesetzte Modelleigenschaften

  • Custom template- und custom neural-Modelle können zu einem einzigen zusammengesetzten Modell über mehrere API-Versionen hinweg kombiniert werden.

  • Die Antwort enthält eine docType Eigenschaft, die angibt, welche der zusammengesetzten Modelle zum Analysieren des Dokuments verwendet wurde.

  • Für custom template Modelle kann das zusammengesetzte Modell mithilfe von Variationen einer benutzerdefinierten Vorlage oder unterschiedlicher Formulartypen erstellt werden. Dieser Vorgang ist nützlich, wenn eingehende Formulare zu einer von mehreren Vorlagen gehören.

  • Für custom neural Modelle empfiehlt es sich, alle verschiedenen Variationen eines einzelnen Dokumenttyps zu einem einzigen Schulungsdatensatz hinzuzufügen und das benutzerdefinierte neurale Modell zu trainieren. Der model compose Vorgang eignet sich am besten für Szenarien, wenn Dokumente unterschiedlicher Typen zur Analyse übermittelt werden.

Grenzwerte für das Zusammenstellen von Modellen

  • Mit dem model compose Vorgang können Sie einer einzelnen Modell-ID bis zu 500 Modelle zuweisen. Wenn die Anzahl der Modelle, die ich verfassen möchte, die Obergrenze eines zusammengesetzten Modells überschreitet, können Sie eine der folgenden Alternativen verwenden:

  • Das Analysieren eines Dokuments mithilfe zusammengesetzter Modelle ist identisch mit der Analyse eines Dokuments mithilfe eines einzelnen Modells. Das Analyze Document Ergebnis gibt eine docType Eigenschaft zurück, die angibt, welche komponentenmodelle Sie für die Analyse des Dokuments ausgewählt haben.

  • Der model compose Vorgang ist derzeit nur für benutzerdefinierte Modelle verfügbar, die mit Etiketten trainiert wurden.

Zusammengesetzte Modellkompatibilität

Benutzerdefinierter Modelltyp Modelle trainiert mit v2.1 und v2.0 Benutzerdefinierte Vorlagen und neurale Modelle v3.1 und v3.0 Benutzerdefinierte Vorlage und neurale Modelle v4.0 2024-11-30 (GA)
Modelle, die mit Version 2.1 und v2.0 trainiert wurden Nicht unterstützt Nicht unterstützt Nicht unterstützt
Benutzerdefinierte Vorlage und neurale Modelle v3.0 und v3.1 Nicht unterstützt Unterstützt Unterstützt
Benutzerdefinierte Vorlage und neurale Modelle v4.0 Nicht unterstützt Unterstützt Unterstützt
  • Um ein Modell zu erstellen, das mit einer früheren Version der API (v2.1 oder früher) trainiert wurde, trainieren Sie ein Modell mit der v3.0-API mit demselben beschrifteten Dataset. Dadurch wird sichergestellt, dass das v2.1-Modell mit anderen Modellen zusammengesetzt werden kann.

  • Zusammengestellte Modelle mit Hilfe von API v2.1 werden weiterhin unterstützt, ohne dass Updates erforderlich sind.

Entwicklungsoptionen

Document Intelligence v4.0:2024-11-30 (GA) unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature Ressourcen
Benutzerdefiniertes Modell Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK
Zusammengesetztes Modell Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

Document Intelligence v3.1:2023-07-31 (GA) unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature Ressourcen
Benutzerdefiniertes Modell Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK
Zusammengesetztes Modell Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

Document Intelligence v3.0:2022-08-31 (GA) unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature Ressourcen
Benutzerdefiniertes Modell Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK
Zusammengesetztes Modell Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

Document Intelligence v2.1 unterstützt die folgenden Ressourcen:

Feature Ressourcen
Benutzerdefiniertes Modell Tool zur Etikettierung von Dokumentenintelligenz
REST API
Client-Bibliothek-SDK
Docker-Container "Document-Intelligence"
Zusammengesetztes Modell Document Intelligence-Bezeichnungstool
REST-API
C# SDK
Java SDK
• JavaScript SDK
Python SDK

Nächste Schritte

Erfahren Sie, wie Sie benutzerdefinierte Modelle erstellen und verfassen: