Modèles personnalisés composés par Document Intelligence

Ce contenu s’applique à :v4.0 (GA) | Versions antérieures :v3.1 (GA)v3.0 (retrait)v2.1 (mise hors service)

::: moniker-end

Ce contenu s’applique à :v3.1 (GA) | Dernière version :v4.0 (GA) | Versions antérieures :v3.0v2.1

Ce contenu s’applique à :v3.0 (mise hors service) | Versions les plus récentes:v4.0 (Disponibilité générale)v3.1 | Version antérieure :v2.1 (mise hors service)

Ce contenu s’applique à :v2.1 | Dernière version :v4.0 (GA)

Important

L’opération v4.0 2024-11-30 (GA) model compose ajoute un classifieur entraîné explicitement au lieu d’un classifieur implicite pour l’analyse. Pour la version précédente du modèle composé, consultez Modèles personnalisés composés v3.1. Si vous utilisez actuellement des modèles composés, envisagez de procéder à la mise à niveau vers la dernière implémentation.

Qu’est-ce qu’un modèle composé ?

Avec les modèles composés, vous pouvez regrouper plusieurs modèles personnalisés dans un modèle composé appelé avec un ID de modèle unique. Par exemple, votre modèle composé peut inclure des modèles personnalisés formés pour analyser vos commandes d’approvisionnement, d’équipement et de meubles. Au lieu de sélectionner manuellement le modèle approprié, vous pouvez utiliser un modèle composé pour déterminer le modèle personnalisé approprié pour chaque analyse et extraction.

Certains scénarios nécessitent d’abord de classer le document, puis d’analyser le document avec le modèle le mieux adapté pour extraire les champs du modèle. Ces scénarios peuvent inclure ceux où un utilisateur charge un document, mais le type de document n’est pas explicitement connu. Un autre scénario peut être le cas où plusieurs documents sont analysés ensemble dans un seul fichier et que le fichier est envoyé pour traitement. Votre application doit ensuite identifier les documents de composant et sélectionner le meilleur modèle pour chaque document.

Dans les versions précédentes, l’opération model compose a effectué une classification implicite pour déterminer le modèle personnalisé le mieux qui représente le document soumis. L’implémentation 2024-11-30 (GA) de l’opération model compose remplace la classification implicite des versions antérieures par une étape de classification explicite et ajoute le routage conditionnel.

Avantages de la nouvelle opération de composition de modèle

La nouvelle model compose opération vous oblige à entraîner un classifieur explicite et offre plusieurs avantages.

Amélioration incrémentielle continue. Vous pouvez améliorer de façon cohérente la qualité du classifieur en ajoutant d’autres échantillons et en améliorant de façon incrémentielle la classification. Ce réglage précis garantit que vos documents sont toujours routés vers le modèle approprié pour l’extraction.
Contrôle complet du routage. En ajoutant un routage basé sur la confiance, vous fournissez un seuil de confiance pour le type de document et la réponse de classification.
Ignorez les types de documents spécifiques au document pendant l’opération. Les implémentations antérieures de l’opération model compose ont sélectionné le meilleur modèle d’analyse pour l’extraction en fonction du score de confiance même si les scores de confiance les plus élevés étaient relativement faibles. En fournissant un seuil de confiance ou en ne mappant explicitement pas un type de document connu de la classification à un modèle d’extraction, vous pouvez ignorer des types de documents spécifiques.
Analysez plusieurs instances du même type de document. Lorsqu’elle est associée à l’option splitMode du classifieur, l’opération model compose peut détecter plusieurs instances du même document dans un fichier et fractionner le fichier pour traiter chaque document indépendamment. L’utilisation splitMode permet le traitement de plusieurs instances d’un document dans une seule requête.
Prise en charge des fonctionnalités complémentaires. Vous pouvez également spécifier des fonctionnalités telles que des champs de requête ou des codes-barres dans le cadre des paramètres du modèle d’analyse.
Le plafond du modèle personnalisé attribué est étendu à 500. La nouvelle implémentation de l’opération model compose vous permet d’affecter jusqu’à 500 modèles personnalisés formés à un modèle composé unique.

Comment utiliser model compose

Commencez par collecter des échantillons de tous vos documents nécessaires, y compris des exemples contenant des informations qui doivent être extraites ou ignorées.
Entraînez un classifieur en organisant les documents dans les dossiers où les noms de dossiers sont le type de document que vous envisagez d’utiliser dans votre définition de modèle composé.
Enfin, effectuez l’apprentissage d’un modèle d’extraction pour chacun des types de documents que vous envisagez d’utiliser.
Une fois vos modèles de classification et d’extraction formés, utilisez Document Intelligence Studio, les bibliothèques clientes ou l’API REST pour composer les modèles de classification et d’extraction dans un modèle composé.

Utilisez le splitMode paramètre pour contrôler le comportement de fractionnement de fichier :

Aucun. Le fichier entier est traité comme un document unique.
perPage. Chaque page du fichier est traitée comme un document distinct.
auto. Le fichier est automatiquement divisé en documents.

Facturation et tarification

Les modèles composés sont facturés de la même façon que les modèles personnalisés individuels. La tarification est basée sur le nombre de pages analysées par le modèle d’analyse en aval. La facturation est déterminée en fonction du tarif d’extraction des pages dirigées vers un modèle d’extraction. Avec l'ajout de charges explicites, des coûts sont encourus pour la classification de toutes les pages du fichier d'entrée. Pour plus d’informations, consultez la page de tarification Document Intelligence.

Utiliser l’opération de composition de modèle

Commencez par créer une liste de tous les ID de modèle que vous souhaitez composer en un seul modèle.
Composez les modèles en un seul ID de modèle à l’aide de studio, d’API REST ou de bibliothèques clientes.
Utilisez l’ID de modèle composé pour analyser les documents.

Facturation

Les modèles composés sont facturés de la même façon que les modèles personnalisés individuels. La tarification est basée sur le nombre de pages analysées. La facturation est basée sur le tarif d’extraction appliqué aux pages routées vers un modèle d’extraction. Pour plus d’informations, consultez la page de tarification Document Intelligence.

Il n’existe aucun changement de tarification pour l’analyse d’un document à l’aide d’un modèle personnalisé individuel ou d’un modèle personnalisé composé.

Fonctionnalités des modèles composés

Custom template et custom neural les modèles peuvent être composés ensemble en un modèle composé unique entre plusieurs versions d’API.
La réponse inclut une docType propriété pour indiquer quels modèles composés ont été utilisés pour analyser le document.
Pour custom template les modèles, le modèle composé peut être créé à l’aide de variantes d’un modèle personnalisé ou de différents types de formulaires. Cette opération est utile lorsque les formulaires entrants appartiennent à l’un de plusieurs modèles.
Pour custom neural les modèles, la meilleure pratique consiste à ajouter toutes les variantes d’un type de document unique dans un jeu de données d’entraînement unique et à effectuer l’apprentissage sur un modèle neuronal personnalisé. L’opération model compose convient le mieux aux scénarios lorsque vous avez des documents de différents types soumis à des fins d’analyse.

Composer des limites de modèle

Avec l’opération model compose , vous pouvez affecter jusqu’à 500 modèles à un id de modèle unique. Si le nombre de modèles que je souhaite composer dépasse la limite supérieure d’un modèle composé, vous pouvez utiliser l’une des alternatives suivantes :
- Classifiez les documents avant d’appeler le modèle personnalisé. Vous pouvez utiliser le modèle de lecture et créer une classification basée sur le texte extrait des documents et certaines expressions à l’aide de sources telles que du code, des expressions régulières ou une recherche.
- Si vous souhaitez extraire les mêmes champs de différents documents structurés, semi-structurés et non structurés, envisagez d’utiliser le modèle neuronal personnalisé d’apprentissage profond. En savoir plus sur les différences entre le modèle de gabarit personnalisé et le modèle neuronal personnalisé.
L’analyse d’un document à l’aide de modèles composés est identique à l’analyse d’un document à l’aide d’un modèle unique. Le Analyze Document résultat retourne une docType propriété qui indique les modèles de composants que vous avez sélectionnés pour l’analyse du document.
L’opération model compose n’est actuellement disponible que pour les modèles personnalisés dont l’apprentissage est effectué avec des étiquettes.

Compatibilité des modèles composés

Type de modèle personnalisé	Modèles entraînés avec v2.1 et v2.0	Modèles neuronaux et modèles personnalisés v3.1 et v3.0	Gabarit personnalisé et modèles neuronaux v4.0 `2024-11-30` (GA)
Modèles entraînés avec la version 2.1 et v2.0	Non pris en charge	Non pris en charge	Non pris en charge
Modèles neuronaux et modèles personnalisés v3.0 et v3.1	Non pris en charge	Soutenu	Soutenu
Modèles neuronaux et modèles personnalisés v4.0	Non pris en charge	Soutenu	Soutenu

Pour composer un modèle entraîné avec une version antérieure de l’API (v2.1 ou antérieure), entraînez un modèle avec l’API v3.0 à l’aide du même jeu de données étiqueté. Cela garantit que le modèle v2.1 peut être composé d’autres modèles.
Les modèles composés à l’aide de la version 2.1 de l’API continuent d’être pris en charge, ce qui nécessite aucune mise à jour.

Options de développement

Document Intelligence v4.0:2024-11-30 (GA) prend en charge les outils, applications et bibliothèques suivants :

Fonction	Ressources
Modèle personnalisé	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK
Modèle composé	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK

Document Intelligence v3.1:2023-07-31 (GA) prend en charge les outils, applications et bibliothèques suivants :

Fonction	Ressources
Modèle personnalisé	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK
Modèle composé	• Document Intelligence Studio • REST API • C# SDK • SDK Java • JavaScript SDK • Python SDK

Document Intelligence v3.0:2022-08-31 (GA) prend en charge les outils, applications et bibliothèques suivants :

Fonction	Ressources
Modèle personnalisé	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK
Modèle composé	• Document Intelligence Studio • API REST • SDK C# • SDK Java • SDK JavaScript • SDK Python

Document Intelligence v2.1 prend en charge les ressources suivantes :

Fonction	Ressources
Modèle personnalisé	• Outil d'étiquetage de Document Intelligence • API REST • Bibliothèque cliente du kit de développement logiciel (SDK) • Conteneur Docker Document Intelligence
Modèle composé	• outil d’étiquetage Document Intelligence • REST API • C# SDK • Java SDK • Kit de développement logiciel (SDK) JavaScript • Python SDK

Étapes suivantes

Découvrez comment créer et composer des modèles personnalisés :

Créer un modèle personnaliséComposer des modèles personnalisés

Commentaires

Cette page a-t-elle été utile ?

Last updated on 2026-05-08