Inteligencia documental compuesta por modelos personalizados

Este contenido se aplica a:checkmarkv4.0 (GA) | Versiones anteriores:blue-checkmarkv3.1 (GA)red-checkmarkv3.0 (retirada)red-checkmarkv2.1 (retirada)

::: moniker-end

Este contenido se aplica a:checkmarkv3.1 (GA) | Versión más reciente:purple-checkmarkv4.0 (GA) | Versiones anteriores:blue-checkmarkv3.0blue-checkmarkv2.1

Este contenido se aplica a:red-checkmarkv3.0 (retirada) | Versiones más recientes:purple-checkmarkv4.0 (GA)purple-checkmarkv3.1 | Versión anterior:blue-checkmarkv2.1 (retirada)

Este contenido se aplica a:red-checkmarkv2.1 | Versión más reciente:blue-checkmarkv4.0 (GA)

Importante

La operación v4.0 2024-11-30 (GA) model compose agrega un clasificador entrenado explícitamente en lugar de un clasificador implícito para su análisis. Para obtener la versión anterior del modelo compuesto, consulte Modelos personalizados compuestos v3.1. Si actualmente usa modelos compuestos, considere la posibilidad de actualizar a la implementación más reciente.

¿Qué es un modelo compuesto?

Con los modelos compuestos, puede agrupar varios modelos personalizados en un modelo compuesto denominado con un identificador de modelo único. Por ejemplo, el modelo compuesto podría incluir modelos personalizados entrenados para analizar los pedidos de compra de suministros, equipos y muebles. En lugar de intentar seleccionar manualmente el modelo adecuado, puede usar un modelo compuesto para determinar el modelo personalizado adecuado para cada análisis y extracción.

Algunos escenarios requieren clasificar primero el documento y, a continuación, analizarlo con el modelo más adecuado para extraer los campos del modelo. Estos escenarios pueden incluir los que un usuario carga un documento, pero el tipo de documento no se conoce explícitamente. Otro escenario puede ser cuando se examinan varios documentos conjuntamente en un solo archivo y este se envía para su procesamiento. A continuación, la aplicación debe identificar los documentos de componente y seleccionar el mejor modelo para cada documento.

En versiones anteriores, la model compose operación realizó una clasificación implícita para decidir qué modelo personalizado representa mejor el documento enviado. La implementación 2024-11-30 (GA) de la model compose operación reemplaza la clasificación implícita de las versiones anteriores por un paso de clasificación explícito y agrega enrutamiento condicional.

Ventajas de la nueva operación de composición del modelo

La nueva model compose operación requiere entrenar un clasificador explícito y proporciona varias ventajas.

  • Mejora incremental continua. Puede mejorar de forma coherente la calidad del clasificador agregando más muestras y mejorando incrementalmente la clasificación. Este ajuste fino garantiza que los documentos siempre se dirijan al modelo adecuado para su extracción.

  • Control total sobre el enrutamiento. Al agregar el enrutamiento basado en confianza, se proporciona un umbral de confianza para el tipo de documento y la respuesta de clasificación.

  • Ignore los tipos de documento específicos durante la operación. Las implementaciones anteriores de la model compose operación seleccionaron el mejor modelo de análisis para la extracción en función de la puntuación de confianza incluso si las puntuaciones de confianza más altas eran relativamente bajas. Al proporcionar un umbral de confianza o no asignar explícitamente un tipo de documento conocido de clasificación a un modelo de extracción, puede omitir tipos de documento específicos.

  • Analice varias instancias del mismo tipo de documento. Cuando se empareja con la splitMode opción del clasificador, la model compose operación puede detectar varias instancias del mismo documento en un archivo y dividir el archivo para procesar cada documento de forma independiente. El uso splitMode de habilita el procesamiento de varias instancias de un documento en una sola solicitud.

  • Compatibilidad para agregar características. También se pueden especificar características como campos de consulta o códigos de barras como parte de los parámetros del modelo de análisis.

  • Se amplió el máximo del modelo personalizado asignado a 500. La nueva implementación de la model compose operación permite asignar hasta 500 modelos personalizados entrenados a un único modelo compuesto.

Cómo usar la composición de modelos

  • Empiece por recopilar ejemplos de todos los documentos necesarios, incluidos los ejemplos con información que se debe extraer o omitir.

  • Entrene un clasificador mediante la organización de los documentos en carpetas donde los nombres de carpeta son el tipo de documento que quiere usar en la definición del modelo compuesto.

  • Por último, entrene un modelo de extracción para cada uno de los tipos de documento que quiera usar.

  • Una vez entrenados los modelos de clasificación y extracción, use Document Intelligence Studio, las bibliotecas cliente o la API REST para componer los modelos de clasificación y extracción en un modelo compuesto.

Use el splitMode parámetro para controlar el comportamiento de división de archivos:

  • Ninguno. Todo el archivo se trata como un único documento.
  • perPage. Cada página del archivo se trata como un documento independiente.
  • auto. El archivo se divide automáticamente en documentos.

Facturación y precios

Los modelos compuestos se facturan igual que los modelos personalizados individuales. La tarificación se basa en el número de páginas analizadas por el modelo de análisis posterior. La facturación se basa en el precio de extracción de las páginas enrutadas a un modelo de extracción. Con la adición de la clasificación explícita, se generan cargos por la clasificación de todas las páginas en el archivo de entrada. Para obtener más información, consulte la página precios de Document Intelligence.

Usar la operación de composición del modelo

  • Empiece por crear una lista de todos los identificadores de modelo que desea componer en un único modelo.

  • Componga los modelos en un ID de modelo único mediante Studio, API REST o bibliotecas de cliente.

  • Use el identificador de modelo compuesto para analizar documentos.

Facturación

Los modelos compuestos se facturan igual que los modelos personalizados individuales. Los precios se basan en el número de páginas analizadas. La facturación se basa en el precio de extracción de las páginas enrutadas a un modelo de extracción. Para obtener más información, consulte la página precios de Document Intelligence.

  • No hay ningún cambio en los precios para analizar un documento mediante un modelo personalizado individual o un modelo personalizado compuesto.

Características de modelos compuestos

  • Custom template y custom neural pueden componer juntos un único modelo compuesto a través de múltiples versiones de la API.

  • La respuesta incluye una docType propiedad para indicar cuál de los modelos compuestos se usó para analizar el documento.

  • Para los modelos custom template, el modelo compuesto se puede crear usando variaciones de una plantilla personalizada o diferentes tipos de formulario. Esta operación es útil cuando los formularios entrantes pertenecen a una de varias plantillas.

  • Para custom neural los modelos, el procedimiento recomendado es agregar todas las distintas variaciones de un solo tipo de documento en un único conjunto de datos de entrenamiento y entrenar en un modelo neuronal personalizado. La model compose operación es más adecuada para escenarios en los que se envían documentos de diferentes tipos para su análisis.

Límites del modelo compuesto

  • Con la model compose operación, puede asignar hasta 500 modelos a un identificador de modelo único. Si el número de modelos que quiero componer supera el límite superior de un modelo compuesto, puede usar una de estas alternativas:

  • El análisis de un documento mediante modelos compuestos es idéntico al análisis de un documento mediante un único modelo. El Analyze Document resultado devuelve una docType propiedad que indica cuál de los modelos de componentes seleccionó para analizar el documento.

  • Actualmente, la model compose operación solo está disponible para modelos personalizados entrenados con etiquetas.

Compatibilidad de modelos compuestos

Tipo de modelo personalizado Modelos entrenados con v2.1 y v2.0 Plantilla personalizada y modelos neuronales v3.1 y v3.0 Plantilla personalizada y modelos neuronales v4.0 2024-11-30 (GA)
Modelos entrenados con la versión 2.1 y v2.0 No compatible No compatible No compatible
Plantilla personalizada y modelos neuronales v3.0 y v3.1 No compatible Soportado Soportado
Plantilla personalizada y modelos neuronales v4.0 No compatible Soportado Soportado
  • Para crear un modelo entrenado con una versión anterior de la API (v2.1 o anterior), entrene un modelo con la API v3.0 mediante el mismo conjunto de datos etiquetado. Esa adición garantiza que el modelo v2.1 se pueda componer con otros modelos.

  • Con los modelos compuestos mediante la versión 2.1 de la API sigue siendo compatible, sin necesidad de actualizaciones.

Opciones de desarrollo

Document Intelligence v4.0:2024-11-30 (GA) admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica Recursos
Modelo personalizado Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK
Modelo compuesto Document Intelligence Studio
REST API
C# SDK
Java SDK
SDK de JavaScript
Python SDK

Document Intelligence v3.1:2023-07-31 (GA) admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica Recursos
Modelo personalizado Document Intelligence Studio
REST API
C# SDK
Java SDK
SDK de JavaScript
Python SDK
Modelo compuesto Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

Document Intelligence v3.0:2022-08-31 (GA) admite las siguientes herramientas, aplicaciones y bibliotecas:

Característica Recursos
Modelo personalizado Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK
Modelo compuesto Document Intelligence Studio
REST API
C# SDK
Java SDK
SDK de JavaScript
Python SDK

Document Intelligence v2.1 admite los siguientes recursos:

Característica Recursos
Modelo personalizado Herramienta de Etiquetado de Inteligencia de DocumentosREST API• SDK de la biblioteca del clienteContenedor Docker de Inteligencia de Documentos
Modelo compuesto Document Intelligence labeling tool
REST API
C# SDK
Java SDK
• SDK de JavaScript
Python SDK

Pasos siguientes

Aprende a crear y componer modelos personalizados: