Modello di fattura di Document Intelligence

Questo contenuto si applica a:checkmarkv4.0 (GA) | Versioni precedenti:blue-checkmarkv3.1 (GA)red-checkmarkv3.0 (ritiro)red-checkmarkv2.1 (ritiro)

::: moniker-end

Questo contenuto si applica a:segno di spuntav3.1 (GA) | Versione più recente:segno di spunta violav4.0 (GA) | Versioni precedenti:segno di spunta bluv3.0segno di spunta bluv2.1

Questo contenuto si applica a:segno di spunta rossov3.0 (in dismissione) | Versioni più recenti:segno di spunta violav4.0 (GA)segno di spunta violav3.1 | Versione precedente:segno di spunta bluv2.1 (in dismissione)

Questo contenuto si applica a:red-checkmarkv2.1 | Versione più recente:blue-checkmarkv4.0 (GA)

Il modello di fattura di Document Intelligence usa potenti funzionalità di riconoscimento ottico dei caratteri (OCR) per analizzare ed estrarre campi chiave ed elementi di riga da fatture di vendita, fatture di utilità e ordini di acquisto. Le fatture possono essere di vari formati e qualità, tra cui immagini acquisite dal telefono, documenti analizzati e PDF digitali. L'API analizza il testo della fattura; estrae le informazioni chiave, ad esempio il nome del cliente, l'indirizzo di fatturazione, la data di scadenza e l'importo dovuto; e restituisce una rappresentazione di dati JSON strutturata. Il modello supporta attualmente le fatture in 27 lingue.

Tipi di documento supportati:

  • Fatture
  • Bollette delle utenze
  • Ordini di vendita
  • Ordini di acquisto

Elaborazione automatica delle fatture

L'elaborazione automatica delle fatture è il processo di estrazione dei campi chiave accounts payable dai documenti dell'account di fatturazione. I dati estratti includono le voci delle fatture integrate con i flussi di lavoro dei conti pagabili (AP) per revisioni e pagamenti. Storicamente, il processo di contabilità fornitori viene eseguito manualmente e, di conseguenza, è molto dispendioso in termini di tempo. L'estrazione accurata dei dati chiave dalle fatture è in genere il primo e uno dei passaggi più critici del processo di automazione delle fatture.

Fattura di esempio elaborata con Document Intelligence Studio:

Screenshot di una fattura di esempio analizzata in Document Intelligence Studio.

Esempio di fattura elaborata con lo strumento di etichettatura di esempio di Document Intelligence:

Screenshot di una fattura di esempio.

Opzioni di sviluppo

Document Intelligence v4.0: 2024-11-30 (GA) supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse ID modello
Modello di fattura Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
fattura predefinita

Document Intelligence v3.1 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse ID modello
Modello di fattura Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
fattura predefinita

Document Intelligence v3.0 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse ID modello
Modello di fattura Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
fattura predefinita

Document Intelligence v2.1 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse
Modello di fattura Strumento di etichettatura
di Document Intelligence• API
REST• SDK
della libreria client• Contenitore Docker di Document Intelligence

Requisiti di input

Sono supportati i formati di file seguenti.

Modello PDF Immagine:
JPEG/JPG, PNG, BMP, TIFF, HEIF
Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Leggere
Struttura
Documento generale
Preassemblato
Estrazione personalizzata
Classificazione personalizzata
  • Foto e scansioni: per ottenere risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.
  • PDF e TIFF: per pdf e TIFF, è possibile elaborare fino a 2.000 pagine. Con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine.
  • Dimensioni file: le dimensioni del file per l'analisi dei documenti sono pari a 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).
  • Dimensioni immagine: le dimensioni devono essere comprese tra 50 pixel x 50 pixel e 10.000 pixel x 10.000 pixel.
  • Blocchi password: se i PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.
  • Altezza del testo: l'altezza minima del testo da estrarre è di 12 pixel per un'immagine da 1024 x 768 pixel. Questa dimensione corrisponde a circa 8 punti di testo a 150 punti per pollice.
  • Addestramento del modello personalizzato: il numero massimo di pagine per i dati di addestramento è 500 per il modello su misura personalizzato e 50.000 per il modello neurale personalizzato.
  • Training del modello di estrazione personalizzato: la dimensione totale dei dati di training è di 50 MB per il modello di template e 1 GB per il modello neurale.
  • Training del modello di classificazione personalizzato: le dimensioni totali dei dati di training sono pari a 1 GB con un massimo di 10.000 pagine. Per 2024-11-30 (GA), le dimensioni totali dei dati di training sono pari a 2 GB con un massimo di 10.000 pagine.
  • Tipi di file di Office (DOCX, XLSX, PPTX): il limite massimo di lunghezza della stringa è di 8 milioni di caratteri.
  • Formati di file supportati: JPEG, PNG, PDF e TIFF.
  • PDF e TIFF supportati, vengono elaborate fino a 2.000 pagine. Per i sottoscrittori del livello gratuito, vengono elaborate solo le prime due pagine.
  • Le dimensioni del file supportate devono essere inferiori a 50 MB e dimensioni almeno 50 x 50 pixel e al massimo 10.000 x 10.000 pixel.

Estrazione dei dati del modello di fattura

Vedere in che modo i dati, incluse le informazioni sui clienti, i dettagli del fornitore e le voci, vengono estratti dalle fatture. Sono necessarie le risorse seguenti:

  • Una sottoscrizione Azure: è possibile crearne una gratuitamente.

  • Istanza Document Intelligence nel portale di Azure. È possibile usare il piano tariffario gratuito (F0) per provare il servizio. Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per ottenere la chiave e l'endpoint.

Screenshot delle chiavi e della posizione dell'endpoint nel portale di Azure.

  1. Nella home page di Document Intelligence Studio selezionare Fatture.

  2. È possibile analizzare la fattura di esempio o caricare i propri file.

  3. Selezionare il pulsante Esegui analisi e, se necessario, configurare le opzioni Analizza :

    Screenshot dei pulsanti Esegui analisi e Analizza opzioni in Document Intelligence Studio.

Strumento di etichettatura di esempio di Document Intelligence

  1. Passare allo strumento di esempio di Informazioni sui documenti.

  2. Nella home page dello strumento di esempio selezionare il riquadro Usa modello predefinito per ottenere i dati .

    Screenshot del processo di analisi dei risultati del modello di layout.

  3. Selezionare il tipo di modulo da analizzare dal menu a discesa.

  4. Scegliere un URL per il file da analizzare dalle opzioni seguenti:

  5. Nel campo Origine selezionare URL dal menu a discesa, incollare l'URL selezionato e selezionare il pulsante Recupera .

    Screenshot del menu a discesa del percorso di origine.

  6. Nel campo endpoint del servizio Document Intelligence, incolla l'endpoint che hai ottenuto con la tua sottoscrizione a Document Intelligence.

  7. Nel campo chiave incolla la chiave ottenuta dalla risorsa di intelligence dei documenti.

    Screenshot che mostra il menu a discesa select-form-type.

  8. Selezionare Esegui analisi. Lo strumento di etichettatura di esempio per Document Intelligence chiama l'API Analizza predefinita e analizza il documento.

  9. Visualizza i risultati - vedere le coppie chiave-valore estratte, elementi di riga, testo evidenziato estratto e tabelle rilevate.

    Screenshot dei risultati dell'operazione di analisi del modello di layout.

Nota

Lo strumento di etichettatura di esempio non supporta il formato di file BMP. Si tratta di una limitazione dello strumento, non del Servizio di Document Intelligence.

Lingue e impostazioni locali supportate

Per un elenco completo delle lingue supportate, vedere la pagina di supporto del linguaggio del modello predefinito .

Estrazione di campi

  • Per i campi di estrazione dei documenti supportati, vedere la pagina dello schema del modello di fattura nel repository di esempio GitHub.

  • Le coppie chiave-valore della fattura e gli elementi di riga estratti sono nella documentResults sezione dell'output JSON.

Coppie chiave-valore

Il modello di fattura predefinito supporta la restituzione facoltativa di coppie chiave-valore. Per impostazione predefinita, la restituzione di coppie chiave-valore è disabilitata. Le coppie chiave-valore sono intervalli specifici all'interno della fattura che identificano un'etichetta o una chiave e la risposta o il valore associato. In una fattura, queste coppie possono essere l'etichetta e il valore immesso dall'utente per tale campo o numero di telefono. Il modello di intelligenza artificiale viene sottoposto a training per estrarre chiavi e valori identificabili in base a un'ampia gamma di tipi di documento, formati e strutture.

Le chiavi possono esistere anche in isolamento quando il modello rileva che esiste una chiave, senza alcun valore associato o durante l'elaborazione di campi facoltativi. Ad esempio, un campo del secondo nome può essere lasciato vuoto in un modulo in alcune istanze. Le coppie chiave-valore sono sempre intervalli di testo contenuti nel documento. Per i documenti in cui lo stesso valore viene descritto in modi diversi, ad esempio cliente/utente, la chiave associata è cliente o utente (in base al contesto).

Output JSON

L'output JSON ha tre parti:

  • "readResults" node contiene tutti i segni di testo e selezione riconosciuti. Il testo è organizzato tramite pagina, quindi per riga, quindi per singole parole.
  • Il nodo "pageResults" contiene le tabelle e le celle estratte con i loro limiti di delimitazione, il livello di attendibilità e un riferimento alle righe e alle parole in readResults.
  • "documentResults" node contiene i valori e gli elementi di riga specifici della fattura individuati dal modello. È la posizione in cui trovare tutti i campi della fattura, ad esempio l'ID fattura, la spedizione, l'indirizzo di spedizione e di fatturazione, il cliente, il totale, gli articoli e molto altro ancora.

Guida alla migrazione

::: moniker-end

Passaggi successivi