Modello di ricevuta di Document Intelligence

Questo contenuto si applica a:checkmarkv4.0 (GA) | Versioni precedenti:blue-checkmarkv3.1 (GA)red-checkmarkv3.0 (ritiro)red-checkmarkv2.1 (ritiro)

Questo contenuto si applica a:segno di spuntav3.1 (GA) | Versione più recente:segno di spunta violav4.0 (GA) | Versioni precedenti:segno di spunta bluv3.0segno di spunta bluv2.1

Questo contenuto si applica a:segno di spunta rossov3.0 (in dismissione) | Versioni più recenti:segno di spunta violav4.0 (GA)segno di spunta violav3.1 | Versione precedente:segno di spunta bluv2.1 (in dismissione)

Questo contenuto si applica a:red-checkmarkv2.1 | Versione più recente:blue-checkmarkv4.0 (GA)

Il modello di ricevuta di Document Intelligence combina potenti funzionalità di riconoscimento ottico dei caratteri (OCR) con modelli di Deep Learning per analizzare ed estrarre informazioni chiave dalle ricevute di vendita. Le ricevute possono essere di vari formati e qualità, tra cui ricevute stampate e scritte a mano. L'API estrae informazioni chiave come il nome del commerciante, il numero di telefono del commerciante, la data della transazione, l'imposta e il totale delle transazioni e restituisce dati JSON strutturati. Il modello di ricevuta v4.0 (GA) supporta altri campi, tra cui ReceiptType, TaxDetails.NetAmount, TaxDetails.DescriptionTaxDetails.Ratee CountryRegion l'estrazione della tabella IVA sulle ricevute di hotel generali.

Estrazione dati da ricevute

La digitalizzazione delle ricevute comprende la trasformazione di vari tipi di ricevute, tra cui copie digitalizzate, fotografate e stampate, in un formato digitale per un'elaborazione downstream semplificata. Alcuni esempi includono gestione delle spese, analisi del comportamento dei consumatori, automazione fiscale e così via. L'uso di Document Intelligence con la tecnologia OCR (Optical Character Recognition) può estrarre e interpretare i dati da questi diversi formati di ricevuta. L'elaborazione di Intelligence sui documenti semplifica il processo di conversione, ma riduce notevolmente il tempo e il lavoro richiesto, semplificando così una gestione efficiente dei dati e il recupero.

Conferma di esempio elaborata con Document Intelligence Studio:

Screenshot di una ricevuta di esempio elaborata in Document Intelligence Studio.

Ricevuta di esempio elaborata con lo strumento di etichettatura di esempio di Document Intelligence:

Schermata di una ricevuta di esempio elaborata con lo strumento di etichettatura di campioni di moduli.

Opzioni di sviluppo

Document Intelligence v4.0: 2024-11-30 (GA) supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse ID modello
Modello di ricevuta Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
ricevuta preconfigurata

Document Intelligence v3.1 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse ID modello
Modello di ricevuta Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
ricevuta predefinita

Document Intelligence v3.0 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse ID modello
Modello di ricevuta Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
ricevuta predefinita

Document Intelligence v2.1 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse
Modello di ricevuta Strumento di etichettatura
di Document Intelligence• API
REST• SDK
della libreria client• Contenitore Docker di Document Intelligence

Requisiti di input

Sono supportati i formati di file seguenti.

Modello PDF Immagine:
JPEG/JPG, PNG, BMP, TIFF, HEIF
Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Leggere
Layout
Documento generale
Preassemblato
Estrazione personalizzata
Classificazione personalizzata
  • Foto e scansioni: per ottenere risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.
  • PDF e TIFF: per pdf e TIFF, è possibile elaborare fino a 2.000 pagine. Con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine.
  • Dimensioni file: le dimensioni del file per l'analisi dei documenti sono pari a 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).
  • Dimensioni immagine: le dimensioni devono essere comprese tra 50 pixel x 50 pixel e 10.000 pixel x 10.000 pixel.
  • Blocchi password: se i PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.
  • Altezza del testo: l'altezza minima del testo da estrarre è di 12 pixel per un'immagine da 1024 x 768 pixel. Questa dimensione corrisponde a circa 8 punti di testo a 150 punti per pollice.
  • Addestramento del modello personalizzato: il numero massimo di pagine per i dati di addestramento è 500 per il modello su misura personalizzato e 50.000 per il modello neurale personalizzato.
  • Training del modello di estrazione personalizzato: la dimensione totale dei dati di training è di 50 MB per il modello di template e 1 GB per il modello neurale.
  • Training del modello di classificazione personalizzato: le dimensioni totali dei dati di training sono pari a 1 GB con un massimo di 10.000 pagine. Per 2024-11-30 (GA), le dimensioni totali dei dati di training sono pari a 2 GB con un massimo di 10.000 pagine.
  • Tipi di file di Office (DOCX, XLSX, PPTX): il limite massimo di lunghezza della stringa è di 8 milioni di caratteri.
  • Formati di file supportati: JPEG, PNG, PDF e TIFF.
  • Supporto per pdf e TIFF: Document Intelligence può elaborare fino a 2.000 pagine per sottoscrittori di livello standard o solo le prime due pagine per i sottoscrittori di livello gratuito.
  • Dimensioni del file supportate: minore di 50 MB; pixel minimo 50 x 50 px; pixel massimi 10.000 x 10.000 px.

Estrazione dei dati del modello di ricevuta

Scopri in che modo Document Intelligence estrae i dati, inclusi l'ora e la data delle transazioni, le informazioni sui commercianti e i totali degli importi delle ricevute. Sono necessarie le risorse seguenti:

  • Una sottoscrizione Azure: è possibile crearne una gratuitamente.

  • Istanza Document Intelligence nel portale di Azure. È possibile usare il piano tariffario gratuito (F0) per provare il servizio. Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per ottenere la chiave e l'endpoint.

Screenshot delle chiavi e della posizione dell'endpoint nel portale di Azure.

Nota

Document Intelligence Studio è disponibile con le API v3.1 e v3.0 e versioni successive.

  1. Nella home page di Document Intelligence Studio selezionare Ricevute.

  2. È possibile analizzare la ricevuta di esempio o caricare i propri file.

  3. Selezionare il pulsante Esegui analisi e, se necessario, configurare le opzioni Analizza:

    Screenshot dei pulsanti Esegui analisi e Analizza opzioni in Document Intelligence Studio.

Strumento di etichettatura di esempio di Document Intelligence

  1. Passare allo strumento di esempio di Informazioni sui documenti.

  2. Nella home page dello strumento di esempio selezionare il riquadro Usa modello predefinito per ottenere i dati .

    Screenshot del processo di analisi dei risultati del modello di layout.

  3. Selezionare il tipo di modulo da analizzare dal menu a discesa.

  4. Scegliere un URL per il file da analizzare dalle opzioni seguenti:

  5. Nel campo Origine selezionare URL dal menu a discesa, incollare l'URL selezionato e selezionare il pulsante Recupera .

    Screenshot del menu a discesa del percorso di origine.

  6. Nel campo endpoint del servizio Document Intelligence, incolla l'endpoint che hai ottenuto con la tua sottoscrizione a Document Intelligence.

  7. Nel campo chiave incolla la chiave ottenuta dalla risorsa di intelligence dei documenti.

    Screenshot del menu a discesa

  8. Selezionare Esegui analisi. Lo strumento di etichettatura di esempio per Document Intelligence chiama l'API Analizza predefinita e analizza il documento.

  9. Visualizza i risultati - vedere le coppie chiave-valore estratte, elementi di riga, testo evidenziato estratto e tabelle rilevate.

    Screenshot dell'operazione di analisi dei risultati del modello di layout.

Nota

Lo strumento di etichettatura di esempio non supporta il formato di file BMP. Si tratta di una limitazione dello strumento, non del Servizio di Document Intelligence.

Lingue e impostazioni locali supportate

Per un elenco completo delle lingue supportate, vedere la pagina di supporto per i modelli predefiniti .

Estrazione di campi

Per i campi di estrazione dei documenti supportati, vedere la pagina dello schema del modello di ricevuta nel repository di esempio GitHub

Nome Digitare Descrizione Output standardizzato
TipoDiRicevuta Stringa Tipo di ricevuta di vendita Elencato
MerchantName Stringa Nome del commerciante che emette la ricevuta
MerchantPhoneNumber Numero di telefono Numero di telefono elencato del commerciante +1 xxx xxx xxxx
indirizzo del commerciante Stringa Indirizzo elencato del commerciante
TransactionDate Data Data di emissione della ricevuta yyyy-mm-dd
Tempo di Transazione Tempo Ora di emissione della ricevuta hh-mm-ss (24 ore)
Totale Numero (USD) Totale transazioni di ricezione Due decimali con virgola mobile
Subtotale Numero (USD) Subtotale della ricevuta, spesso prima dell'applicazione delle imposte Float a due decimali
Tassa Numero (USD) Imposta totale sulla ricevuta (spesso iva o equivalente). Rinominato in "TotalTax" nella versione 2022-06-30. Float a due decimali
Suggerimento Numero (USD) Mancia inclusa dall'acquirente Float a due decimali
Elementi Matrice di oggetti Voci estratte, con nome, quantità, prezzo unitario e prezzo totale estratto
Nome Stringa Descrizione dell'elemento. Rinominato a "Descrizione" nella versione 2022-06-30.
Quantità Numero Quantità di ogni articolo Due decimali con virgola mobile
Prezzo Numero Prezzo singolo di ogni unità articolo Float a due decimali
PrezzoTotale Numero Prezzo totale della voce Due decimali con virgola mobile

Guida alla migrazione e API REST v3.1

Passaggi successivi