Modello di ricevuta di Document Intelligence

Questo contenuto si applica a:v4.0 (GA) | Versioni precedenti:v3.1 (GA)v3.0 (ritiro)v2.1 (ritiro)

Questo contenuto si applica a:v3.1 (GA) | Versione più recente:v4.0 (GA) | Versioni precedenti:v3.0v2.1

Questo contenuto si applica a:v3.0 (in dismissione) | Versioni più recenti:v4.0 (GA)v3.1 | Versione precedente:v2.1 (in dismissione)

Questo contenuto si applica a:v2.1 | Versione più recente:v4.0 (GA)

Il modello di ricevuta di Document Intelligence combina potenti funzionalità di riconoscimento ottico dei caratteri (OCR) con modelli di Deep Learning per analizzare ed estrarre informazioni chiave dalle ricevute di vendita. Le ricevute possono essere di vari formati e qualità, tra cui ricevute stampate e scritte a mano. L'API estrae informazioni chiave come il nome del commerciante, il numero di telefono del commerciante, la data della transazione, l'imposta e il totale delle transazioni e restituisce dati JSON strutturati. Il modello di ricevuta v4.0 (GA) supporta altri campi, tra cui ReceiptType, TaxDetails.NetAmount, TaxDetails.DescriptionTaxDetails.Ratee CountryRegion l'estrazione della tabella IVA sulle ricevute di hotel generali.

Estrazione dati da ricevute

La digitalizzazione delle ricevute comprende la trasformazione di vari tipi di ricevute, tra cui copie digitalizzate, fotografate e stampate, in un formato digitale per un'elaborazione downstream semplificata. Alcuni esempi includono gestione delle spese, analisi del comportamento dei consumatori, automazione fiscale e così via. L'uso di Document Intelligence con la tecnologia OCR (Optical Character Recognition) può estrarre e interpretare i dati da questi diversi formati di ricevuta. L'elaborazione di Intelligence sui documenti semplifica il processo di conversione, ma riduce notevolmente il tempo e il lavoro richiesto, semplificando così una gestione efficiente dei dati e il recupero.

Conferma di esempio elaborata con Document Intelligence Studio:

Ricevuta di esempio elaborata con lo strumento di etichettatura di esempio di Document Intelligence:

Schermata di una ricevuta di esempio elaborata con lo strumento di etichettatura di campioni di moduli.

Opzioni di sviluppo

Document Intelligence v4.0: 2024-11-30 (GA) supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità	Risorse	ID modello
Modello di ricevuta	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	ricevuta preconfigurata

Document Intelligence v3.1 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità	Risorse	ID modello
Modello di ricevuta	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	ricevuta predefinita

Document Intelligence v3.0 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità	Risorse	ID modello
Modello di ricevuta	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	ricevuta predefinita

Document Intelligence v2.1 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità	Risorse
Modello di ricevuta	• Strumento di etichettatura di Document Intelligence• API REST• SDK della libreria client• Contenitore Docker di Document Intelligence

Requisiti di input

Sono supportati i formati di file seguenti.

Modello	PDF	Immagine: JPEG/JPG, PNG, BMP, TIFF, HEIF	Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Leggere	✔	✔	✔
Layout	✔	✔	✔
Documento generale	✔	✔
Preassemblato	✔	✔
Estrazione personalizzata	✔	✔
Classificazione personalizzata	✔	✔	✔

Foto e scansioni: per ottenere risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.
PDF e TIFF: per pdf e TIFF, è possibile elaborare fino a 2.000 pagine. Con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine.
Dimensioni file: le dimensioni del file per l'analisi dei documenti sono pari a 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).
Dimensioni immagine: le dimensioni devono essere comprese tra 50 pixel x 50 pixel e 10.000 pixel x 10.000 pixel.
Blocchi password: se i PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.
Altezza del testo: l'altezza minima del testo da estrarre è di 12 pixel per un'immagine da 1024 x 768 pixel. Questa dimensione corrisponde a circa 8 punti di testo a 150 punti per pollice.
Addestramento del modello personalizzato: il numero massimo di pagine per i dati di addestramento è 500 per il modello su misura personalizzato e 50.000 per il modello neurale personalizzato.
Training del modello di estrazione personalizzato: la dimensione totale dei dati di training è di 50 MB per il modello di template e 1 GB per il modello neurale.
Training del modello di classificazione personalizzato: le dimensioni totali dei dati di training sono pari a 1 GB con un massimo di 10.000 pagine. Per 2024-11-30 (GA), le dimensioni totali dei dati di training sono pari a 2 GB con un massimo di 10.000 pagine.
Tipi di file di Office (DOCX, XLSX, PPTX): il limite massimo di lunghezza della stringa è di 8 milioni di caratteri.

Formati di file supportati: JPEG, PNG, PDF e TIFF.
Supporto per pdf e TIFF: Document Intelligence può elaborare fino a 2.000 pagine per sottoscrittori di livello standard o solo le prime due pagine per i sottoscrittori di livello gratuito.
Dimensioni del file supportate: minore di 50 MB; pixel minimo 50 x 50 px; pixel massimi 10.000 x 10.000 px.

Estrazione dei dati del modello di ricevuta

Scopri in che modo Document Intelligence estrae i dati, inclusi l'ora e la data delle transazioni, le informazioni sui commercianti e i totali degli importi delle ricevute. Sono necessarie le risorse seguenti:

Una sottoscrizione Azure: è possibile crearne una gratuitamente.
Istanza Document Intelligence nel portale di Azure. È possibile usare il piano tariffario gratuito (F0) per provare il servizio. Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per ottenere la chiave e l'endpoint.

Screenshot delle chiavi e della posizione dell'endpoint nel portale di Azure.

Nota

Document Intelligence Studio è disponibile con le API v3.1 e v3.0 e versioni successive.

Nella home page di Document Intelligence Studio selezionare Ricevute.
È possibile analizzare la ricevuta di esempio o caricare i propri file.
Selezionare il pulsante Esegui analisi e, se necessario, configurare le opzioni Analizza:

Provare Document Intelligence Studio.

Strumento di etichettatura di esempio di Document Intelligence

Passare allo strumento di esempio di Informazioni sui documenti.
Nella home page dello strumento di esempio selezionare il riquadro Usa modello predefinito per ottenere i dati .
Selezionare il tipo di modulo da analizzare dal menu a discesa.
Scegliere un URL per il file da analizzare dalle opzioni seguenti:
Nel campo Origine selezionare URL dal menu a discesa, incollare l'URL selezionato e selezionare il pulsante Recupera .
Nel campo endpoint del servizio Document Intelligence, incolla l'endpoint che hai ottenuto con la tua sottoscrizione a Document Intelligence.
Nel campo chiave incolla la chiave ottenuta dalla risorsa di intelligence dei documenti.
Selezionare Esegui analisi. Lo strumento di etichettatura di esempio per Document Intelligence chiama l'API Analizza predefinita e analizza il documento.
Visualizza i risultati - vedere le coppie chiave-valore estratte, elementi di riga, testo evidenziato estratto e tabelle rilevate.

Nota

Lo strumento di etichettatura di esempio non supporta il formato di file BMP. Si tratta di una limitazione dello strumento, non del Servizio di Document Intelligence.

Lingue e impostazioni locali supportate

Per un elenco completo delle lingue supportate, vedere la pagina di supporto per i modelli predefiniti .

Estrazione di campi

Per i campi di estrazione dei documenti supportati, vedere la pagina dello schema del modello di ricevuta nel repository di esempio GitHub

Nome	Digitare	Descrizione	Output standardizzato
TipoDiRicevuta	Stringa	Tipo di ricevuta di vendita	Elencato
MerchantName	Stringa	Nome del commerciante che emette la ricevuta
MerchantPhoneNumber	Numero di telefono	Numero di telefono elencato del commerciante	+1 xxx xxx xxxx
indirizzo del commerciante	Stringa	Indirizzo elencato del commerciante
TransactionDate	Data	Data di emissione della ricevuta	yyyy-mm-dd
Tempo di Transazione	Tempo	Ora di emissione della ricevuta	hh-mm-ss (24 ore)
Totale	Numero (USD)	Totale transazioni di ricezione	Due decimali con virgola mobile
Subtotale	Numero (USD)	Subtotale della ricevuta, spesso prima dell'applicazione delle imposte	Float a due decimali
Tassa	Numero (USD)	Imposta totale sulla ricevuta (spesso iva o equivalente). Rinominato in "TotalTax" nella versione 2022-06-30.	Float a due decimali
Suggerimento	Numero (USD)	Mancia inclusa dall'acquirente	Float a due decimali
Elementi	Matrice di oggetti	Voci estratte, con nome, quantità, prezzo unitario e prezzo totale estratto
Nome	Stringa	Descrizione dell'elemento. Rinominato a "Descrizione" nella versione 2022-06-30.
Quantità	Numero	Quantità di ogni articolo	Due decimali con virgola mobile
Prezzo	Numero	Prezzo singolo di ogni unità articolo	Float a due decimali
PrezzoTotale	Numero	Prezzo totale della voce	Due decimali con virgola mobile

Guida alla migrazione e API REST v3.1

Seguire la guida alla migrazione di Document Intelligence v3.1 per informazioni su come usare la versione v3.1 nelle applicazioni e nei flussi di lavoro.

Passaggi successivi

Provare a elaborare moduli e documenti personalizzati con Document Intelligence Studio.
Completare una guida introduttiva su Document Intelligence e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo che preferisci.

Find altri esempi su GitHub.

Find altri esempi su GitHub.

Provare a elaborare moduli e documenti personalizzati con lo strumento di etichettatura di esempio di Document Intelligence.
Completare un avvio rapido di Informazioni sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2026-05-08