Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Questo contenuto si applica a:
v4.0 (GA) | Versioni precedenti:
v3.1 (GA)
v3.0 (ritiro)
v2.1 (ritiro)
Questo contenuto si applica a:
v3.1 (GA) | Versione più recente:
v4.0 (GA) | Versioni precedenti:
v3.0
v2.1
Questo contenuto si applica a:
v3.0 (in dismissione) | Versioni più recenti:
v4.0 (GA)
v3.1 | Versione precedente:
v2.1 (in dismissione)
Questo contenuto si applica a:
v2.1 | Versione più recente:
v4.0 (GA)
Il modello di ricevuta di Document Intelligence combina potenti funzionalità di riconoscimento ottico dei caratteri (OCR) con modelli di Deep Learning per analizzare ed estrarre informazioni chiave dalle ricevute di vendita. Le ricevute possono essere di vari formati e qualità, tra cui ricevute stampate e scritte a mano. L'API estrae informazioni chiave come il nome del commerciante, il numero di telefono del commerciante, la data della transazione, l'imposta e il totale delle transazioni e restituisce dati JSON strutturati. Il modello di ricevuta v4.0 (GA) supporta altri campi, tra cui ReceiptType, TaxDetails.NetAmount, TaxDetails.DescriptionTaxDetails.Ratee CountryRegion l'estrazione della tabella IVA sulle ricevute di hotel generali.
Estrazione dati da ricevute
La digitalizzazione delle ricevute comprende la trasformazione di vari tipi di ricevute, tra cui copie digitalizzate, fotografate e stampate, in un formato digitale per un'elaborazione downstream semplificata. Alcuni esempi includono gestione delle spese, analisi del comportamento dei consumatori, automazione fiscale e così via. L'uso di Document Intelligence con la tecnologia OCR (Optical Character Recognition) può estrarre e interpretare i dati da questi diversi formati di ricevuta. L'elaborazione di Intelligence sui documenti semplifica il processo di conversione, ma riduce notevolmente il tempo e il lavoro richiesto, semplificando così una gestione efficiente dei dati e il recupero.
Conferma di esempio elaborata con Document Intelligence Studio:
Ricevuta di esempio elaborata con lo strumento di etichettatura di esempio di Document Intelligence:
Opzioni di sviluppo
Document Intelligence v4.0: 2024-11-30 (GA) supporta gli strumenti, le applicazioni e le librerie seguenti:
| Funzionalità | Risorse | ID modello |
|---|---|---|
| Modello di ricevuta | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
ricevuta preconfigurata |
Document Intelligence v3.1 supporta gli strumenti, le applicazioni e le librerie seguenti:
| Funzionalità | Risorse | ID modello |
|---|---|---|
| Modello di ricevuta | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
ricevuta predefinita |
Document Intelligence v3.0 supporta gli strumenti, le applicazioni e le librerie seguenti:
| Funzionalità | Risorse | ID modello |
|---|---|---|
| Modello di ricevuta | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
ricevuta predefinita |
Document Intelligence v2.1 supporta gli strumenti, le applicazioni e le librerie seguenti:
| Funzionalità | Risorse |
|---|---|
| Modello di ricevuta | • Strumento di etichettatura di Document Intelligence• API REST• SDK della libreria client• Contenitore Docker di Document Intelligence |
Requisiti di input
Sono supportati i formati di file seguenti.
| Modello | Immagine: JPEG/JPG, PNG, BMP, TIFF, HEIF |
Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML |
|
|---|---|---|---|
| Leggere | ✔ | ✔ | ✔ |
| Layout | ✔ | ✔ | ✔ |
| Documento generale | ✔ | ✔ | |
| Preassemblato | ✔ | ✔ | |
| Estrazione personalizzata | ✔ | ✔ | |
| Classificazione personalizzata | ✔ | ✔ | ✔ |
- Foto e scansioni: per ottenere risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.
- PDF e TIFF: per pdf e TIFF, è possibile elaborare fino a 2.000 pagine. Con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine.
- Dimensioni file: le dimensioni del file per l'analisi dei documenti sono pari a 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).
- Dimensioni immagine: le dimensioni devono essere comprese tra 50 pixel x 50 pixel e 10.000 pixel x 10.000 pixel.
- Blocchi password: se i PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.
- Altezza del testo: l'altezza minima del testo da estrarre è di 12 pixel per un'immagine da 1024 x 768 pixel. Questa dimensione corrisponde a circa 8 punti di testo a 150 punti per pollice.
- Addestramento del modello personalizzato: il numero massimo di pagine per i dati di addestramento è 500 per il modello su misura personalizzato e 50.000 per il modello neurale personalizzato.
- Training del modello di estrazione personalizzato: la dimensione totale dei dati di training è di 50 MB per il modello di template e 1 GB per il modello neurale.
- Training del modello di classificazione personalizzato: le dimensioni totali dei dati di training sono pari a 1 GB con un massimo di 10.000 pagine. Per 2024-11-30 (GA), le dimensioni totali dei dati di training sono pari a 2 GB con un massimo di 10.000 pagine.
- Tipi di file di Office (DOCX, XLSX, PPTX): il limite massimo di lunghezza della stringa è di 8 milioni di caratteri.
- Formati di file supportati: JPEG, PNG, PDF e TIFF.
- Supporto per pdf e TIFF: Document Intelligence può elaborare fino a 2.000 pagine per sottoscrittori di livello standard o solo le prime due pagine per i sottoscrittori di livello gratuito.
- Dimensioni del file supportate: minore di 50 MB; pixel minimo 50 x 50 px; pixel massimi 10.000 x 10.000 px.
Estrazione dei dati del modello di ricevuta
Scopri in che modo Document Intelligence estrae i dati, inclusi l'ora e la data delle transazioni, le informazioni sui commercianti e i totali degli importi delle ricevute. Sono necessarie le risorse seguenti:
Una sottoscrizione Azure: è possibile crearne una gratuitamente.
Istanza Document Intelligence nel portale di Azure. È possibile usare il piano tariffario gratuito (
F0) per provare il servizio. Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per ottenere la chiave e l'endpoint.
Nota
Document Intelligence Studio è disponibile con le API v3.1 e v3.0 e versioni successive.
Nella home page di Document Intelligence Studio selezionare Ricevute.
È possibile analizzare la ricevuta di esempio o caricare i propri file.
Selezionare il pulsante Esegui analisi e, se necessario, configurare le opzioni Analizza:
Strumento di etichettatura di esempio di Document Intelligence
Passare allo strumento di esempio di Informazioni sui documenti.
Nella home page dello strumento di esempio selezionare il riquadro Usa modello predefinito per ottenere i dati .
Selezionare il tipo di modulo da analizzare dal menu a discesa.
Scegliere un URL per il file da analizzare dalle opzioni seguenti:
Nel campo Origine selezionare URL dal menu a discesa, incollare l'URL selezionato e selezionare il pulsante Recupera .
Nel campo endpoint del servizio Document Intelligence, incolla l'endpoint che hai ottenuto con la tua sottoscrizione a Document Intelligence.
Nel campo chiave incolla la chiave ottenuta dalla risorsa di intelligence dei documenti.
Selezionare Esegui analisi. Lo strumento di etichettatura di esempio per Document Intelligence chiama l'API Analizza predefinita e analizza il documento.
Visualizza i risultati - vedere le coppie chiave-valore estratte, elementi di riga, testo evidenziato estratto e tabelle rilevate.
Nota
Lo strumento di etichettatura di esempio non supporta il formato di file BMP. Si tratta di una limitazione dello strumento, non del Servizio di Document Intelligence.
Lingue e impostazioni locali supportate
Per un elenco completo delle lingue supportate, vedere la pagina di supporto per i modelli predefiniti .
Estrazione di campi
Per i campi di estrazione dei documenti supportati, vedere la pagina dello schema del modello di ricevuta nel repository di esempio GitHub
| Nome | Digitare | Descrizione | Output standardizzato |
|---|---|---|---|
| TipoDiRicevuta | Stringa | Tipo di ricevuta di vendita | Elencato |
| MerchantName | Stringa | Nome del commerciante che emette la ricevuta | |
| MerchantPhoneNumber | Numero di telefono | Numero di telefono elencato del commerciante | +1 xxx xxx xxxx |
| indirizzo del commerciante | Stringa | Indirizzo elencato del commerciante | |
| TransactionDate | Data | Data di emissione della ricevuta | yyyy-mm-dd |
| Tempo di Transazione | Tempo | Ora di emissione della ricevuta | hh-mm-ss (24 ore) |
| Totale | Numero (USD) | Totale transazioni di ricezione | Due decimali con virgola mobile |
| Subtotale | Numero (USD) | Subtotale della ricevuta, spesso prima dell'applicazione delle imposte | Float a due decimali |
| Tassa | Numero (USD) | Imposta totale sulla ricevuta (spesso iva o equivalente). Rinominato in "TotalTax" nella versione 2022-06-30. | Float a due decimali |
| Suggerimento | Numero (USD) | Mancia inclusa dall'acquirente | Float a due decimali |
| Elementi | Matrice di oggetti | Voci estratte, con nome, quantità, prezzo unitario e prezzo totale estratto | |
| Nome | Stringa | Descrizione dell'elemento. Rinominato a "Descrizione" nella versione 2022-06-30. | |
| Quantità | Numero | Quantità di ogni articolo | Due decimali con virgola mobile |
| Prezzo | Numero | Prezzo singolo di ogni unità articolo | Float a due decimali |
| PrezzoTotale | Numero | Prezzo totale della voce | Due decimali con virgola mobile |
Guida alla migrazione e API REST v3.1
- Seguire la guida alla migrazione di Document Intelligence v3.1 per informazioni su come usare la versione v3.1 nelle applicazioni e nei flussi di lavoro.
Passaggi successivi
Provare a elaborare moduli e documenti personalizzati con Document Intelligence Studio.
Completare una guida introduttiva su Document Intelligence e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo che preferisci.
Provare a elaborare moduli e documenti personalizzati con lo strumento di etichettatura di esempio di Document Intelligence.
Completare un avvio rapido di Informazioni sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.