Aggiornamenti delle offerte gestite con provisioning di Azure OpenAI (versione classica)

Si applica solo a:Portale di Foundry (versione classica). Questo articolo non è disponibile per il nuovo portale foundry. Altre informazioni sul nuovo portale.

Nota

I collegamenti in questo articolo potrebbero aprire contenuto nella nuova documentazione di Microsoft Foundry anziché nella documentazione di Foundry (versione classica) visualizzata.

Microsoft ha lanciato miglioramenti all'offerta Throughput assegnato che rispondono al feedback dei clienti sull'usabilità e sull'agilità operativa, offrendo nuove opzioni di pagamento e scenari di distribuzione.

Questo articolo è destinato agli utenti esistenti dell'offerta di throughput assegnato. Si consiglia ai nuovi clienti di fare riferimento alla guida all'onboarding con provisioning di Azure OpenAI.

Cosa è cambiato?

Importante

Le modifiche in questo articolo descrivono le modifiche apportate all'offerta gestita con provisioning di agosto e dicembre 2024. Queste modifiche non si applicano all'offerta precedente "Provisioned Classic (PTU-C)". Influiscono solo sull'offerta Provisioned (nota anche come Provisioned Managed).

Miglioramenti dell'usabilità

Funzionalità Beneficio
Quota indipendente dal modello Un singolo limite di quota che copre tutti i modelli/versioni riduce l'amministrazione delle quote e accelera la sperimentazione con nuovi modelli.
Richieste di quota self-service Richiedere un aumento della quota senza coinvolgere il team di vendita: molti possono essere approvati automaticamente.
Quota predefinita gestita con provisioning in molte aree Iniziare rapidamente senza dover prima richiedere la quota.
Informazioni trasparenti sulla disponibilità della capacità in tempo reale + Nuovo flusso di distribuzione La ridotta negoziazione riguardante la disponibilità accelera il tempo di immissione sul mercato.
Distribuzioni con provisioning della zona dati Consente di sfruttare l'infrastruttura globale di Azure per instradare dinamicamente il traffico al data center all'interno della Microsoft zona dati definita con la migliore disponibilità per ogni richiesta. Per altre informazioni, vedere l'articolo sui tipi di distribuzione .

Nuovo modello commerciale orario/con prenotazione

Funzionalità Beneficio
Opzione non vincolante, oraria L'opzione di pagamento oraria senza alcun vincolo consente scenari di implementazione a breve termine. Ideale per testare nuovi modelli e valutare i vantaggi del throughput assegnato.
Sconti per termini tramite prenotazioni Azure Le Prenotazioni di Azure offrono sconti sostanziali sulla tariffa oraria per periodi di uno e dodici mesi e forniscono ambiti flessibili che riducono al minimo l'amministrazione e sono collegati agli impegni odierni relativi alle risorse.
Quota predefinita gestita con provisioning in molte aree Iniziare rapidamente in nuove aree senza dover richiedere prima la quota.
Scelta flessibile del modello di pagamento per i clienti con provisioning esistenti I clienti con impegni possono rimanere sul modello di impegno fino alla fine del ciclo di vita dei modelli attualmente supportati e possono scegliere di eseguire la migrazione degli impegni esistenti a prenotazioni/orarie tramite processo gestito. È consigliabile eseguire la migrazione a prenotazioni orarie/a termine per sfruttare gli sconti per periodi e per lavorare con i modelli più recenti.
Supporta le generazioni di modelli più recenti I modelli più recenti sono disponibili solo su base oraria/con prenotazione nell'offerta con provisioning.
Prezzi differenziati Maggiore flessibilità e controllo dei prezzi e delle prestazioni. Nel dicembre 2024 sono stati introdotti prezzi orari differenziati per provisionato globale, area dati provisionata e provisionato regionale con l'opzione per acquistare Azure Reservations per supportare sconti aggiuntivi. Per ulteriori informazioni sul prezzo orario di ciascun tipo di distribuzione provisionata, vedere la pagina Dettagli sui prezzi.

Dettagli del miglioramento dell'usabilità

La granularità della quota assegnata è stata modificata da specifica del modello a indipendente dal modello. Invece di ogni modello e versione all'interno di una sottoscrizione e di un'area con un proprio limite di quota, è presente un singolo elemento quota per sottoscrizione e area che limita il numero totale di PTU che possono essere distribuiti in tutti i modelli e le versioni supportati.

Quota indipendente dal modello

A partire dal 12 agosto 2024, la quota specifica dei clienti esistenti è stata convertita in una quota indipendente dal modello. Questo è successo automaticamente. Nessuna quota è stata persa nella transizione. I limiti di quota esistenti sono stati sommati e assegnati a un nuovo elemento di quota indipendente dal modello.

Diagramma che mostra il consolidamento delle quote.

La nuova quota indipendente dal modello viene visualizzata come elemento quota denominato Unità elaborate gestite assegnate, con il modello e la versione non più inclusi nel nome. Nel riquadro quota di Microsoft Foundry, l'espansione dell'elemento quota mostra ancora tutte le distribuzioni che contribuiscono all'elemento quota.

Quota predefinita

Alle nuove ed esistenti sottoscrizioni viene assegnata una piccola quantità di quota assegnata in molte regioni. In questo modo i clienti possono iniziare a usare tali aree senza dover richiedere prima la quota.

Per i clienti esistenti, se l'area contiene già un'assegnazione di quota, il limite di quota non viene modificato per l'area. Ad esempio, non viene aumentato automaticamente dalla nuova quantità predefinita.

Richieste di quota self-service

I clienti non ottengono più la quota contattando i team di vendita. Usano invece il modulo di richiesta di quota self-service e specificano il tipo di quota gestito da PTU. Il modulo è accessibile da un collegamento a destra dell'elemento quota. L'obiettivo è rispondere a tutte le richieste di quota entro due giorni lavorativi.

Lo screenshot della quota seguente mostra la quota indipendente dal modello usata da distribuzioni di tipi diversi e il collegamento per richiedere quota aggiuntiva.

Screenshot della nuova interfaccia utente tipo di richiesta per Azure OpenAI con provisioning per richiedere più quota.

Quota come limite

Prima dell'aggiornamento di agosto, Azure Provisioning OpenAI era disponibile solo per alcuni clienti e la quota è stata allocata per massimizzare la possibilità di distribuirle e usarle. Con queste modifiche, il processo di acquisizione della quota è semplificato per tutti gli utenti ed è più probabile che si verifichino limitazioni della capacità del servizio quando si tentano distribuzioni. È disponibile una nuova esperienza api e portale per aiutare gli utenti a trovare aree in cui la sottoscrizione ha quota e il servizio ha la capacità di supportare le distribuzioni di un modello desiderato.

Si consiglia inoltre che i clienti che usano impegni creino ora proprie distribuzioni prima di creare o ampliare gli impegni destinati a coprirli. Ciò garantisce che la capacità sia disponibile prima di creare un impegno e impedisca l'acquisto eccessivo dell'impegno. Per supportare questo, la restrizione che impediva di creare distribuzioni di dimensioni maggiori rispetto agli impegni è stata rimossa. Questo nuovo approccio alla quota, alla disponibilità della capacità e agli impegni corrisponde a ciò che viene fornito nel modello orario/prenotazione e le linee guida da distribuire prima di acquistare un impegno (o prenotazione per il modello orario) sono le stesse per entrambi.

Per altre informazioni, vedere i collegamenti seguenti. Le linee guida per prenotazioni e impegni sono le stesse:

Nuovo modello di pagamento per prenotazione oraria

Nota

La descrizione seguente dei modelli di pagamento non si applica all'offerta precedente "Provisioned Classic (PTU-C)". Influiscono solo sull'offerta Provisioned (nota anche come Provisioned Managed). La versione Classic con provisioning continua a essere disciplinata dal modello di pagamento mensile con impegno immutato.

Microsoft ha introdotto un nuovo modello di pagamento "orario/con prenotazione" per le distribuzioni con provisioning. Oltre al corrente modello di pagamento Commitment, che continuerà a essere supportato fino al termine del ciclo di vita dell'attuale elenco limitato di modelli supportati. Fare riferimento ai modelli supportati nel modello di pagamento su impegno per l'elenco dei modelli supportati nel modello di pagamento su impegno. È anche possibile acquistare Azure prenotazioni per supportare sconti aggiuntivi.

Nuove prenotazioni Azure per le distribuzioni globali e quelle effettuate nelle zone dati.

Oltre agli aggiornamenti per il modello di pagamento orario, nel dicembre 2024 sono state introdotte nuove Prenotazioni di Azure, specificamente per i tipi di distribuzione con provisioning globale e dell'area dati. Con queste nuove prenotazioni Azure, ogni tipo di distribuzione provisionata avrà una prenotazione Azure separata che può essere acquistata per supportare sconti aggiuntivi. La corrispondenza tra ciascun tipo di distribuzione provisionata e la Prenotazione Azure associata è la seguente:

Tipo di distribuzione con provisioning Nome SKU nel codice Nome del prodotto Prenotazione Azure
Con provisioning globale GlobalProvisionedManaged Gestita con provisioning globale
Zona dati con provisioning DataZoneProvisionedManaged Zona dati gestita con provisioning
Sottoposto a provisioning ProvisionedManaged Gestita con provisioning a livello di area

Importante

Le prenotazioni di Azure per le offerte con provisioning di Azure OpenAI non sono intercambiabili tra i tipi di distribuzione. La prenotazione di Azure acquistata deve essere conforme al tipo di distribuzione implementato. Se la prenotazione di Azure acquistata non corrisponde al tipo di distribuzione configurato, la distribuzione configurata verrà impostata automaticamente sul modello di pagamento orario fino a quando non viene acquistato un prodotto di prenotazione di Azure corrispondente. Per altre informazioni, vedere le indicazioni sulle prenotazioni di Azure per Azure OpenAI in Modelli Foundry con provisioning.

Modello di pagamento dell'impegno

  • È necessario un impegno mensile a livello regionale per utilizzare le risorse assegnate (termini più lunghi disponibili contrattualmente).

  • Gli impegni sono vincolati alle risorse di Azure OpenAI, il che rende complicato lo spostamento delle distribuzioni da una risorsa all'altra.

  • Non è possibile annullare o modificare gli impegni durante il periodo, ad eccezione dell'aggiunta di nuovi PTU.

Modelli supportati nel modello di pagamento basato su impegno

Solo l'elenco seguente di modelli Azure OpenAI è supportato nei Contratti. Per l'onboarding di altri modelli non inclusi nell'elenco seguente o per i modelli più recenti nell'offerta di throughput con provisioning, fare riferimento alla guida all'onboarding con provisioning di Azure OpenAI e alle prenotazioni di Azure per le distribuzioni con provisioning di Azure OpenAI.

Modelli supportati nel piano di impegno Versioni
gpt-35-turbo 0125,1106
gpt-4 0613, 1106-Anteprima, 0125-Anteprima
gpt-4-turbo 2024-04-09
gpt-4-32k 0613
gpt-4o 2024-05-13, 2024-08-06
gpt-4o-mini 18-07-2024

Modello di pagamento con prenotazione oraria

  • Il modello di pagamento è allineato agli standard Azure per altri prodotti.

  • L'utilizzo orario è supportato, senza impegno.

  • Gli sconti di un mese e di un anno possono essere acquistati come prenotazioni Azure regionali.

  • Le prenotazioni possono essere limitate in modo flessibile per coprire più sottoscrizioni e l'ambito può essere modificato a metà termine.

  • Supporta tutti i modelli, sia vecchi che nuovi.

Importante

Nell'offerta con provisioning sono disponibili altri modelli più recenti con modello di pagamento su base oraria/prenotazione. Controllare l'elenco Disponibilità delle aree per i modelli Foundry venduti da Azure (versione classica) per la disponibilità. I modelli non inclusi nel list non sono distribuibili nelle risorse OpenAI Azure con impegni attivi. Per distribuire modelli più recenti, è necessario:

  • Creare distribuzioni su risorse OpenAI su Azure senza obblighi.
  • Eseguire la migrazione di una risorsa esistente dai suoi impegni.

Framework del modello di pagamento

Con il rilascio del modello di pagamento orario/riservato, le opzioni di pagamento sono più flessibili e il modello relativo ai pagamenti con provisioning è cambiato. Quando gli impegni di un mese erano l'unico modo per acquistare servizi forniti, il modello era:

  1. Ottenere una quota di PTU dal team degli account Microsoft.
  2. "Acquistare" quota da un impegno sulla risorsa in cui eseguire la distribuzione.
  3. Creare distribuzioni nella risorsa fino al limite dell'impegno.

La differenza principale tra questo modello e il nuovo modello è che in precedenza l'unico modo per pagare per il provisioning era tramite uno sconto a termine di un mese. Ora, è possibile distribuire e pagare le distribuzioni su base oraria, se si sceglie questa opzione, e prendere una decisione separata su se applicare uno sconto tramite un impegno di un mese (come prima) o una prenotazione su Azure.

Con queste informazioni dettagliate, il nuovo modo di pensare ai modelli di pagamento è:

  1. Ottenere una quota PTU tramite il modulo self-service.
  2. Crea distribuzioni usando la tua quota.
  3. Facoltativamente, acquistare o estendere un impegno o una prenotazione per applicare uno sconto a termine alle distribuzioni.

I passaggi 1 e 2 sono gli stessi in tutti i casi. La differenza è se un impegno o una prenotazione Azure viene utilizzato come veicolo per fornire lo sconto. In entrambi i modelli:

  • È possibile distribuire più PTU rispetto allo sconto. (ad esempio, la creazione di una distribuzione a breve termine per provare un nuovo modello è abilitata distribuendo senza acquistare uno sconto)

  • Il metodo di sconto (impegno o prenotazione) applica il prezzo scontato a un numero fisso di PTU e ha un ambito che definisce quali distribuzioni vengono conteggiate rispetto allo sconto.

    Tipo di sconto Ambiti disponibili (all'interno di un'area)
    Impegno Risorsa OpenAI di Azure
    Prenotazione Gruppo di risorse, sottoscrizione singola, gruppo di gestione (gruppo di sottoscrizioni), condiviso (tutte le sottoscrizioni in un account di fatturazione)
  • Il prezzo scontato viene applicato alle PTU distribuite fino al numero di PTU scontate nello sconto.

  • Il numero di PTU distribuiti che superano i PTU scontati (o non coperti da alcuno sconto) verrà addebitato alla tariffa oraria.

  • La procedura consigliata consiste innanzitutto nel creare distribuzioni e quindi applicare sconti. Si tratta di garantire tale servizio. la capacità è disponibile a supporto delle distribuzioni prima di creare un contratto a termine per le PTU che non è possibile usare.

Nota

Quando segui le procedure consigliate, potresti ricevere addebiti orari tra il momento in cui crei la distribuzione e quello in cui incrementi il tuo sconto (impegno o riserva).

Per questo motivo, è consigliabile essere pronti ad aumentare lo sconto subito dopo la distribuzione. I prerequisiti per l'acquisto di una prenotazione Azure sono diversi rispetto agli impegni e è consigliabile convalidarli prima della distribuzione se si intende usarli per scontate la distribuzione. Per altre informazioni, vedere Permissions per visualizzare e gestire le prenotazioni Azure

Mappatura delle implementazioni al metodo di sconto

I clienti che utilizzano l'offerta Azure OpenAI con provisioning prima di agosto 2024 possono usare uno o entrambi i modelli di pagamento contemporaneamente all'interno di una sottoscrizione. Il modello di pagamento usato per ogni distribuzione viene determinato in base alla relativa risorsa OpenAI Azure:

La risorsa ha un impegno attivo

  • L'impegno applica sconti a tutte le distribuzioni della risorsa fino al numero di PTU specificato per l'impegno. Eventuali PTU in eccesso vengono fatturati ogni ora, a meno che le PTU in eccesso non siano incluse nell'ambito di una prenotazione attiva. Se PTU in eccesso sono presenti nell'ambito di una prenotazione attiva, verranno scontate come gruppo, fino al numero di PTU nella prenotazione e qualsiasi residuo in eccesso verrà fatturato su base oraria.

La risorsa non ha un impegno attivo

  • Le distribuzioni nella risorsa sono idonee per usufruire di sconti grazie a una prenotazione di Azure. Affinché queste implementazioni abbiano diritto a uno sconto, devono rientrare in una prenotazione attiva. Tutte le distribuzioni all'interno dell'ambito della prenotazione (incluse le distribuzioni su altre risorse nella stessa sottoscrizione o in altre) verranno scontate come gruppo fino al numero di PTU nella prenotazione. Eventuali PTU in eccesso verranno fatturati ogni ora.

Modifiche alla modalità di pagamento esistente

I clienti che oggi hanno impegni possono continuare a usarli almeno fino al ritiro del modello supportato. Ciò include l'acquisto di nuovi PTU per impegni nuovi o esistenti e la gestione dei rinnovi dell'impegno. Tuttavia, l'aggiornamento di agosto ha modificato alcuni aspetti dell'operazione di impegno.

  • Azure OpenAI ha smesso di supportare la registrazione a nuovi impegni, a partire dal 1° agosto 2024

  • Solo un set limitato di modelli può essere distribuito in una risorsa con un vincolo. Ecco l'elenco dei modelli

  • Se i PTU distribuiti con un impegno superano i PTU impegnati, gli addebiti per eccedenza oraria vengono applicati sullo stesso contatore orario usato per il nuovo modello di pagamento orario/prenotazione. In questo modo gli addebiti per l'eccedenza possono essere scontate tramite una prenotazione Azure.

  • È possibile distribuire più PTU di quanto impegnato sulla risorsa. Ciò supporta la possibilità di garantire la disponibilità della capacità prima di aumentare le dimensioni dell'impegno per coprirlo.

Migrazione di risorse esistenti al di fuori degli impegni

I clienti esistenti possono scegliere di migrare le loro risorse esistenti dal modello di impegno al modello di pagamento orario/prenotazione per trarre vantaggio dalla possibilità di distribuire i modelli più recenti o consolidare gli sconti per distribuzioni diverse sotto un'unica prenotazione, utilizzando un approccio autonomo.

Migrazione self-service

L’approccio di migrazione self‑service permette a un cliente di dismettere in modo organico le risorse dagli impegni lasciandole scadere. Il processo di migrazione di una risorsa è il seguente:

  • Impostare l'impegno esistente su non completare l'aggiornamento automatico e prendere nota della data di scadenza.

  • Prima della data di scadenza, un cliente deve acquistare una prenotazione Azure che copre il numero totale di PTU di cui è stato eseguito il commit per ogni sottoscrizione. Se una prenotazione esistente include già la sottoscrizione nel relativo ambito, può essere estesa per coprire le nuove PTU.

  • Alla scadenza del contratto, le implementazioni associate alla risorsa passeranno automaticamente alla modalità Oraria/Prenotazione, con l'utilizzo scontato grazie alla prenotazione.

Questo approccio di migrazione self-service comporterà una sovrapposizione in cui la prenotazione e l'impegno sono entrambi attivi. Si tratta di una caratteristica di questa modalità di migrazione e il tempo di prenotazione o impegno per questa sovrapposizione non verrà restituito al cliente.

Un approccio alternativo alla migrazione self-service consiste nel cambiare l'acquisto della prenotazione in modo che venga eseguito dopo la scadenza dell'impegno. In questo approccio, le implementazioni genereranno dati di utilizzo orari per il periodo compreso tra la scadenza dell'impegno e l'acquisto della prenotazione. Come per il modello precedente, si tratta di una caratteristica di questo approccio e questo utilizzo orario non verrà accreditato.

Vantaggi della migrazione self-service:

  • È possibile eseguire la migrazione di singole risorse in momenti diversi.
  • I clienti gestiscono la migrazione senza dipendenze da Microsoft.

Svantaggi della migrazione automatizzata:

  • Durante il passaggio dalla fatturazione impegnata alla fatturazione oraria o su prenotazione, ci sarà un breve periodo di doppia fatturazione.

Importante

L'approccio self-service genera addebiti aggiuntivi poiché la modalità di pagamento passa da Impegnato a Base oraria/prenotazione. Si tratta delle caratteristiche di questo approccio alla migrazione e i clienti non sono accreditati per questi addebiti.

Migrazione di distribuzioni esistenti a una zona dati o globale con provisioning

I clienti esistenti delle distribuzioni di cui è stato effettuato il provisioning possono scegliere di eseguire la migrazione alle distribuzioni con provisioning globale o di zona dati per trarre vantaggio dai minimi di distribuzione inferiori, dagli incrementi di scalabilità granulari o dai prezzi differenziati disponibili per questi tipi di distribuzione. Per altre informazioni su come le distribuzioni globali e di zone dati con provisioning gestiscono l'elaborazione dei dati nelle aree geografiche di Azure, vedere la documentazione relativa all'elaborazione dei dati della distribuzione Azure OpenAI.

Sono disponibili due approcci per consentire ai clienti di eseguire la migrazione da distribuzioni con provisioning a distribuzioni con provisioning a livello di zona dati o globale.

Migrazione senza tempi di inattività

L'approccio alla migrazione senza tempi di inattività consente ai clienti di eseguire la migrazione delle distribuzioni con provisioning esistenti a distribuzioni con provisioning a livello di zona dati o globale, senza interrompere il traffico di inferenza esistente nella rispettiva distribuzione. Questo approccio di migrazione riduce al minimo le interruzioni del carico di lavoro, ma richiede a un cliente di avere più distribuzioni coesistenti durante lo spostamento del traffico. Il processo per eseguire la migrazione di una distribuzione provisionata usando l'approccio di migrazione a zero tempi di inattività è il seguente:

  • Creare una nuova distribuzione usando i tipi di distribuzione con provisioning a livello di zona dati o globale nella risorsa OpenAI di destinazione Azure.
  • Eseguire la transizione del traffico dal tipo di distribuzione con provisioning a livello di area esistente alla nuova distribuzione con provisioning a livello di zona dati o globale finché tutto il traffico non viene trasferito dalla distribuzione con provisioning a livello di area esistente.
  • Dopo aver eseguito la migrazione del traffico alla nuova distribuzione, verificare che non siano presenti richieste di inferenza elaborate nella distribuzione di cui è stato effettuato il provisioning precedente assicurando che la metrica Azure Richieste OpenAI non mostri alcuna chiamata API effettuata entro 5-10 minuti dal traffico di inferenza di cui viene eseguita la migrazione alla nuova distribuzione. Per altre informazioni su questa metrica, vedere la documentazione di Monitoraggio Azure OpenAI.
  • Dopo aver verificato che non sono state effettuate chiamate di inferenza, eliminare la distribuzione con provisioning a livello di area.

Migrazione con tempi di inattività

L'approccio alla migrazione con tempi di inattività comporta la migrazione delle distribuzioni con provisioning esistenti a distribuzioni con provisioning a livello di zona dati o globale arrestando qualsiasi traffico di inferenza esistente sulla distribuzione con provisioning originale. Questo approccio alla migrazione non richiede la coesistenza di più distribuzioni per essere supportato, ma richiede un'interruzione del carico di lavoro per poter essere completato. Il processo per eseguire la migrazione di una distribuzione approvvigionata usando il metodo di migrazione con periodo di inattività è il seguente:

  • Verificare che non siano presenti richieste di inferenza processate nella distribuzione precedentemente configurata, assicurandosi che la metrica delle richieste di Azure OpenAI non indichi chiamate API effettuate negli ultimi 5-10 minuti. Per altre informazioni su questa metrica, vedere la documentazione di Monitoraggio Azure OpenAI.
  • Dopo aver verificato che non sono state effettuate chiamate di inferenza, eliminare la distribuzione con provisioning a livello di area.
  • Creare una nuova distribuzione usando i tipi di distribuzione globale o della zona dei dati nella risorsa Azure OpenAI di destinazione.
  • Una volta completata la nuova distribuzione, è possibile riprendere il traffico di inferenza nella nuova distribuzione a livello di zona dati o globale.

Come si esegue la migrazione della prenotazione Azure esistente ai nuovi prodotti prenotazione Azure?

Prenotazioni di Azure per offerte con provisioning di Azure OpenAI sono specifiche al tipo di distribuzione con provisioning. Se la Prenotazione di Azure acquistata non corrisponde al tipo di distribuzione per cui è stato effettuato il provisioning, per impostazione predefinita la distribuzione utilizzerà il modello di pagamento orario. Se si sceglie di eseguire la migrazione alle distribuzioni con provisioning globale o nell'area dati, potrebbe essere necessario acquistare una nuova prenotazione Azure per queste distribuzioni per supportare sconti aggiuntivi. Per ulteriori informazioni su come acquistare una nuova prenotazione di Azure o apportare modifiche a una prenotazione di Azure esistente, consulta le indicazioni sul provisioning di Azure Reservations per Azure OpenAI.

Gestione di impegni di throughput assegnato

Gli impegni di velocità effettiva con provisioning vengono creati e gestiti selezionando Centro di gestione nel menu di spostamento del portale di Fonderia>Quota>Gestisci impegni.

Screenshot dell'interfaccia utente di acquisto dell'impegno con notifiche.

Dalla visualizzazione Gestisci impegni è possibile eseguire diverse operazioni:

  • Acquistare nuovi impegni o modificare gli impegni esistenti.
  • Monitorare tutti gli impegni nell'abbonamento.
  • Identificare e intervenire sugli impegni che potrebbero causare fatturazione imprevista.

Le sezioni seguenti illustrano queste attività.

Acquistare un impegno di throughput assegnato

Con il piano di impegno pronto, il passaggio successivo consiste nel creare gli impegni. Gli impegni vengono creati manualmente tramite Foundry e richiedono all'utente di creare l'impegno per avere il ruolo Collaboratore o Collaboratore Servizi cognitivi a livello di sottoscrizione.

Per ogni nuovo impegno da creare, seguire questa procedura:

  1. Avviare la finestra di dialogo di acquisto del throughput con provisioning selezionando Quota>Azure OpenAI con provisioning>Gestisci piani di impegno.

Screenshot della finestra di dialogo di acquisto.

  1. Selezionare Impegno d'acquisto.

  2. Selezionare la risorsa Azure OpenAI e acquistare l'impegno. Verranno visualizzate le risorse suddivise in risorse con impegni esistenti, che è possibile modificare e le risorse che attualmente non hanno un impegno.

Impostazione Note
Selezionare una risorsa Scegliere la risorsa dove si creerà la distribuzione con provisioning. Dopo aver acquistato l'impegno, non sarà possibile usare le PTU in un'altra risorsa fino alla scadenza dell'impegno corrente.
Selezionare un tipo di impegno Selezionare Provisioning effettuato. (Con provisioning equivale a Gestito con provisioning)
Quota provvisionale non impegnata corrente Il numero di PTU attualmente disponibili per essere assegnati a questa risorsa.
Importo da impegnare (PTU) Scegliere il numero di PTU per cui assumere un impegno. Questo numero può essere aumentato durante il periodo di impegno, ma non può essere ridotto. Immettere i valori a incrementi di 50 per il tipo di impegno "Provisionato".
Livello di impegno per il periodo corrente Il periodo di impegno è impostato su un mese.
Impostazioni di rinnovo Rinnovo automatico alle PTU correnti
Rinnovo automatico a livelli di PTU inferiori
Non eseguire l'autorenew
  1. Cliccare Acquista. Verrà visualizzata una finestra di dialogo di conferma. Dopo la conferma, le PTU saranno impegnate e sarà possibile usarle per creare una distribuzione con provisioning. |

Screenshot dell'interfaccia utente di acquisto dell'impegno.

Importante

Un nuovo impegno viene fatturato in anticipo per l'intero periodo. Se le impostazioni di rinnovo sono impostate sul rinnovo automatico, verrà fatturata di nuovo a ogni data di rinnovo in base alle impostazioni di rinnovo.

Modificare un impegno esistente per il throughput assegnato

Nella visualizzazione Gestisci impegni è anche possibile modificare un impegno esistente. Esistono due tipi di modifiche che è possibile apportare a un impegno esistente:

  • È possibile aggiungere PTU all'impegno.
  • È possibile modificare le impostazioni di rinnovo.

Per modificare un impegno, selezionare l'elemento corrente da modificare e quindi selezionare Modifica impegno.

Aggiunta di unità elaborate assegnate agli impegni esistenti

L'aggiunta di PTU a un impegno esistente consentirà di creare distribuzioni di dimensioni maggiori o più numerose all'interno della risorsa. È possibile eseguire questa operazione in qualsiasi momento durante il periodo di impegno.

Screenshot dell’interfaccia di acquisto dell'impegno con un aumento del valore dell'importo da impegnare.

Importante

Quando si aggiungono PTU a un impegno, questi verranno fatturati immediatamente, in base a un importo ripartito proporzionalmente dalla data corrente alla fine del periodo di impegno esistente. L'aggiunta di PTU non reimposta il termine dell'impegno.

Modifica delle impostazioni di rinnovo

Le impostazioni di rinnovo dell'impegno possono essere modificate in qualsiasi momento prima della data di scadenza dell'impegno. I motivi per cui si potrebbe voler modificare le impostazioni di rinnovo includono la cessazione dell'uso del throughput provisionato impostando l'impegno a non rinnovare automaticamente, oppure ridurre l'uso del throughput provisionato diminuendo il numero di PTU che verranno impegnati nel periodo successivo.

Importante

Se si consente la scadenza o la riduzione di un impegno in modo che le distribuzioni nella risorsa richiedano più PTU rispetto all'impegno sulle risorse, si riceveranno addebiti per eccedenza oraria per eventuali PTU in eccesso. Ad esempio, una risorsa con distribuzioni che totalizzano 500 PTU e un impegno per 300 PTU genererà addebiti orari per 200 PTU in eccesso.

Monitorare gli impegni e impedire fatturazione impreviste

La sezione Gestisci impegni offre una panoramica a livello di sottoscrizione di tutte le risorse con impegni e utilizzo PTU all'interno di una determinata sottoscrizione Azure. Di particolare importanza sono:

  • PTU impegnate, distribuite e in uso – Questi valori indicano le dimensioni degli impegni e la quantità attualmente usata dalle distribuzioni. Massimizza il tuo investimento utilizzando tutti i PTU impegnati.
  • Criteri di scadenza e data : la data di scadenza e i criteri indicano quando scade un impegno e cosa accadrà quando lo fa. Un impegno impostato su autorenew genererà un evento di fatturazione alla data di rinnovo. Per gli impegni in scadenza, assicurarsi di eliminare le distribuzioni da queste risorse prima della data di scadenza per evitare la fatturazione oraria delle eccedenze. Impostazioni di rinnovo correnti per un impegno.
  • Notifiche : avvisi relativi a condizioni importanti, ad esempio impegni inutilizzati e configurazioni che potrebbero comportare eccedenze di fatturazione. Le eccedenze di fatturazione possono essere causate da situazioni come quando un impegno è scaduto e le implementazioni sono ancora presenti, ma sono passate alla fatturazione oraria.

Importante

Se si imposta un impegno per rinnovare automaticamente la data di rinnovo sarà la stessa data del mese successivo. Se la data non esiste, la data di rinnovo sarà di fine mese. Esempi-
Scenario 1: Se si acquista un impegno il 21 febbraio e si imposta l'impegno al rinnovo automatico, la data di rinnovo successiva per l'impegno sarà il 21 marzo.

Scenario 2: Se si acquista l'impegno il 31 maggio e si imposta l'impegno al rinnovo automatico, la data di rinnovo successiva per l'impegno sarà il 30 giugno (fine del mese) perché non è previsto il 31° nel mese di giugno.

Scenario 3: Se si acquista l'impegno il 31 gennaio e si imposta l'impegno al rinnovo automatico, la data di rinnovo successiva per l'impegno sarà il 28 febbraio (fine del mese) perché non è presente alcun 31 o 30 o 29 (in anni non bisestili) e la data di rinnovo sarà il 29 febbraio (in un anno bisestile) nel mese di febbraio.

Scenari comuni di gestione degli impegni

Interrompere l'uso della capacità di trasferimento assegnata

Per terminare l'uso del throughput allocato e impedire addebiti orari per eccedenza dopo la scadenza dell'impegno, e per interrompere qualsiasi addebito una volta scaduti gli impegni correnti, è necessario eseguire due passaggi:

  1. Impostare i criteri di rinnovo per tutti gli impegni su Non rinnovare automaticamente.
  2. Eliminare le distribuzioni provvisionate usando la quota.

Importante

Se si lascia scadere un impegno con l'intento di interrompere il throughput assegnato e di non eliminare le distribuzioni con provisioning, si riceveranno addebiti orari per le eccedenze per tutte le PTU ancora presenti nella distribuzione. Ad esempio, una risorsa con distribuzioni per un totale di 500 PTU e per cui è stato selezionato un impegno per Non rinnovare automaticamente, ci saranno addebiti orari dopo la scadenza dell'impegno, fino all'eliminazione della distribuzione. Attualmente non è disponibile alcuna opzione per eliminare automaticamente la distribuzione, pertanto deve essere eliminata manualmente quando si decide di interrompere l'uso del throughput assegnato.

Spostare un impegno/distribuzione in una nuova risorsa nella stessa sottoscrizione/area

Non è possibile in Foundry spostare direttamente una distribuzione o un impegno in una nuova risorsa. È invece necessario creare una nuova distribuzione nella risorsa di destinazione e spostare il traffico verso di esso. Per eseguire questa operazione, sarà necessario un impegno acquistato stabilito sulla nuova risorsa. Poiché gli impegni vengono addebitati in anticipo per un periodo di 30 giorni, è necessario eseguire questo spostamento con la scadenza dell'impegno originale per ridurre al minimo la sovrapposizione con il nuovo impegno e la "doppia fatturazione" durante la sovrapposizione.

Per implementare questa transizione, è possibile adottare due approcci.

Opzione 1: passaggio senza sovrapposizione

Questa opzione richiede tempi di inattività, ma non richiede alcuna quota aggiuntiva e non genera costi aggiuntivi.

Passi Note
Impostare i criteri di rinnovo per l'impegno esistente a scadenza. Ciò impedirà il rinnovo dell'impegno e la generazione di ulteriori addebiti
Prima della scadenza dell'impegno esistente, eliminare la sua distribuzione. Il tempo di inattività inizierà a questo punto e durerà fino a quando non viene creata la nuova distribuzione e il traffico viene spostato. Per ridurre al minimo la durata, l'eliminazione verrà eseguita il più vicino possibile alla data/ora di scadenza.
Dopo la scadenza dell'impegno esistente, creare l'impegno per la nuova risorsa Ridurre al minimo i tempi di inattività eseguendo questa operazione e il passaggio successivo non appena possibile dopo la scadenza.
Creare la distribuzione sulla nuova risorsa e spostarvi il traffico

Opzione 2: passaggio con sovrapposizione

Questa opzione non comporta tempi di inattività poiché le distribuzioni esistenti e nuove sono attive contemporaneamente. Ciò richiede la disponibilità della quota per creare la nuova distribuzione e genera costi aggiuntivi per la durata delle distribuzioni sovrapposte.

Passi Note
Impostare i criteri di rinnovo per l'impegno esistente a scadenza. In questo modo si impedisce il rinnovo dell'impegno e la generazione di ulteriori addebiti.
Prima della scadenza dell'impegno esistente:
1. Creare l'impegno per la nuova risorsa.
2. Creare la nuova distribuzione.
3. Cambiare il traffico
4. Eliminare la distribuzione esistente
Assicurarsi di lasciare tempo sufficiente per tutti i passaggi prima della scadenza dell'impegno esistente. In caso contrario, verranno generati addebiti per eccedenza (vedere la sezione successiva) per le opzioni.

Se il passaggio finale richiede più tempo del previsto e terminerà dopo la scadenza dell'impegno esistente, sono disponibili tre opzioni per ridurre al minimo gli addebiti per l'eccedenza.

  • Prendi un periodo di inattività: elimina la distribuzione originale e quindi completa lo spostamento.
  • Pagare le eccedenze: mantenere la distribuzione originale e pagare secondo la tariffa oraria finché non si sposta tutto il traffico e si elimina la distribuzione.
  • Reimpostare l'impegno originale per effettuare un altro rinnovo. In questo modo sarà possibile completare lo spostamento con un costo noto.

Sia il pagamento per un eccedenza che la reimpostazione dell'impegno originale genereranno addebiti oltre la data di scadenza originale. Il pagamento degli addebiti per eccedenza potrebbe essere più economico di un nuovo impegno di un mese se è necessario solo un giorno o due per completare lo spostamento. Confrontare i costi di entrambe le opzioni per trovare l'approccio più basso.

Spostare la distribuzione in una nuova area e/o in una nuova sottoscrizione

Gli stessi approcci si applicano allo spostamento dell'impegno e della distribuzione all'interno dell'area, ad eccezione del fatto che la quota disponibile nella nuova località sarà necessaria in tutti i casi.

Visualizzare e modificare una risorsa esistente

In Foundry selezionare Centro di gestione>Quota>Con provisioning>Gestisci impegni e selezionare una risorsa con un impegno esistente per visualizzarla/modificarla.