Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
GPT Realtime 2 è un modello di riconoscimento vocale con ragionamento predefinito. Accetta l'input audio e produce l'output audio. È progettato per esperienze vocali interattive a bassa latenza, in cui sono necessarie istruzioni più avanzate e ragionamenti rispetto ai modelli in tempo reale precedenti.
Annotazioni
Questa funzionalità è attualmente disponibile in anteprima pubblica. Questa anteprima viene fornita senza un contratto di servizio e non è consigliabile per i carichi di lavoro di produzione. Alcune funzionalità potrebbero non essere supportate o potrebbero avere funzionalità limitate. Per ulteriori informazioni, vedere Condizioni supplementari per l'uso delle versioni di anteprima di Microsoft Azure.
Novità di GPT Realtime 2
-
Supporto al ragionamento con controllo regolabile
reasoning.effort. - Fasi di risposta che distinguono preamboli ("commento") dalla risposta finale ("final_answer").
- Finestra di contesto più lunga (256.000 token).
Concetti chiave
Sforzo di ragionamento
Controlla l'intensità del ragionamento con il parametro di sessione reasoning.effort. I valori validi sono minimal, low, medium e high.
Preamboli e fasi di risposta
Le risposte in tempo reale possono includere più elementi di output a turno. Ogni elemento ha un phase che indica il suo ruolo:
| Fase | Description |
|---|---|
commentary |
Un preambolo richiedebile, spesso usato prima di un ragionamento più lungo. |
final_answer |
La risposta finale dopo il completamento del ragionamento del modello. |
I preamboli possono ridurre la latenza percepita, ad esempio "Lasciami pensare a questo...", e possono essere usati anche per annunci di strumenti o riempitivi di silenzio. Se il modello viene interrotto durante il pensiero, elimina la catena di pensiero corrente e inizia un nuovo turno.
Istruzioni seguenti
Le istruzioni seguenti sono più rigide rispetto ai modelli in tempo reale precedenti. Se il prompt di sistema contiene parole strette(ad esempio, distinguendo "ID ordine" da "codice di conferma"), potrebbe essere necessario ampliare o riformulare le istruzioni per trovare la corrispondenza con la formulazione utente reale.
Get started
Le modalità di connessione e di utilizzo per GPT Realtime 2 sono le stesse delle versioni precedenti: basta distribuire il nuovo modello e indirizzare verso di esso il codice esistente. Scegliere il trasporto più adatto allo scenario: