Panoramica di GPT Realtime 2.0 (anteprima)

GPT Realtime 2 è un modello di riconoscimento vocale con ragionamento predefinito. Accetta l'input audio e produce l'output audio. È progettato per esperienze vocali interattive a bassa latenza, in cui sono necessarie istruzioni più avanzate e ragionamenti rispetto ai modelli in tempo reale precedenti.

Annotazioni

Questa funzionalità è attualmente disponibile in anteprima pubblica. Questa anteprima viene fornita senza un contratto di servizio e non è consigliabile per i carichi di lavoro di produzione. Alcune funzionalità potrebbero non essere supportate o potrebbero avere funzionalità limitate. Per ulteriori informazioni, vedere Condizioni supplementari per l'uso delle versioni di anteprima di Microsoft Azure.

Novità di GPT Realtime 2

  • Supporto al ragionamento con controllo regolabile reasoning.effort.
  • Fasi di risposta che distinguono preamboli ("commento") dalla risposta finale ("final_answer").
  • Finestra di contesto più lunga (256.000 token).

Concetti chiave

Sforzo di ragionamento

Controlla l'intensità del ragionamento con il parametro di sessione reasoning.effort. I valori validi sono minimal, low, medium e high.

Preamboli e fasi di risposta

Le risposte in tempo reale possono includere più elementi di output a turno. Ogni elemento ha un phase che indica il suo ruolo:

Fase Description
commentary Un preambolo richiedebile, spesso usato prima di un ragionamento più lungo.
final_answer La risposta finale dopo il completamento del ragionamento del modello.

I preamboli possono ridurre la latenza percepita, ad esempio "Lasciami pensare a questo...", e possono essere usati anche per annunci di strumenti o riempitivi di silenzio. Se il modello viene interrotto durante il pensiero, elimina la catena di pensiero corrente e inizia un nuovo turno.

Istruzioni seguenti

Le istruzioni seguenti sono più rigide rispetto ai modelli in tempo reale precedenti. Se il prompt di sistema contiene parole strette(ad esempio, distinguendo "ID ordine" da "codice di conferma"), potrebbe essere necessario ampliare o riformulare le istruzioni per trovare la corrispondenza con la formulazione utente reale.

Get started

Le modalità di connessione e di utilizzo per GPT Realtime 2 sono le stesse delle versioni precedenti: basta distribuire il nuovo modello e indirizzare verso di esso il codice esistente. Scegliere il trasporto più adatto allo scenario: