Azure OpenAI in Microsoft Foundry Models REST API Vorschaureferenz

Dieser Artikel liefert Details zu den Inferenz-REST-API-Endpunkten für Azure OpenAI.

API-Spezifikationen

Die Verwaltung und Interaktion mit Azure OpenAI-Modellen und -Ressourcen ist auf drei Haupt-API-Oberflächen verteilt:

  • Steuerebene
  • Datenebene – Autoring
  • Datenebene – Schlussfolgerung

Jede API-Oberfläche/Spezifikation kapselt einen anderen Satz von Azure OpenAI-Funktionen. Jede API hat ihren eigenen einzigartigen Satz von Vorschau- und stabilen/allgemein verfügbaren (GA) API-Releases. Preview-Veröffentlichungen folgen derzeit meist einem monatlichen Rhythmus.

Important

Es gibt jetzt eine neue Vorschau-Inferenz-API. Erfahren Sie mehr in unserem API-Lebenszyklus-Leitfaden.

API Neueste Vorschau-Veröffentlichung Neueste GA-Veröffentlichung Specifications Beschreibung
Steuerungsebene 2025-07-01-preview 2025-06-01 Spezifikationsdateien Die Control Plane API wird für Operationen wie Ressourcenerstellung, Modellbereitstellung und andere Aufgaben des höheren Ressourcenmanagements verwendet. Die Kontrollebene regelt außerdem, was mit Funktionen wie Azure Resource Manager, Bicep, Terraform und Azure CLI möglich ist.
Datenebene v1 preview v1 Spezifikationsdateien Die Data Plane API steuert Inferenz- und Autorenoperationen.

Authentifizierung

Azure OpenAI bietet zwei Methoden zur Authentifizierung an. Du kannst entweder API-Schlüssel oder Microsoft Entra ID verwenden.

  • API-Schlüssel-Authentifizierung: Für diese Art der Authentifizierung müssen alle API-Anfragen den API-Schlüssel im api-key HTTP-Header enthalten. Der Quickstart bietet Anleitungen, wie man mit dieser Art der Authentifizierung Anrufe tätigt.

  • Microsoft Entra ID Authentifizierung: Sie können einen API-Aufruf mit einem Microsoft Entra-Token authentifizieren. Authentifizierungstoken sind in einer Anfrage als Header Authorization enthalten. Der bereitgestellte Token muss zum Beispiel von Bearervorangestellt werden, zum Beispiel Bearer YOUR_AUTH_TOKEN. Sie können unseren Anleitungsleitfaden zum Thema Authentifizierung mit Microsoft Entra ID lesen.

REST-API-Versionierung

Die Service-APIs werden mit dem Abfrageparameter api-version versioniert. Alle Versionen folgen der YYYY-MM-DD Datumsstruktur. Beispiel:

POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/chat/completions?api-version=2024-06-01

Inferenz der Datenebene

Der Rest des Artikels behandelt die 2025-04-01-preview Vorschauversion der Azure OpenAI Data Plane Inference Specification.

Wenn Sie nach Dokumentationen zur neuesten GA-API-Version suchen, lesen Sie die neueste GA-Datenebenen-Ableitungs-API.

Vervollständigungen – Erstellen

POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2025-04-01-preview

Erstellt eine Vervollständigung für den bereitgestellten Prompt, die Parameter und das gewählte Modell.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
Bereitstellungs-ID path Ja string
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name Typ Beschreibung Erforderlich Vorgabe
best_of Ganzzahl Erzeugt best_of serverseitige Komplettierungen und gibt das "beste" zurück (das mit der höchsten Log-Wahrscheinlichkeit pro Token). Die Ergebnisse können nicht gestreamt werden.

Verwendet mit n, best_of steuert er die Anzahl der Kandidatenabschlüsse und n gibt an, wie viele zurückzugeben sind. âìâì“ best_of muss größer als nsein.

Hinweis: Da dieser Parameter viele Vervollständigungen erzeugt, kann er Ihre Token-Quote schnell verbrauchen. Verwenden Sie sorgfältig und stellen Sie sicher, dass Sie angemessene Einstellungen für max_tokens und stophaben.
No 1
Echo Boolescher Wert Echo den Prompt zusätzlich zum Abschluss No Falsch
frequency_penalty number Zahl zwischen -2,0 und 2,0. Positive Werte bestrafen neue Token basierend auf ihrer bisherigen Häufigkeit im Text, wodurch die Wahrscheinlichkeit des Modells verringert, dieselbe Zeile wortwörtlich zu wiederholen. No 0
Logit-Bias Objekt Ändere die Wahrscheinlichkeit, dass bestimmte Token im Completion erscheinen.

Akzeptiert ein JSON-Objekt, das Token (angegeben durch ihre Token-ID im GPT-Tokenizer) auf einen zugehörigen Bias-Wert von -100 bis 100 zuordnet. Mathematisch wird die Verzerrung zu den vom Modell vor der Stichprobe erzeugten Logits addiert. Der genaue Effekt variiert je nach Modell, aber Werte zwischen -1 und 1 sollten die Selektionswahrscheinlichkeit verringern oder erhöhen; Werte wie -100 oder 100 sollten zu einem Bann oder zur exklusiven Auswahl des entsprechenden Tokens führen.

Zum Beispiel kannst du passen {"50256": -100} , um zu verhindern, dass das <|endoftext|> Token generiert wird.
No Nichts
logprobs Ganzzahl Beziehen Sie die Log-Wahrscheinlichkeiten der logprobs wahrscheinlichsten Ausgabetoken sowie der ausgewählten Token ein. Zum Beispiel, wenn logprobs 5 ist, gibt die API eine Liste der 5 wahrscheinlichsten Token zurück. Die API gibt immer das logprob des abgetasteten Tokens zurück, sodass es bis zu viele logprobs+1 Elemente in der Antwort geben kann.

Der maximale Wert für logprobs ist 5.
No Nichts
maximale_Anzahl_von_Tokens Ganzzahl Die maximale Anzahl der Token, die im Completion generiert werden können.

Die Token-Anzahl deines Prompts plus max_tokens darf die Kontextlänge des Modells nicht überschreiten.
No 16
n Ganzzahl Wie viele Abschlüsse für jeden Prompt generiert werden sollen.

Hinweis: Da dieser Parameter viele Vervollständigungen erzeugt, kann er Ihre Token-Quote schnell verbrauchen. Verwenden Sie sorgfältig und stellen Sie sicher, dass Sie angemessene Einstellungen für max_tokens und stophaben.
No 1
presence_penalty number Zahl zwischen -2,0 und 2,0. Positive Werte bestrafen neue Tokens basierend darauf, ob sie bisher im Text erscheinen, was die Wahrscheinlichkeit erhöht, dass das Modell über neue Themen spricht. No 0
Eingabeaufforderung Saite oder Array Der Prompt zur Generierung von Komplettierungen, codiert als String, Array von Strings, Array von Token oder Array von Token-Arrays.

Beachten Sie, dass <|endoftext|> der Dokumentseparator ist, den das Modell während des Trainings sieht, sodass das Modell bei fehlender Eingabeaufforderung als vom Anfang eines neuen Dokuments generiert.
Ja
seed Ganzzahl Wenn angegeben, bemüht sich unser System, deterministisch zu samplingen, sodass wiederholte Anfragen mit denselben seed Parametern dasselbe Ergebnis liefern.

Determinismus ist nicht garantiert, und du solltest auf den Antwortparameter system_fingerprint zurückgreifen, um Änderungen im Backend zu überwachen.
No
Stopp Saite oder Array Bis zu vier Sequenzen, bei denen die API aufhört, weitere Token zu generieren. Der zurückgegebene Text enthält die Stoppsequenz nicht. No
stream Boolescher Wert Ob ich den Teilfortschritt zurückstreamen soll. Wenn gesetzt, werden Token als rein datenbasierte, servergesendete Ereignisse gesendet, sobald sie verfügbar sind, wobei der Strom durch eine data: [DONE] Nachricht beendet wird. Beispiel Python Code.
No Falsch
Suffix string Das Suffix, das nach dem Abschluss des eingefügten Textes kommt.

Dieser Parameter wird nur für gpt-3.5-turbo-instructunterstützt.
No Nichts
Temperatur number Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen.

Wir empfehlen im Allgemeinen, dies zu ändern oder top_p , aber nicht beides.
No 1
top_p number Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden.

Wir empfehlen im Allgemeinen, dies zu ändern oder temperature , aber nicht beides.
No 1
user string Eine eindeutige Kennung, die Ihren Endnutzer repräsentiert und dabei helfen kann, Missbrauch zu überwachen und zu erkennen.
No

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json createCompletionResponse

Statuscode: Standard

Beschreibung: Dienst nicht verfügbar

Inhaltstyp Typ Beschreibung
application/json errorResponse

Beispiele

Example

Erstellt eine Vervollständigung für den bereitgestellten Prompt, die Parameter und das gewählte Modell.

POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2025-04-01-preview

{
 "prompt": [
  "tell me a joke about mango"
 ],
 "max_tokens": 32,
 "temperature": 1.0,
 "n": 1
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "cmpl-7QmVI15qgYVllxK0FtxVGG6ywfzaq",
    "created": 1686617332,
    "choices": [
      {
        "text": "es\n\nWhat do you call a mango who's in charge?\n\nThe head mango.",
        "index": 0,
        "finish_reason": "stop",
        "logprobs": null
      }
    ],
    "usage": {
      "completion_tokens": 20,
      "prompt_tokens": 6,
      "total_tokens": 26
    }
  }
}

Einbettungen – Erstellen

POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2025-04-01-preview

Erhalten Sie eine Vektordarstellung eines gegebenen Inputs, die leicht von Machine-Learning-Modellen und Algorithmen verbraucht werden kann.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
Bereitstellungs-ID path Ja string Die Deployment-ID des Modells, das bereitgestellt wurde.
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name Typ Beschreibung Erforderlich Vorgabe
Abmessungen Ganzzahl Die Anzahl der Dimensionen, die die resultierenden Ausgabe-Einbettungen haben sollten. Nur in text-embedding-3 und neueren Modellen unterstützt. No
encoding_format string Das Format, um die Einbettungen zurückzugeben. Es kann entweder float oder base64sein. Standardmäßig gilt float. No
input Saite oder Array Geben Sie den Text ein, der eingebettet wird, kodiert als String oder Array von Tokens. Um mehrere Eingaben in einer einzigen Anfrage einzubetten, übergeben Sie ein Array von Strings oder ein Array von Token-Arrays. Die Eingabe darf die maximalen Eingabetoken des Modells (8.192 Token für text-embedding-ada-002), darf keine leere Zeichenkette sein, und jedes Array muss 2.048 Dimensionen oder weniger haben. Zusätzlich zum Grenzwert pro Eingabetoken erzwingen alle Einbettungsmodelle maximal 300.000 Token, die über alle Eingaben in einer einzigen Anforderung summiert wurden. Ja
input_type string Eingabetyp der Einbettungssuche zur Verwendung No
user string Eine eindeutige Identifikator, die Ihren Endnutzer repräsentiert und dabei helfen kann, Missbrauch zu überwachen und zu erkennen. No

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json Objekt

Beispiele

Example

Geben Sie die Einbettungen für einen bestimmten Prompt zurück.

POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2025-04-01-preview

{
 "input": [
  "this is a test"
 ]
}

Antworten: Statuscode: 200

{
  "body": {
    "data": [
      {
        "index": 0,
        "embedding": [
          -0.012838088,
          -0.007421397,
          -0.017617522,
          -0.028278312,
          -0.018666342,
          0.01737855,
          -0.01821495,
          -0.006950092,
          -0.009937238,
          -0.038580645,
          0.010674067,
          0.02412286,
          -0.013647936,
          0.013189907,
          0.0021125758,
          0.012406612,
          0.020790534,
          0.00074595667,
          0.008397198,
          -0.00535031,
          0.008968075,
          0.014351576,
          -0.014086051,
          0.015055214,
          -0.022211088,
          -0.025198232,
          0.0065186154,
          -0.036350243,
          0.009180495,
          -0.009698266,
          0.009446018,
          -0.008463579,
          -0.0020113448
        ]
      }
    ],
    "usage": {
      "prompt_tokens": 4,
      "total_tokens": 4
    }
  }
}

Chat-Komplettierungen – Erstellen

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

Erstellt eine Vervollständigung der Chatnachricht

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
Bereitstellungs-ID path Ja string
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name Typ Beschreibung Erforderlich Vorgabe
Audio Objekt Parameter für den Audioausgang. Erforderlich, wenn die Audioausgabe mit modalities: ["audio"]angefordert wird. No
└─ Format enum Spezifiziert das Ausgabe-Audioformat. Muss einer von wav, mp3, flac, , opusoder pcm16sein.

Mögliche Werte: wav, mp3, flac, opus, pcm16
No
└– Stimme enum Spezifiziert den Sprachtyp. Unterstützte Stimmen sind alloy, echo, fable, , onyx, novaund shimmer.

Mögliche Werte: alloy, echo, , fableonyx, nova,shimmer
No
data_sources array Die Konfigurationseinträge für Azure OpenAI-Chat-Erweiterungen, die sie verwenden.
Diese zusätzliche Spezifikation ist nur mit Azure OpenAI kompatibel.
No
frequency_penalty number Zahl zwischen -2,0 und 2,0. Positive Werte bestrafen neue Token basierend auf ihrer bisherigen Häufigkeit im Text, wodurch die Wahrscheinlichkeit des Modells verringert, dieselbe Zeile wortwörtlich zu wiederholen.
No 0
function_call string oder chatCompletionFunctionCallOption Veraltet zugunsten von tool_choice.

Kontrolliert, welche (falls vorhandene) Funktion vom Modell aufgerufen wird.
none das bedeutet, dass das Modell keine Funktion aufruft, sondern stattdessen eine Nachricht generiert.
auto das bedeutet, dass das Modell zwischen der Erzeugung einer Nachricht oder dem Aufruf einer Funktion wählen kann.
Die Spezifizierung einer bestimmten Funktion über {"name": "my_function"} zwingt das Modell, diese Funktion aufzurufen.

none ist der Standard, wenn keine Funktionen vorhanden sind. auto ist der Standard, wenn Funktionen vorhanden sind.
No
functions array Veraltet zugunsten von tools.

Eine Liste von Funktionen, für die das Modell JSON-Eingaben generieren kann.
No
Logit-Bias Objekt Ändere die Wahrscheinlichkeit, dass bestimmte Token im Completion erscheinen.

Akzeptiert ein JSON-Objekt, das Token (angegeben durch ihre Token-ID im Tokenizer) auf einen zugehörigen Bias-Wert von -100 bis 100 abbildet. Mathematisch wird die Verzerrung zu den vom Modell vor der Stichprobe erzeugten Logits addiert. Der genaue Effekt variiert je nach Modell, aber Werte zwischen -1 und 1 sollten die Selektionswahrscheinlichkeit verringern oder erhöhen; Werte wie -100 oder 100 sollten zu einem Bann oder zur exklusiven Auswahl des entsprechenden Tokens führen.
No Nichts
logprobs Boolescher Wert Ob die Log-Wahrscheinlichkeiten der Ausgabetoken zurückgegeben werden sollen oder nicht. Wenn wahr, gibt die logaritarischen Wahrscheinlichkeiten jedes in der contentmessagevon zurückgegebenen Ausgabetokens zurück. No Falsch
max_completion_tokens Ganzzahl Eine obere Schranke für die Anzahl der Tokens, die für einen Abschluss generiert werden können, einschließlich sichtbarer Ausgabetoken und Reasoning-Tokens. No
maximale_Anzahl_von_Tokens Ganzzahl Die maximale Anzahl der Token, die im Chat-Abschluss generiert werden kann.

Die Gesamtlänge der Eingabetoken und generierten Tokens ist durch die Kontextlänge des Modells begrenzt.
No
Nachrichten array Eine Liste der Nachrichten, die das bisherige Gespräch ausmachen. Beispiel Python Code. Ja
metadata Objekt Vom Entwickler definierte Tags und Werte, die zum Filtern von Abschlüssen im gespeicherten Abschluss-Dashboard verwendet werden. No
modalities ChatCompletionModalities Ausgabetypen, die das Modell für diese Anfrage generieren soll.
Die meisten Modelle sind in der Lage, Text zu generieren, was standardmäßig ist:

["text"]

Das gpt-4o-audio-preview Modell kann auch zur Audioerzeugung verwendet werden. Um zu verlangen, dass dieses Modell sowohl Text- als auch Audioantworten erzeugt, können Sie verwenden:

["text", "audio"]
No
n Ganzzahl Wie viele Chat-Abschlussoptionen soll für jede Eingabenachricht generiert werden? Du wirst basierend auf der Anzahl der generierten Token in allen Optionen berechnet. Achten Sie n darauf, 1 die Kosten zu minimieren. No 1
Parallele Werkzeugaufrufe ParallelToolCalls Ob man während der Werkzeugnutzung parallele Funktionsaufrufe aktivieren soll. No Richtig
prediction PredictionContent Konfiguration für eine vorhergesagte Ausgabe, die die Reaktionszeiten erheblich verbessern kann, wenn große Teile der Modellantwort im Voraus bekannt sind. Dies tritt am häufigsten auf, wenn Sie eine Datei mit nur geringfügigen Änderungen an den meisten Inhalten neu generieren. No
presence_penalty number Zahl zwischen -2,0 und 2,0. Positive Werte bestrafen neue Tokens basierend darauf, ob sie bisher im Text erscheinen, was die Wahrscheinlichkeit erhöht, dass das Modell über neue Themen spricht.
No 0
Denkanstrengung enum Nur O1-Modelle

Begrenzt den Aufwand beim Schließen bei Denkmustern.

Derzeit unterstützte Werte sind low, medium, und high. Eine Reduzierung des Schlussarbeitsaufwands kann zu schnelleren Antworten und weniger Token beim Schließen in einer Antwort führen.
Mögliche Werte: low, medium, high
No
Antwortformat ResponseFormatText oder ResponseFormatJsonObject oder ResponseFormatJsonSchema Ein Objekt, das das Format angibt, das das Modell ausgeben muss. Kompatibel mit GPT-4o,GPT-4o Mini, GPT-4 Turbo und allen GPT-3.5 Turbo Modellen, die neuer als gpt-3.5-turbo-1106.

Setzen Sie auf { "type": "json_schema", "json_schema": {...} } aktiviert strukturierte Ausgaben, die garantieren, dass das Modell mit Ihrem bereitgestellten JSON-Schema übereinstimmt.

Die Einstellung aktiviert den { "type": "json_object" } JSON-Modus, der garantiert, dass die vom Modell erzeugte Nachricht gültig ist.

Wichtig: Beim Einsatz des JSON-Modus müssen Sie das Modell auch anweisen, selbst JSON über eine System- oder Benutzernachricht zu erzeugen. Ohne dies kann das Modell einen endlosen Strom von Leerraum erzeugen, bis die Erzeugung das Token-Limit erreicht, was zu einer langanhaltenden und scheinbar "festgefahrenen" Anfrage führt. Beachten Sie auch, dass der Nachrichteninhalt teilweise abgeschnitten werden kann, wenn finish_reason="length", was darauf hinweist, dass die Generation überschritten max_tokens wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.
No
seed Ganzzahl Diese Funktion befindet sich noch in der Beta.
Wenn angegeben, bemüht sich unser System, deterministisch zu samplingen, sodass wiederholte Anfragen mit denselben seed Parametern dasselbe Ergebnis liefern.
Determinismus ist nicht garantiert, und du solltest auf den Antwortparameter system_fingerprint zurückgreifen, um Änderungen im Backend zu überwachen.
No
Stopp Saite oder Array Bis zu 4 Sequenzen, bei denen die API aufhört, weitere Token zu generieren.
No
store Boolescher Wert Ob das Ergebnis dieser Chat-Abschlussanfrage für die Verwendung in unseren Modelldestillations- oder Bewertungsprodukten gespeichert werden soll oder nicht. No
stream Boolescher Wert Wenn gesetzt, werden partielle Nachrichtendeltas gesendet, wie in ChatGPT. Token werden als rein datenbasierte, servergesendete Ereignisse gesendet, sobald sie verfügbar sind, wobei der Strom durch eine data: [DONE] Nachricht beendet wird. Beispiel Python Code.
No Falsch
stream_options chatCompletionStreamOptions Optionen für Streaming-Antworten. Setzen Sie dies nur, wenn Sie stream: truesetzen.
No Nichts
Temperatur number Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen.

Wir empfehlen im Allgemeinen, dies zu ändern oder top_p , aber nicht beides.
No 1
tool_choice chatCompletionToolChoiceOption Kontrolliert, welches (falls vorhandenes) Werkzeug vom Modell aufgerufen wird. none Das bedeutet, dass das Modell kein Tool aufruft, sondern stattdessen eine Nachricht generiert. auto das bedeutet, dass das Modell zwischen der Generierung einer Nachricht oder dem Aufrufen eines oder mehrerer Werkzeuge wählen kann. required das bedeutet, dass das Modell ein oder mehrere Werkzeuge aufrufen muss. Die Angabe eines bestimmten Werkzeugs über {"type": "function", "function": {"name": "my_function"}} zwingt das Modell, dieses Werkzeug aufzurufen. none ist der Standard, wenn keine Werkzeuge vorhanden sind. auto ist der Standard, wenn Werkzeuge vorhanden sind. No
tools array Eine Liste der Werkzeuge, die das Modell aufrufen kann. Derzeit werden nur Funktionen als Werkzeug unterstützt. Nutzen Sie dies, um eine Liste von Funktionen bereitzustellen, für die das Modell JSON-Eingaben generieren kann. Maximal 128 Funktionen werden unterstützt.
No
top_logprobs Ganzzahl Eine ganze Zahl zwischen 0 und 20, die die Anzahl der wahrscheinlichsten Token angibt, die an jeder Tokenposition zurückgegeben werden sollen, jeweils mit einer zugehörigen Log-Wahrscheinlichkeit. logprobs muss auf true gesetzt werden, wenn dieser Parameter verwendet wird. No
top_p number Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden.

Wir empfehlen im Allgemeinen, dies zu ändern oder temperature , aber nicht beides.
No 1
user string Eine eindeutige Kennung, die Ihren Endnutzer repräsentiert und dabei helfen kann, Missbrauch zu überwachen und zu erkennen.
No
user_security_context userSecurityContext Der Benutzersicherheitskontext enthält mehrere Parameter, die die KI-Anwendung selbst und den Endnutzer beschreiben, der mit der KI-Anwendung interagiert. Diese Bereiche unterstützen Ihre Sicherheitsteams dabei, Sicherheitsvorfälle zu untersuchen und zu mindern, indem sie einen umfassenden Ansatz zum Schutz Ihrer KI-Anwendungen bieten. Erfahren Sie mehr zum Schutz von KI-Anwendungen mit Microsoft Defender for Cloud. No

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json Objekt

Statuscode: Standard

Beschreibung: Dienst nicht verfügbar

Inhaltstyp Typ Beschreibung
application/json errorResponse

Beispiele

Example

Erstellt eine Vervollständigung für den bereitgestellten Prompt, die Parameter und das gewählte Modell.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "system",
   "content": "you are a helpful assistant that talks like a pirate"
  },
  {
   "role": "user",
   "content": "can you tell me how to care for a parrot?"
  }
 ]
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Ahoy matey! So ye be wantin' to care for a fine squawkin' parrot, eh? Well, shiver me timbers, let ol' Cap'n Assistant share some wisdom with ye! Here be the steps to keepin' yer parrot happy 'n healthy:\n\n1. Secure a sturdy cage: Yer parrot be needin' a comfortable place to lay anchor! Be sure ye get a sturdy cage, at least double the size of the bird's wingspan, with enough space to spread their wings, yarrrr!\n\n2. Perches 'n toys: Aye, parrots need perches of different sizes, shapes, 'n textures to keep their feet healthy. Also, a few toys be helpin' to keep them entertained 'n their minds stimulated, arrrh!\n\n3. Proper grub: Feed yer feathered friend a balanced diet of high-quality pellets, fruits, 'n veggies to keep 'em strong 'n healthy. Give 'em fresh water every day, or ye\u00e2\u20ac\u2122ll have a scurvy bird on yer hands!\n\n4. Cleanliness: Swab their cage deck! Clean their cage on a regular basis: fresh water 'n food daily, the floor every couple of days, 'n a thorough scrubbing ev'ry few weeks, so the bird be livin' in a tidy haven, arrhh!\n\n5. Socialize 'n train: Parrots be a sociable lot, arrr! Exercise 'n interact with 'em daily to create a bond 'n maintain their mental 'n physical health. Train 'em with positive reinforcement, treat 'em kindly, yarrr!\n\n6. Proper rest: Yer parrot be needin' \u00e2\u20ac\u2122bout 10-12 hours o' sleep each night. Cover their cage 'n let them slumber in a dim, quiet quarter for a proper night's rest, ye scallywag!\n\n7. Keep a weather eye open for illness: Birds be hidin' their ailments, arrr! Be watchful for signs of sickness, such as lethargy, loss of appetite, puffin' up, or change in droppings, and make haste to a vet if need be.\n\n8. Provide fresh air 'n avoid toxins: Parrots be sensitive to draft and pollutants. Keep yer quarters well ventilated, but no drafts, arrr! Be mindful of toxins like Teflon fumes, candles, or air fresheners.\n\nSo there ye have it, me hearty! With proper care 'n commitment, yer parrot will be squawkin' \"Yo-ho-ho\" for many years to come! Good luck, sailor, and may the wind be at yer back!"
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Erstellt eine Vervollständigung basierend auf Azure Search-Daten und systemzugewiesener verwalteter Identität.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_search",
   "parameters": {
    "endpoint": "https://your-search-endpoint.search.windows.net/",
    "index_name": "{index name}",
    "authentication": {
     "type": "system_assigned_managed_identity"
    }
   }
  }
 ]
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Erstellt eine Vervollständigung basierend auf Azure Search Bildvektordaten.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_search",
   "parameters": {
    "endpoint": "https://your-search-endpoint.search.windows.net/",
    "index_name": "{index name}",
    "query_type": "vector",
    "fields_mapping": {
     "image_vector_fields": [
      "image_vector"
     ]
    },
    "authentication": {
     "type": "api_key",
     "key": "{api key}"
    }
   }
  }
 ]
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion."
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Erstellt eine Vervollständigung basierend auf Azure Search-Vektordaten, einer vorherigen Assistentennachricht und einer vom Benutzer zugewiesenen verwalteten Identität.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a cat?"
  },
  {
   "role": "assistant",
   "content": "Content of the completion [doc1].",
   "context": {
    "intent": "cat care"
   }
  },
  {
   "role": "user",
   "content": "how about dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_search",
   "parameters": {
    "endpoint": "https://your-search-endpoint.search.windows.net/",
    "authentication": {
     "type": "user_assigned_managed_identity",
     "managed_identity_resource_id": "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{resource-name}"
    },
    "index_name": "{index name}",
    "query_type": "vector",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "in_scope": true,
    "top_n_documents": 5,
    "strictness": 3,
    "role_information": "You are an AI assistant that helps people find information.",
    "fields_mapping": {
     "content_fields_separator": "\\n",
     "content_fields": [
      "content"
     ],
     "filepath_field": "filepath",
     "title_field": "title",
     "url_field": "url",
     "vector_fields": [
      "contentvector"
     ]
    }
   }
  }
 ]
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content 2.",
                "title": "Citation Title 2",
                "filepath": "contoso2.txt",
                "url": "https://contoso.blob.windows.net/container/contoso2.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Erstellt eine Vervollständigung für die bereitgestellte Azure Cosmos DB.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_cosmos_db",
   "parameters": {
    "authentication": {
     "type": "connection_string",
     "connection_string": "mongodb+srv://rawantest:{password}$@{cluster-name}.mongocluster.cosmos.azure.com/?tls=true&authMechanism=SCRAM-SHA-256&retrywrites=false&maxIdleTimeMS=120000"
    },
    "database_name": "vectordb",
    "container_name": "azuredocs",
    "index_name": "azuredocindex",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "fields_mapping": {
     "content_fields": [
      "content"
     ],
     "vector_fields": [
      "contentvector"
     ]
    }
   }
  }
 ]
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Erstellt eine Vervollständigung für die bereitgestellte Mongo-Datenbank.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "mongo_db",
   "parameters": {
    "authentication": {
     "type": "username_and_password",
     "username": "<username>",
     "password": "<password>"
    },
    "endpoint": "<endpoint_name>",
    "app_name": "<application name>",
    "database_name": "sampledb",
    "collection_name": "samplecollection",
    "index_name": "sampleindex",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "fields_mapping": {
     "content_fields": [
      "content"
     ],
     "vector_fields": [
      "contentvector"
     ]
    }
   }
  }
 ]
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Erstellt eine Vervollständigung für das bereitgestellte Elasticsearch.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "elasticsearch",
   "parameters": {
    "endpoint": "https://your-elasticsearch-endpoint.eastus.azurecontainer.io",
    "index_name": "{index name}",
    "authentication": {
     "type": "key_and_key_id",
     "key": "{key}",
     "key_id": "{key id}"
    }
   }
  }
 ]
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Erstellt eine Vervollständigung für die bereitgestellte Pineconon-Ressource.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "pinecone",
   "parameters": {
    "authentication": {
     "type": "api_key",
     "key": "{api key}"
    },
    "environment": "{environment name}",
    "index_name": "{index name}",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "fields_mapping": {
     "title_field": "title",
     "url_field": "url",
     "filepath_field": "filepath",
     "content_fields": [
      "content"
     ],
     "content_fields_separator": "\n"
    }
   }
  }
 ]
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Transkriptionen – Erstellen

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

Transkribiert Audio in die Eingabesprache.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
Bereitstellungs-ID path Ja string
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Typ: mehrteilige Formulardaten (multipart/form-data)

Name Typ Beschreibung Erforderlich Vorgabe
Modell string ID des zu verwendenden Modells. Die Optionen sind gpt-4o-transcribe, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15, , whisper-1und gpt-4o-transcribe-diarize. Ja
Datei string Das Audiodatei-Objekt, das transkribiert werden soll. Ja
language string Die Sprache des eingegebenen Audios. Die Bereitstellung der Eingabesprache im ISO-639-1-Format verbessert die Genauigkeit und Latenz. No
Eingabeaufforderung string Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen. Der Prompt sollte mit der Audiosprache übereinstimmen. No
Antwortformat audioResponseFormat Definiert das Format der Ausgabe. No
Temperatur number Die Probentemperatur liegt zwischen 0 und 1. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen. Wenn auf 0 gesetzt, verwendet das Modell die logaritarische Wahrscheinlichkeit, um die Temperatur automatisch zu erhöhen, bis bestimmte Schwellenwerte erreicht sind. No 0
timestamp_granularities[] array Die Zeitstempel-Granularitäten, die für diese Transkription gefüllt werden sollen. response_format muss so eingestellt verbose_json werden, dass Zeitstempel-Granularitäten verwendet werden. Entweder oder beide dieser Optionen werden unterstützt: word, oder segment. Hinweis: Es gibt keine zusätzliche Latenz für Segmentzeitstempel, aber das Erstellen von Wortzeitstempeln verursacht zusätzliche Latenz. No ['segment']

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json Objekt
Textdatei/Klartext string Transkribierter Text im Ausgabeformat (wenn response_format einer von war text, vtt oder srt).

Beispiele

Example

Erhält transkribierten Text und zugehörige Metadaten aus bereitgestellten gesprochenen Audiodaten.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Example

Erhält transkribierten Text und zugehörige Metadaten aus bereitgestellten gesprochenen Audiodaten.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Antworten: Statuscode: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Übersetzungen – Erstellen

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

Transkribiert und übersetzt Eingabeaudio in englischen Text.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
Bereitstellungs-ID path Ja string
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Typ: mehrteilige Formulardaten (multipart/form-data)

Name Typ Beschreibung Erforderlich Vorgabe
Datei string Die Audiodatei zum Übersetzen. Ja
Eingabeaufforderung string Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen. Der Prompt sollte auf Englisch sein. No
Antwortformat audioResponseFormat Definiert das Format der Ausgabe. No
Temperatur number Die Probentemperatur liegt zwischen 0 und 1. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen. Wenn auf 0 gesetzt, verwendet das Modell die logaritarische Wahrscheinlichkeit, um die Temperatur automatisch zu erhöhen, bis bestimmte Schwellenwerte erreicht sind. No 0

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json Objekt
Textdatei/Klartext string Transkribierter Text im Ausgabeformat (wenn response_format eines von Text, VTT oder SRT war).

Beispiele

Example

Erhält englischsprachigen transkribierten Text und zugehörige Metadaten aus bereitgestellten gesprochenen Audiodaten.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Antworten: Statuscode: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Example

Erhält englischsprachigen transkribierten Text und zugehörige Metadaten aus bereitgestellten gesprochenen Audiodaten.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Antworten: Statuscode: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Rede – Erstellen

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview

Erzeugt Audio aus dem Eingabetext.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
Bereitstellungs-ID path Ja string
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Typ: mehrteilige Formulardaten (multipart/form-data)

Name Typ Beschreibung Erforderlich Vorgabe
input string Der Text, um Audio zu synthetisieren. Die maximale Länge beträgt 4.096 Zeichen. Ja
Antwortformat enum Das Format, um das Audio zu synthetisieren.
Mögliche Werte: mp3, opus, , aacflac, wav,pcm
No
Geschwindigkeit number Die Geschwindigkeit des synthetisierten Audios. Wählen Sie einen Wert von bis 0.254.0aus. 1.0 ist der Standard. No 1.0
Stimme enum Die Stimme für Sprachsynthese.
Mögliche Werte: alloy, echo, , fableonyx, nova,shimmer
Ja

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/octet-stream string

Beispiele

Example

Synthetisiert Audio aus dem bereitgestellten Text.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview

{
 "input": "Hi! What are you going to make?",
 "voice": "fable",
 "response_format": "mp3"
}

Antworten: Statuscode: 200

{
  "body": "101010101"
}

Bildgenerierungen – Erstellen

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview

Erzeugt einen Batch von Bildern aus einer Textunterschrift bei der Bereitstellung eines gegebenen Bildgenerierungsmodells

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
Bereitstellungs-ID path Ja string
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name Typ Beschreibung Erforderlich Vorgabe
Hintergrund imageBackground Ermöglicht es, Transparenz für den Hintergrund der generierten Bilder einzustellen. Dieser Parameter wird nur für GPT-Image-1-Serienmodelle unterstützt. No auto
n Ganzzahl Die Anzahl der zu erzeugenden Bilder. Für dall-e-3 wird nur n=1 unterstützt. No 1
Ausgabekomprimierung Ganzzahl Der Kompressionswert (0–100%) für die erzeugten Bilder. Dieser Parameter wird nur für GPT-Image-1-Serienmodelle mit dem JPEG-Ausgabeformat unterstützt. No 100
Ausgabeformat imagesOutputFormat Das Dateiformat, in dem die generierten Bilder zurückgegeben werden. Wird nur für GPT-Image-1-Modelle unterstützt. No png
Eingabeaufforderung string Eine Textbeschreibung des gewünschten Bildes. Die maximale Länge beträgt 32.000 Zeichen für die GPT-Image-1-Serie und 4.000 Zeichen für Dall-e-3 Ja
unvollständige Bilder Ganzzahl Die Anzahl der zu generierenden Teilbilder. Dieser Parameter wird für Streaming-Antworten verwendet, die teilweise Bilder zurückgeben. Der Wert muss zwischen 0 und 3 liegen. Wenn auf 0 gesetzt, ist die Antwort ein einzelnes Bild, das in einem Streaming-Event gesendet wird. Beachten Sie, dass das endgültige Bild möglicherweise gesendet wird, bevor die volle Anzahl der Teilbilder erzeugt wurde, wenn das vollständige Bild schneller erzeugt wird. 0
stream Boolescher Wert Bearbeite das Bild im Streaming-Modus. nein false
Qualität imageQuality Die Qualität des erzeugten Bildes. No auto
Antwortformat imagesResponseFormat Das Format, in dem die generierten Bilder zurückgegeben werden. Dieser Parameter wird für gpt-image-1-Serien-Modelle nicht unterstützt, die immer base64-codierte Bilder zurückgeben.
Mögliche Werte: url, b64_json.
No url
size imageSize Die Größe der generierten Bilder. No auto
Stil imageStyle Der Stil der generierten Bilder. Nur für DALL-e-3 unterstützt. No vivid
user string Eine eindeutige Kennung, die Ihren Endnutzer repräsentiert und dabei helfen kann, Missbrauch zu überwachen und zu erkennen. No

Antworten

Statuscode: 200

Beschreibung: Ok

Inhaltstyp Typ Beschreibung
application/json generateImagesResponse

Statuscode: Standard

Beschreibung: Ein Fehler ist aufgetreten.

Inhaltstyp Typ Beschreibung
application/json dalleErrorResponse

Beispiele

Example

Erstellt Bilder mit einem Prompt.

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview

{
 "prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
 "n": 1,
 "style": "natural",
 "quality": "standard"
}

Antworten: Statuscode: 200

{
  "body": {
    "created": 1698342300,
    "data": [
      {
        "revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
        "prompt_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          },
          "profanity": {
            "detected": false,
            "filtered": false
          },
          "custom_blocklists": {
            "filtered": false,
            "details": []
          }
        },
        "url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
        "content_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          }
        }
      }
    ]
  }
}

Bilderzeugungen – Bearbeiten

POST https://{endpoint}/openai/deployments/{deployment-id}/images/edits?api-version=2025-04-01-preview

Bearbeitet ein Bild aus einer Textunterschrift auf einer gegebenen GPT-Image-1-Modellbereitstellung

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
Bereitstellungs-ID path Ja string
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Typ: mehrteilige Formulardaten (multipart/form-data)

Name Typ Beschreibung Erforderlich Vorgabe
Bild Saite oder Array Die Bild(e) zum Bearbeiten. Muss eine unterstützte Bilddatei oder ein Array von Bildern sein. Jedes Bild sollte eine PNG- oder jpg-Datei mit weniger als 50 MB sein. Ja
input_fidelity string Kontrollieren Sie, wie viel Aufwand das Modell aufwenden wird, um den Stil und die Merkmale, insbesondere Gesichtszüge, der Eingabebilder anzupassen. Dieser Parameter wird nur für GPT-Image-1-Serienmodelle unterstützt. Supports high und low. nein low.
mask string Ein zusätzliches Bild, dessen vollständig transparente Flächen (z. B. bei null Alpha) anzeigen, wo das Bild bearbeitet werden soll. Wenn mehrere Bilder bereitgestellt werden, wird die Maske auf das erste Bild angewendet. Es muss eine gültige PNG-Datei sein, weniger als 4 MB, und die gleichen Abmessungen wie das Bild haben. No
n Ganzzahl Die Anzahl der zu erzeugenden Bilder. Muss zwischen 1 und 10 liegen. No 1
Eingabeaufforderung string Eine Textbeschreibung des gewünschten Bildes. Die maximale Länge beträgt 32.000 Zeichen. Ja
Qualität imageQuality Die Qualität des erzeugten Bildes. No auto
unvollständige Bilder Die Anzahl der zu generierenden Teilbilder. Dieser Parameter wird für Streaming-Antworten verwendet, die teilweise Bilder zurückgeben. Der Wert muss zwischen 0 und 3 liegen. Wenn auf 0 gesetzt, ist die Antwort ein einzelnes Bild, das in einem Streaming-Event gesendet wird. Beachten Sie, dass das endgültige Bild möglicherweise gesendet wird, bevor die volle Anzahl der Teilbilder erzeugt wurde, wenn das vollständige Bild schneller erzeugt wird.
stream Boolescher Wert Bearbeite das Bild im Streaming-Modus. nein false
Antwortformat imagesResponseFormat Das Format, in dem die generierten Bilder zurückgegeben werden. No url
size imageSize Die Größe der generierten Bilder. No auto
user string Eine eindeutige Kennung, die Ihren Endnutzer repräsentiert und dabei helfen kann, Missbrauch zu überwachen und zu erkennen. No

Antworten

Statuscode: 200

Beschreibung: Ok

Inhaltstyp Typ Beschreibung
application/json generateImagesResponse

Statuscode: Standard

Beschreibung: Ein Fehler ist aufgetreten.

Inhaltstyp Typ Beschreibung
application/json dalleErrorResponse

Liste – Assistenten

Note

Die Assistants API ist eingestellt und wird am 26. August 2026 eingestellt. Nutzen Sie den allgemein verfügbaren Service Microsoft Foundry Agents. Folgen Sie dem Migrationsleitfaden, um Ihre Arbeitslasten zu aktualisieren. Erfahren Sie mehr.

GET https://{endpoint}/openai/assistants?api-version=2025-04-01-preview

Gibt eine Liste der Assistenten zurück.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
Begrenzung Anfrage No Ganzzahl Eine Begrenzung der Anzahl der zurückzugebenden Objekte. Das Limit kann zwischen 1 und 100 liegen, und der Standard liegt bei 20.
order Anfrage No string
Mögliche Werte: asc, desc
Sortiere die Reihenfolge nach dem created_at Zeitstempel der Objekte. asc für aufsteigende und desc absteigende Ordnung.
Nach Anfrage No string Ein Cursor für die Paginierung. after ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, die mit obj_foo enden, kann Ihr nachfolgender Aufruf after=obj_foo enthalten, um die nächste Seite der Liste abzurufen.
before Anfrage No string Ein Cursor für die Paginierung. before ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, beginnend mit obj_foo, kann Ihr nachfolgender Aufruf before=obj_foo enthalten, um die vorherige Seite der Liste abzurufen.
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json listAssistantsResponse

Beispiele

Example

Gibt eine Liste der Assistenten zurück.

GET https://{endpoint}/openai/assistants?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "asst_abc123",
        "object": "assistant",
        "created_at": 1707257477,
        "name": "Stock Analyst",
        "description": null,
        "model": "gpt-4-1106-preview",
        "instructions": "You are a financial analyst that analyzes stock market prices and other financial data present on user uploaded files or by calling external APIs.",
        "tools": [
          {
            "type": "code_interpreter"
          }
        ],
        "tool_resources": {},
        "metadata": {},
        "top_p": 1.0,
        "temperature": 1.0,
        "response_format": "auto"
      },
      {
        "id": "asst_abc456",
        "object": "assistant",
        "created_at": 1698982718,
        "name": "My Assistant",
        "description": null,
        "model": "gpt-4-turbo",
        "instructions": "You are a helpful assistant designed to make me better at coding!",
        "tools": [],
        "tool_resources": {},
        "metadata": {},
        "top_p": 1.0,
        "temperature": 1.0,
        "response_format": "auto"
      },
      {
        "id": "asst_abc789",
        "object": "assistant",
        "created_at": 1698982643,
        "name": null,
        "description": null,
        "model": "gpt-4-turbo",
        "instructions": null,
        "tools": [],
        "tool_resources": {},
        "metadata": {},
        "top_p": 1.0,
        "temperature": 1.0,
        "response_format": "auto"
      }
    ],
    "first_id": "asst_abc123",
    "last_id": "asst_abc789",
    "has_more": false
  }
}

Erstellen – Assistent

POST https://{endpoint}/openai/assistants?api-version=2025-04-01-preview

Erstelle einen Assistenten mit einem Modell und Anleitungen.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name Typ Beschreibung Erforderlich Vorgabe
Beschreibung string Die Beschreibung des Assistenten. Die maximale Länge beträgt 512 Zeichen.
No
Anweisungen string Die Systemanweisungen, die der Assistent verwendet. Die maximale Länge beträgt 256.000 Zeichen.
No
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
No
Modell string Ja
Name string Der Name des Assistenten. Die maximale Länge beträgt 256 Zeichen.
No
Antwortformat assistantsApiResponseFormatOption Spezifiziert das Format, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit gpt-3.5-turbo-1106.

Einstellung aktiviert { "type": "json_schema", "json_schema": {...} } strukturierte Ausgaben, die sicherstellen, dass das Modell mit deinem bereitgestellten JSON-Schema übereinstimmt. Erfahren Sie mehr im Leitfaden für strukturierte Ausgaben.

Einstellung aktiviert den { "type": "json_object" } JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültig ist.

Wichtig: Beim Einsatz des JSON-Modus müssen Sie das Modell auch anweisen, selbst JSON über eine System- oder Benutzernachricht zu erzeugen. Ohne dies kann das Modell einen endlosen Strom von Leerraum erzeugen, bis die Erzeugung das Token-Limit erreicht, was zu einer langanhaltenden und scheinbar "festgefahrenen" Anfrage führt. Beachten Sie auch, dass der Nachrichteninhalt teilweise abgeschnitten werden kann, wenn finish_reason="length", was darauf hinweist, dass die Generation überschritten max_tokens wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.
No
Temperatur number Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen.
No 1
tool_resources Objekt Eine Sammlung von Ressourcen, die von den Werkzeugen des Assistenten genutzt werden. Die Ressourcen sind spezifisch für die Art des Werkzeugs. Zum Beispiel benötigt das code_interpreter Tool eine Liste von Datei-IDs, während das file_search Tool eine Liste von Vektorspeicher-IDs benötigt.
No
└– code_interpreter Objekt No
└– file_ids array Eine Liste der Datei-IDs, die dem code_interpreter Tool zur Verfügung gestellt wurden. Es können maximal 20 Dateien mit dem Tool verknüpft sein.
No []
└– Dateisuche Objekt No
└– vector_store_ids array Der Vektorspeicher ist mit diesem Assistenten verbunden. Maximal 1 Vektorspeicher kann an den Assistenten angeschlossen sein.
No
└– Vektorspeicher array Ein Helfer, um mit file_ids einen Vektorspeicher zu erstellen und ihn an diesen Assistenten anzuhängen. Maximal 1 Vektorspeicher kann an den Assistenten angeschlossen sein.
No
tools array Eine Liste der auf dem Assistenten aktivierten Tools. Es können maximal 128 Werkzeuge pro Assistent sein. Werkzeuge können von den Typen code_interpreter, retrieval, oder functionsein.
No []
top_p number Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden.

Wir empfehlen im Allgemeinen, diese oder die Temperatur zu verändern, aber nicht beides.
No 1

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json assistantObject

Beispiele

Example

Erstelle einen Assistenten mit einem Modell und Anleitungen.

POST https://{endpoint}/openai/assistants?api-version=2025-04-01-preview

{
 "name": "Math Tutor",
 "instructions": "When a customer asks about a specific math problem, use Python to evaluate their query.",
 "tools": [
  {
   "type": "code_interpreter"
  }
 ],
 "model": "gpt-4-1106-preview"
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "asst_4nsG2qgNzimRPE7MazXTXbU7",
    "object": "assistant",
    "created_at": 1707295707,
    "name": "Math Tutor",
    "description": null,
    "model": "gpt-4-1106-preview",
    "instructions": "When a customer asks about a specific math problem, use Python to evaluate their query.",
    "tools": [
      {
        "type": "code_interpreter"
      }
    ],
    "metadata": {},
    "top_p": 1.0,
    "temperature": 1.0,
    "response_format": "auto"
  }
}

Hole - Assistent

GET https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

Holt einen Assistenten.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
assistant_id path Ja string Die ID des Assistenten zu holen.
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json assistantObject

Beispiele

Example

Holt einen Assistenten.

GET https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "asst_abc123",
    "object": "assistant",
    "created_at": 1699009709,
    "name": "HR Helper",
    "description": null,
    "model": "gpt-4-turbo",
    "instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies.",
    "tools": [
      {
        "type": "file_search"
      }
    ],
    "metadata": {},
    "top_p": 1.0,
    "temperature": 1.0,
    "response_format": "auto"
  }
}

Modify – Assistent

POST https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

Verändert einen Assistenten.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
assistant_id path Ja string Die ID des Assistenten zum Anpassen.
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name Typ Beschreibung Erforderlich Vorgabe
Beschreibung string Die Beschreibung des Assistenten. Die maximale Länge beträgt 512 Zeichen.
No
Anweisungen string Die Systemanweisungen, die der Assistent verwendet. Die maximale Länge beträgt 32.768 Zeichen.
No
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
No
Modell string No
Name string Der Name des Assistenten. Die maximale Länge beträgt 256 Zeichen.
No
Antwortformat assistantsApiResponseFormatOption Spezifiziert das Format, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit gpt-3.5-turbo-1106.

Einstellung aktiviert { "type": "json_schema", "json_schema": {...} } strukturierte Ausgaben, die sicherstellen, dass das Modell mit deinem bereitgestellten JSON-Schema übereinstimmt. Erfahren Sie mehr im Leitfaden für strukturierte Ausgaben.

Einstellung aktiviert den { "type": "json_object" } JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültig ist.

Wichtig: Beim Einsatz des JSON-Modus müssen Sie das Modell auch anweisen, selbst JSON über eine System- oder Benutzernachricht zu erzeugen. Ohne dies kann das Modell einen endlosen Strom von Leerraum erzeugen, bis die Erzeugung das Token-Limit erreicht, was zu einer langanhaltenden und scheinbar "festgefahrenen" Anfrage führt. Beachten Sie auch, dass der Nachrichteninhalt teilweise abgeschnitten werden kann, wenn finish_reason="length", was darauf hinweist, dass die Generation überschritten max_tokens wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.
No
Temperatur number Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen.
No 1
tool_resources Objekt Eine Sammlung von Ressourcen, die von den Werkzeugen des Assistenten genutzt werden. Die Ressourcen sind spezifisch für die Art des Werkzeugs. Zum Beispiel benötigt das code_interpreter Tool eine Liste von Datei-IDs, während das file_search Tool eine Liste von Vektorspeicher-IDs benötigt.
No
└– code_interpreter Objekt No
└– file_ids array Überschreibt die Liste der Datei-IDs, die dem code_interpreter Tool zur Verfügung stehen. Es können maximal 20 Dateien mit dem Tool verknüpft sein.
No []
└– Dateisuche Objekt No
└– vector_store_ids array Überschreibt den Vektorspeicher, der diesem Assistenten zugeordnet ist. Maximal 1 Vektorspeicher kann an den Assistenten angeschlossen sein.
No
tools array Eine Liste der auf dem Assistenten aktivierten Tools. Es können maximal 128 Werkzeuge pro Assistent sein. Werkzeuge können von den Typen code_interpreter, retrieval, oder functionsein.
No []
top_p number Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden.

Wir empfehlen im Allgemeinen, diese oder die Temperatur zu verändern, aber nicht beides.
No 1

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json assistantObject

Beispiele

Example

Verändert einen Assistenten.

POST https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

{
 "instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies. Always response with info from either of the files.",
 "tools": [
  {
   "type": "file_search"
  }
 ],
 "model": "gpt-4-turbo"
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "asst_123",
    "object": "assistant",
    "created_at": 1699009709,
    "name": "HR Helper",
    "description": null,
    "model": "gpt-4-turbo",
    "instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies. Always response with info from either of the files.",
    "tools": [
      {
        "type": "file_search"
      }
    ],
    "tool_resources": {
      "file_search": {
        "vector_store_ids": []
      }
    },
    "metadata": {},
    "top_p": 1.0,
    "temperature": 1.0,
    "response_format": "auto"
  }
}

Löschen – Assistent

DELETE https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

Löschen Sie einen Assistenten.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
assistant_id path Ja string Die ID des Assistenten zum Löschen.
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json deleteAssistantResponse

Beispiele

Example

Löscht einen Assistenten.

DELETE https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "asst_4nsG2qgNzimRPE7MazXTXbU7",
    "object": "assistant.deleted",
    "deleted": true
  }
}

Erstellen - Thread

Note

Die Assistants API ist eingestellt und wird am 26. August 2026 eingestellt. Nutzen Sie den allgemein verfügbaren Service Microsoft Foundry Agents. Folgen Sie dem Migrationsleitfaden, um Ihre Arbeitslasten zu aktualisieren. Erfahren Sie mehr.

POST https://{endpoint}/openai/threads?api-version=2025-04-01-preview

Erstelle einen Thread.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name Typ Beschreibung Erforderlich Vorgabe
Nachrichten array Eine Liste von Nachrichten, mit denen man den Thread beginnen kann. No
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
No
tool_resources Objekt Eine Sammlung von Ressourcen, die den Werkzeugen des Assistenten in diesem Thread zur Verfügung gestellt werden. Die Ressourcen sind spezifisch für die Art des Werkzeugs. Zum Beispiel benötigt das code_interpreter Tool eine Liste von Datei-IDs, während das file_search Tool eine Liste von Vektorspeicher-IDs benötigt.
No
└– code_interpreter Objekt No
└– file_ids array Eine Liste der Datei-IDs, die dem code_interpreter Tool zur Verfügung gestellt wurden. Es können maximal 20 Dateien mit dem Tool verknüpft sein.
No []
└– Dateisuche Objekt No
└– vector_store_ids array Der Vektorspeicher, der an diesen Thread angeschlossen ist. Maximal 1 Vektorspeicher kann an den Thread angeschlossen sein.
No
└– Vektorspeicher array Ein Helfer, um mit file_ids einen Vektorspeicher zu erstellen und an diesen Thread anzuhängen. Maximal 1 Vektorspeicher kann an den Thread angeschlossen sein.
No

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json threadObject

Beispiele

Example

Erstellt einen Thread.

POST https://{endpoint}/openai/threads?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "object": "thread",
    "created_at": 1707297136,
    "metadata": {}
  }
}

Get - Thread

GET https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

Ruft einen Faden ab.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id path Ja string Die ID des abzurufenden Threads.
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json threadObject

Beispiele

Example

Ruft einen Faden ab.

GET https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "object": "thread",
    "created_at": 1707297136,
    "metadata": {},
    "tool_resources": {
      "code_interpreter": {
        "file_ids": []
      }
    }
  }
}

Modify – Thread

POST https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

Verändert einen Thread.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id path Ja string Die ID des Threads zum Anpassen. Nur die kann metadata modifiziert werden.
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name Typ Beschreibung Erforderlich Vorgabe
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
No
tool_resources Objekt Eine Sammlung von Ressourcen, die den Werkzeugen des Assistenten in diesem Thread zur Verfügung gestellt werden. Die Ressourcen sind spezifisch für die Art des Werkzeugs. Zum Beispiel benötigt das code_interpreter Tool eine Liste von Datei-IDs, während das file_search Tool eine Liste von Vektorspeicher-IDs benötigt.
No
└– code_interpreter Objekt No
└– file_ids array Eine Liste der Datei-IDs, die dem code_interpreter Tool zur Verfügung gestellt wurden. Es können maximal 20 Dateien mit dem Tool verknüpft sein.
No []
└– Dateisuche Objekt No
└– vector_store_ids array Der Vektorspeicher, der an diesen Thread angeschlossen ist. Maximal 1 Vektorspeicher kann an den Thread angeschlossen sein.
No

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json threadObject

Beispiele

Example

Verändert einen Thread.

POST https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

{
 "metadata": {
  "modified": "true",
  "user": "abc123"
 }
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "object": "thread",
    "created_at": 1707297136,
    "metadata": {
      "modified": "true",
      "user": "abc123"
    },
    "tool_resources": {}
  }
}

Löschen – Thread

DELETE https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

Lösche einen Thread.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id path Ja string Die ID des Threads, den gelöscht werden soll.
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json deleteThreadResponse

Beispiele

Example

Löscht einen Thread.

DELETE https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "object": "thread.deleted",
    "deleted": true
  }
}

Liste – Nachrichten

Note

Die Assistants API ist eingestellt und wird am 26. August 2026 eingestellt. Nutzen Sie den allgemein verfügbaren Service Microsoft Foundry Agents. Folgen Sie dem Migrationsleitfaden, um Ihre Arbeitslasten zu aktualisieren. Erfahren Sie mehr.

GET https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview

Gibt eine Liste von Nachrichten für einen gegebenen Thread zurück.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id path Ja string Die ID der Threads, zu denen die Nachrichten gehören.
Begrenzung Anfrage No Ganzzahl Eine Begrenzung der Anzahl der zurückzugebenden Objekte. Das Limit kann zwischen 1 und 100 liegen, und der Standard liegt bei 20.
order Anfrage No string
Mögliche Werte: asc, desc
Sortiere die Reihenfolge nach dem created_at Zeitstempel der Objekte. asc für aufsteigende und desc absteigende Ordnung.
Nach Anfrage No string Ein Cursor für die Paginierung. after ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, die mit obj_foo enden, kann Ihr nachfolgender Aufruf after=obj_foo enthalten, um die nächste Seite der Liste abzurufen.
before Anfrage No string Ein Cursor für die Paginierung. before ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, beginnend mit obj_foo, kann Ihr nachfolgender Aufruf before=obj_foo enthalten, um die vorherige Seite der Liste abzurufen.
run_id Anfrage No string Filtere Nachrichten nach der Run-ID, die sie generiert hat.
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json listMessagesResponse

Beispiele

Example

Nachrichten auflisten

GET https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "msg_abc123",
        "object": "thread.message",
        "created_at": 1699016383,
        "assistant_id": null,
        "thread_id": "thread_abc123",
        "run_id": null,
        "role": "user",
        "content": [
          {
            "type": "text",
            "text": {
              "value": "How does AI work? Explain it in simple terms.",
              "annotations": []
            }
          }
        ],
        "attachments": [],
        "metadata": {}
      },
      {
        "id": "msg_abc456",
        "object": "thread.message",
        "created_at": 1699016383,
        "assistant_id": null,
        "thread_id": "thread_abc123",
        "run_id": null,
        "role": "user",
        "content": [
          {
            "type": "text",
            "text": {
              "value": "Hello, what is AI?",
              "annotations": []
            }
          }
        ],
        "attachments": [],
        "metadata": {}
      }
    ],
    "first_id": "msg_abc123",
    "last_id": "msg_abc456",
    "has_more": false
  }
}

Erstellen – Nachricht

POST https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview

Erstellen Sie eine Botschaft.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id path Ja string Die ID der Threads, für die eine Nachricht erstellt werden soll.
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name Typ Beschreibung Erforderlich Vorgabe
Anhänge array Eine Liste der an die Nachricht angehängten Dateien und die Werkzeuge, zu denen sie hinzugefügt werden sollten. No
Inhalt string Der Inhalt der Nachricht. Ja
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
No
Rolle string Die Rolle der Entität, die die Botschaft erschafft. Erlaubte Werte umfassen:
- user: Zeigt an, dass die Nachricht von einem tatsächlichen Benutzer gesendet wurde und in den meisten Fällen zur Darstellung von benutzergenerierten Nachrichten verwendet werden sollte.
- assistant: Zeigt an, dass die Nachricht vom Assistenten generiert wurde. Verwenden Sie diesen Wert, um Nachrichten vom Assistenten in das Gespräch einzufügen.
Ja

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json messageObject

Beispiele

Example

Erstellen Sie eine Botschaft.

POST https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview

{
 "role": "user",
 "content": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces."
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "msg_as3XIk1tpVP3hdHjWBGg3uG4",
    "object": "thread.message",
    "created_at": 1707298421,
    "assistant_id": null,
    "thread_id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "run_id": null,
    "role": "user",
    "content": [
      {
        "type": "text",
        "text": {
          "value": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces.",
          "annotations": []
        }
      }
    ],
    "attachments": [],
    "metadata": {}
  }
}

Erhalten - Nachricht

GET https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview

Holen Sie eine Nachricht ab.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id path Ja string Die ID der Threads, zu denen diese Nachricht gehört.
message_id path Ja string Die ID der abzurufenden Nachricht.
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json messageObject

Beispiele

Example

Holen Sie eine Nachricht ab.

GET https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "msg_as3XIk1tpVP3hdHjWBGg3uG4",
    "object": "thread.message",
    "created_at": 1707298421,
    "thread_id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "role": "user",
    "content": [
      {
        "type": "text",
        "text": {
          "value": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces.",
          "annotations": []
        }
      }
    ],
    "file_ids": [],
    "assistant_id": null,
    "run_id": null,
    "metadata": {}
  }
}

Ändern – Nachricht

POST https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview

Verändert eine Nachricht.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id path Ja string Die ID des Threads, zu dem diese Nachricht gehört.
message_id path Ja string Die ID der Nachricht, die geändert werden soll.
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name Typ Beschreibung Erforderlich Vorgabe
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
No

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json messageObject

Beispiele

Example

Ändere eine Nachricht.

POST https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview

{
 "metadata": {
  "modified": "true",
  "user": "abc123"
 }
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "msg_abc123",
    "object": "thread.message",
    "created_at": 1699017614,
    "assistant_id": null,
    "thread_id": "thread_abc123",
    "run_id": null,
    "role": "user",
    "content": [
      {
        "type": "text",
        "text": {
          "value": "How does AI work? Explain it in simple terms.",
          "annotations": []
        }
      }
    ],
    "file_ids": [],
    "metadata": {
      "modified": "true",
      "user": "abc123"
    }
  }
}

Erstellen – Thread erstellen und ausführen

Note

Die Assistants API ist eingestellt und wird am 26. August 2026 eingestellt. Nutzen Sie den allgemein verfügbaren Service Microsoft Foundry Agents. Folgen Sie dem Migrationsleitfaden, um Ihre Arbeitslasten zu aktualisieren. Erfahren Sie mehr.

POST https://{endpoint}/openai/threads/runs?api-version=2025-04-01-preview

Erstelle einen Thread und führe ihn in einer Anfrage aus.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name Typ Beschreibung Erforderlich Vorgabe
assistant_id string Die ID des Assistenten, um diesen Durchgang auszuführen. Ja
Anweisungen string Überschreiben Sie die Standard-Systemnachricht des Assistenten. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern. No
max_completion_tokens Ganzzahl Die maximale Anzahl der Vervollständigungstoken, die im Verlauf des Durchlaufs verwendet werden dürfen. Der Lauf bemüht sich, nur die angegebene Anzahl der Abschlussmarker über mehrere Runden zu verwenden. Übersteigt der Run die angegebene Anzahl der Completion Tokens, endet der Run mit dem Status incomplete. Siehe incomplete_details für weitere Informationen.
No
max_prompt_tokens Ganzzahl Die maximale Anzahl der Prompt-Token, die im Verlauf des Laufs verwendet werden können. Der Lauf bemüht sich, nur die angegebene Anzahl der Prompt-Token über mehrere Runden zu verwenden. Übersteigt der Lauf die angegebene Anzahl der Prompt-Tokens, endet der Lauf mit dem Status incomplete. Siehe incomplete_details für weitere Informationen.
No
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
No
Modell string Die ID der Modelle, die für diesen Durchlauf verwendet werden sollen. Wenn hier ein Wert angegeben wird, überschreibt er das mit dem Assistenten verbundene Modell. Falls nicht, wird das mit dem Assistenten verbundene Modell verwendet. No
Parallele Werkzeugaufrufe ParallelToolCalls Ob man während der Werkzeugnutzung parallele Funktionsaufrufe aktivieren soll. No Richtig
Antwortformat assistantsApiResponseFormatOption Spezifiziert das Format, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit gpt-3.5-turbo-1106.

Einstellung aktiviert { "type": "json_schema", "json_schema": {...} } strukturierte Ausgaben, die sicherstellen, dass das Modell mit deinem bereitgestellten JSON-Schema übereinstimmt. Erfahren Sie mehr im Leitfaden für strukturierte Ausgaben.

Einstellung aktiviert den { "type": "json_object" } JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültig ist.

Wichtig: Beim Einsatz des JSON-Modus müssen Sie das Modell auch anweisen, selbst JSON über eine System- oder Benutzernachricht zu erzeugen. Ohne dies kann das Modell einen endlosen Strom von Leerraum erzeugen, bis die Erzeugung das Token-Limit erreicht, was zu einer langanhaltenden und scheinbar "festgefahrenen" Anfrage führt. Beachten Sie auch, dass der Nachrichteninhalt teilweise abgeschnitten werden kann, wenn finish_reason="length", was darauf hinweist, dass die Generation überschritten max_tokens wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.
No
stream Boolescher Wert Wenn true, gibt einen Strom von Ereignissen zurück, die während des Runs als servergesendete Ereignisse auftreten, und endet, wenn der Run mit einer data: [DONE] Nachricht in einen Terminalzustand eintritt.
No
stream_options chatCompletionStreamOptions Optionen für Streaming-Antworten. Setzen Sie dies nur, wenn Sie stream: truesetzen.
No Nichts
Temperatur number Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen.
No 1
thread createThreadRequest No
tool_choice assistantsApiToolChoiceOption Kontrolliert, welches (falls vorhandenes) Werkzeug vom Modell aufgerufen wird.
none Das bedeutet, dass das Modell keine Werkzeuge aufruft, sondern stattdessen eine Nachricht generiert.
auto ist der Standardwert und bedeutet, dass das Modell zwischen der Generierung einer Nachricht oder dem Aufrufen eines Werkzeugs wählen kann.
Ein bestimmtes Werkzeug zu spezifizieren oder {"type": "file_search"}{"type": "function", "function": {"name": "my_function"}} das Modell zu zwingen, dieses Tool aufzurufen.
No
tool_resources Objekt Eine Sammlung von Ressourcen, die von den Werkzeugen des Assistenten genutzt werden. Die Ressourcen sind spezifisch für die Art des Werkzeugs. Zum Beispiel benötigt das code_interpreter Tool eine Liste von Datei-IDs, während das file_search Tool eine Liste von Vektorspeicher-IDs benötigt.
No
└– code_interpreter Objekt No
└– file_ids array Eine Liste der Datei-IDs, die dem code_interpreter Tool zur Verfügung gestellt wurden. Es können maximal 20 Dateien mit dem Tool verknüpft sein.
No []
└– Dateisuche Objekt No
└– vector_store_ids array Die ID des Vektorspeichers, der mit diesem Assistenten verbunden ist. Maximal 1 Vektorspeicher kann an den Assistenten angeschlossen sein.
No
tools array Überschreiben Sie die Werkzeuge, die der Assistent für diesen Durchlauf verwenden kann. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern. No
top_p number Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden.

Wir empfehlen im Allgemeinen, diese oder die Temperatur zu verändern, aber nicht beides.
No 1
truncation_strategy truncationObject Steuerungen, wie ein Thread vor dem Durchlauf abgeschnitten wird. Nutze dies, um das anfängliche Kontextfenster des Laufs zu steuern. No

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json runObject

Beispiele

Example

Erstelle einen Thread und führe ihn in einer Anfrage aus.

POST https://{endpoint}/openai/threads/runs?api-version=2025-04-01-preview

{
 "assistant_id": "asst_abc123",
 "thread": {
  "messages": [
   {
    "role": "user",
    "content": "Explain deep learning to a 5 year old."
   }
  ]
 }
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "run_abc123",
    "object": "thread.run",
    "created_at": 1699076792,
    "assistant_id": "asst_abc123",
    "thread_id": "thread_abc123",
    "status": "queued",
    "started_at": null,
    "expires_at": 1699077392,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": null,
    "required_action": null,
    "last_error": null,
    "model": "gpt-4-turbo",
    "instructions": "You are a helpful assistant.",
    "tools": [],
    "tool_resources": {},
    "metadata": {},
    "temperature": 1.0,
    "top_p": 1.0,
    "max_completion_tokens": null,
    "max_prompt_tokens": null,
    "truncation_strategy": {
      "type": "auto",
      "last_messages": null
    },
    "incomplete_details": null,
    "usage": null,
    "response_format": "auto",
    "tool_choice": "auto"
  }
}

Liste - Runs

GET https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview

Gibt eine Liste von Läufen zurück, die zu einem Thread gehören.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id path Ja string Die ID des Threads, zu dem der Lauf gehört.
Begrenzung Anfrage No Ganzzahl Eine Begrenzung der Anzahl der zurückzugebenden Objekte. Das Limit kann zwischen 1 und 100 liegen, und der Standard liegt bei 20.
order Anfrage No string
Mögliche Werte: asc, desc
Sortiere die Reihenfolge nach dem created_at Zeitstempel der Objekte. asc für aufsteigende und desc absteigende Ordnung.
Nach Anfrage No string Ein Cursor für die Paginierung. after ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, die mit obj_foo enden, kann Ihr nachfolgender Aufruf after=obj_foo enthalten, um die nächste Seite der Liste abzurufen.
before Anfrage No string Ein Cursor für die Paginierung. before ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, beginnend mit obj_foo, kann Ihr nachfolgender Aufruf before=obj_foo enthalten, um die vorherige Seite der Liste abzurufen.
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json listRunsResponse

Beispiele

Example

Gibt eine Liste von Läufen zurück, die zu einem Thread gehören.

GET https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "run_abc123",
        "object": "thread.run",
        "created_at": 1699075072,
        "assistant_id": "asst_abc123",
        "thread_id": "thread_abc123",
        "status": "completed",
        "started_at": 1699075072,
        "expires_at": null,
        "cancelled_at": null,
        "failed_at": null,
        "completed_at": 1699075073,
        "last_error": null,
        "model": "gpt-4-turbo",
        "instructions": null,
        "incomplete_details": null,
        "tools": [
          {
            "type": "code_interpreter"
          }
        ],
        "tool_resources": {
          "code_interpreter": {
            "file_ids": [
              "file-abc123",
              "file-abc456"
            ]
          }
        },
        "metadata": {},
        "usage": {
          "prompt_tokens": 123,
          "completion_tokens": 456,
          "total_tokens": 579
        },
        "temperature": 1.0,
        "top_p": 1.0,
        "max_prompt_tokens": 1000,
        "max_completion_tokens": 1000,
        "truncation_strategy": {
          "type": "auto",
          "last_messages": null
        },
        "response_format": "auto",
        "tool_choice": "auto"
      },
      {
        "id": "run_abc456",
        "object": "thread.run",
        "created_at": 1699063290,
        "assistant_id": "asst_abc123",
        "thread_id": "thread_abc123",
        "status": "completed",
        "started_at": 1699063290,
        "expires_at": null,
        "cancelled_at": null,
        "failed_at": null,
        "completed_at": 1699063291,
        "last_error": null,
        "model": "gpt-4-turbo",
        "instructions": null,
        "incomplete_details": null,
        "tools": [
          {
            "type": "code_interpreter"
          }
        ],
        "tool_resources": {
          "code_interpreter": {
            "file_ids": [
              "file-abc123",
              "file-abc456"
            ]
          }
        },
        "metadata": {},
        "usage": {
          "prompt_tokens": 123,
          "completion_tokens": 456,
          "total_tokens": 579
        },
        "temperature": 1.0,
        "top_p": 1.0,
        "max_prompt_tokens": 1000,
        "max_completion_tokens": 1000,
        "truncation_strategy": {
          "type": "auto",
          "last_messages": null
        },
        "response_format": "auto",
        "tool_choice": "auto"
      }
    ],
    "first_id": "run_abc123",
    "last_id": "run_abc456",
    "has_more": false
  }
}

Erstellen – Ausführen

POST https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview

Erstelle einen Durchlauf.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id path Ja string Die ID des Threads, der ausgeführt werden soll.
include[] Anfrage No array Eine Liste zusätzlicher Felder, die in die Antwort aufgenommen werden sollten. Derzeit ist step_details.tool_calls[*].file_search.results[*].content der einzige unterstützte Wert, den Inhalt der Dateisuchergebnisse abzurufen.
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name Typ Beschreibung Erforderlich Vorgabe
additional_instructions string Fügen Sie am Ende der Anweisungen für den Durchlauf zusätzliche Anweisungen hinzu. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern, ohne andere Anweisungen zu überschreiben. No
additional_messages array Fügt dem Thread vor dem Erstellen des Runs zusätzliche Nachrichten hinzu. No
assistant_id string Die ID des Assistenten, um diesen Durchgang auszuführen. Ja
Anweisungen string Überschreiben Sie die Standard-Systemnachricht des Assistenten. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern. No
max_completion_tokens Ganzzahl Die maximale Anzahl der Vervollständigungstoken, die im Verlauf des Durchlaufs verwendet werden dürfen. Der Lauf bemüht sich, nur die angegebene Anzahl der Abschlussmarker über mehrere Runden zu verwenden. Übersteigt der Run die angegebene Anzahl der Completion Tokens, endet der Run mit dem Status incomplete. Siehe incomplete_details für weitere Informationen.
No
max_prompt_tokens Ganzzahl Die maximale Anzahl der Prompt-Token, die im Verlauf des Laufs verwendet werden können. Der Lauf bemüht sich, nur die angegebene Anzahl der Prompt-Token über mehrere Runden zu verwenden. Übersteigt der Lauf die angegebene Anzahl der Prompt-Tokens, endet der Lauf mit dem Status incomplete. Siehe incomplete_details für weitere Informationen.
No
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
No
Modell string Die ID des Modells, das für diesen Durchlauf verwendet werden soll. Wenn hier ein Wert angegeben wird, überschreibt er das mit dem Assistenten verbundene Modell. Falls nicht, wird das mit dem Assistenten verbundene Modell verwendet. No
Parallele Werkzeugaufrufe ParallelToolCalls Ob man während der Werkzeugnutzung parallele Funktionsaufrufe aktivieren soll. No Richtig
Antwortformat assistantsApiResponseFormatOption Spezifiziert das Format, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit gpt-3.5-turbo-1106.

Einstellung aktiviert { "type": "json_schema", "json_schema": {...} } strukturierte Ausgaben, die sicherstellen, dass das Modell mit deinem bereitgestellten JSON-Schema übereinstimmt. Erfahren Sie mehr im Leitfaden für strukturierte Ausgaben.

Einstellung aktiviert den { "type": "json_object" } JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültig ist.

Wichtig: Beim Einsatz des JSON-Modus müssen Sie das Modell auch anweisen, selbst JSON über eine System- oder Benutzernachricht zu erzeugen. Ohne dies kann das Modell einen endlosen Strom von Leerraum erzeugen, bis die Erzeugung das Token-Limit erreicht, was zu einer langanhaltenden und scheinbar "festgefahrenen" Anfrage führt. Beachten Sie auch, dass der Nachrichteninhalt teilweise abgeschnitten werden kann, wenn finish_reason="length", was darauf hinweist, dass die Generation überschritten max_tokens wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.
No
stream Boolescher Wert Wenn true, gibt einen Strom von Ereignissen zurück, die während des Runs als servergesendete Ereignisse auftreten, und endet, wenn der Run mit einer data: [DONE] Nachricht in einen Terminalzustand eintritt.
No
Temperatur number Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen.
No 1
tool_choice assistantsApiToolChoiceOption Kontrolliert, welches (falls vorhandenes) Werkzeug vom Modell aufgerufen wird.
none Das bedeutet, dass das Modell keine Werkzeuge aufruft, sondern stattdessen eine Nachricht generiert.
auto ist der Standardwert und bedeutet, dass das Modell zwischen der Generierung einer Nachricht oder dem Aufrufen eines Werkzeugs wählen kann.
Ein bestimmtes Werkzeug zu spezifizieren oder {"type": "file_search"}{"type": "function", "function": {"name": "my_function"}} das Modell zu zwingen, dieses Tool aufzurufen.
No
tools array Überschreiben Sie die Werkzeuge, die der Assistent für diesen Durchlauf verwenden kann. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern. No
top_p number Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden.

Wir empfehlen im Allgemeinen, diese oder die Temperatur zu verändern, aber nicht beides.
No 1
truncation_strategy truncationObject Steuerungen, wie ein Thread vor dem Durchlauf abgeschnitten wird. Nutze dies, um das anfängliche Kontextfenster des Laufs zu steuern. No

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json runObject

Beispiele

Example

Erstelle einen Durchlauf.

POST https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview

{
 "assistant_id": "asst_abc123"
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "run_abc123",
    "object": "thread.run",
    "created_at": 1699063290,
    "assistant_id": "asst_abc123",
    "thread_id": "thread_abc123",
    "status": "queued",
    "started_at": 1699063290,
    "expires_at": null,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": 1699063291,
    "last_error": null,
    "model": "gpt-4-turbo",
    "instructions": null,
    "incomplete_details": null,
    "tools": [
      {
        "type": "code_interpreter"
      }
    ],
    "metadata": {},
    "usage": null,
    "temperature": 1.0,
    "top_p": 1.0,
    "max_prompt_tokens": 1000,
    "max_completion_tokens": 1000,
    "truncation_strategy": {
      "type": "auto",
      "last_messages": null
    },
    "response_format": "auto",
    "tool_choice": "auto"
  }
}

Lauf – Lauf

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview

Holt einen Lauf ab.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id path Ja string Die ID der durchgeführten Threads.
run_id path Ja string Die ID des Laufs zum Abholen.
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json runObject

Beispiele

Example

Macht einen Lauf.

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "run_HsO8tYM4K5AAMAHgK0J3om8Q",
    "object": "thread.run",
    "created_at": 1707303196,
    "assistant_id": "asst_JtTwHk28cIocgFXZPCBxhOzl",
    "thread_id": "thread_eRNwflE3ncDYak1np6MdMHJh",
    "status": "completed",
    "started_at": 1707303197,
    "expires_at": null,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": 1707303201,
    "last_error": null,
    "model": "gpt-4-1106-preview",
    "instructions": "You are an AI model that empowers every person and every organization on the planet to achieve more.",
    "tools": [],
    "file_ids": [],
    "metadata": {}
  }
}

Modifizieren – Ausführen

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview

Verändert einen Durchlauf.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id path Ja string Die ID der durchgeführten Threads.
run_id path Ja string Die ID des Laufs, der geändert werden soll.
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name Typ Beschreibung Erforderlich Vorgabe
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
No

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json runObject

Beispiele

Example

Verändert einen Durchlauf.

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview

{
 "metadata": {
  "user_id": "user_abc123"
 }
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "run_abc123",
    "object": "thread.run",
    "created_at": 1699075072,
    "assistant_id": "asst_abc123",
    "thread_id": "thread_abc123",
    "status": "completed",
    "started_at": 1699075072,
    "expires_at": null,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": 1699075073,
    "last_error": null,
    "model": "gpt-4-turbo",
    "instructions": null,
    "incomplete_details": null,
    "tools": [
      {
        "type": "code_interpreter"
      }
    ],
    "tool_resources": {
      "code_interpreter": {
        "file_ids": [
          "file-abc123",
          "file-abc456"
        ]
      }
    },
    "metadata": {
      "user_id": "user_abc123"
    },
    "usage": {
      "prompt_tokens": 123,
      "completion_tokens": 456,
      "total_tokens": 579
    },
    "temperature": 1.0,
    "top_p": 1.0,
    "max_prompt_tokens": 1000,
    "max_completion_tokens": 1000,
    "truncation_strategy": {
      "type": "auto",
      "last_messages": null
    },
    "response_format": "auto",
    "tool_choice": "auto"
  }
}

Einreichen – Werkzeugausgaben zum Ausführen

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/submit_tool_outputs?api-version=2025-04-01-preview

Wenn ein Run das status: "requires_action" und required_action.type hat submit_tool_outputs, kann dieser Endpunkt verwendet werden, um die Ausgaben der Werkzeugaufrufe zu senden, sobald sie alle abgeschlossen sind. Alle Ausgaben müssen in einer einzigen Anfrage eingereicht werden.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id path Ja string Die ID der Threads, zu denen dieser Run gehört.
run_id path Ja string Die ID des Durchlaufs, für die die Werkzeugausgabe eingereicht werden muss.
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name Typ Beschreibung Erforderlich Vorgabe
stream Boolescher Wert Wenn true, gibt einen Strom von Ereignissen zurück, die während des Runs als servergesendete Ereignisse auftreten, und endet, wenn der Run mit einer data: [DONE] Nachricht in einen Terminalzustand eintritt.
No
tool_outputs array Eine Liste der Werkzeuge, für die die Ausgaben eingereicht werden. Ja

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json runObject

Beispiele

Example

Wenn ein Run das status: "requires_action" und required_action.type hat submit_tool_outputs, kann dieser Endpunkt verwendet werden, um die Ausgaben der Werkzeugaufrufe zu senden, sobald sie alle abgeschlossen sind. Alle Ausgaben müssen in einer einzigen Anfrage eingereicht werden.

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/submit_tool_outputs?api-version=2025-04-01-preview

{
 "tool_outputs": [
  {
   "tool_call_id": "call_001",
   "output": "70 degrees and sunny."
  }
 ]
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "run_123",
    "object": "thread.run",
    "created_at": 1699075592,
    "assistant_id": "asst_123",
    "thread_id": "thread_123",
    "status": "queued",
    "started_at": 1699075592,
    "expires_at": 1699076192,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": null,
    "last_error": null,
    "model": "gpt-4-turbo",
    "instructions": null,
    "tools": [
      {
        "type": "function",
        "function": {
          "name": "get_current_weather",
          "description": "Get the current weather in a given location",
          "parameters": {
            "type": "object",
            "properties": {
              "location": {
                "type": "string",
                "description": "The city and state, e.g. San Francisco, CA"
              },
              "unit": {
                "type": "string",
                "enum": [
                  "celsius",
                  "fahrenheit"
                ]
              }
            },
            "required": [
              "location"
            ]
          }
        }
      }
    ],
    "metadata": {},
    "usage": null,
    "temperature": 1.0,
    "top_p": 1.0,
    "max_prompt_tokens": 1000,
    "max_completion_tokens": 1000,
    "truncation_strategy": {
      "type": "auto",
      "last_messages": null
    },
    "response_format": "auto",
    "tool_choice": "auto"
  }
}

Abbrechen – Ausführen

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/cancel?api-version=2025-04-01-preview

Hebt einen Durchlauf ab, der ist in_progress.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id path Ja string Die ID des Threads, zu dem dieser Run gehört.
run_id path Ja string Die ID des Laufs zum Absagen.
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json runObject

Beispiele

Example

Hebt einen Durchlauf ab, der ist in_progress.

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/cancel?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "run_abc123",
    "object": "thread.run",
    "created_at": 1699076126,
    "assistant_id": "asst_abc123",
    "thread_id": "thread_abc123",
    "status": "cancelling",
    "started_at": 1699076126,
    "expires_at": 1699076726,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": null,
    "last_error": null,
    "model": "gpt-4-turbo",
    "instructions": "You summarize books.",
    "tools": [
      {
        "type": "file_search"
      }
    ],
    "tool_resources": {
      "file_search": {
        "vector_store_ids": [
          "vs_123"
        ]
      }
    },
    "metadata": {},
    "usage": null,
    "temperature": 1.0,
    "top_p": 1.0,
    "response_format": "auto"
  }
}

Liste – Laufschritte

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps?api-version=2025-04-01-preview

Gibt eine Liste der Laufschritte zurück, die zu einem Lauf gehören.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id path Ja string Die ID des Threads, zu dem die Lauf- und Ausführensschritte gehören.
run_id path Ja string Die ID des Runs, zu dem die Laufschritte gehören.
Begrenzung Anfrage No Ganzzahl Eine Begrenzung der Anzahl der zurückzugebenden Objekte. Das Limit kann zwischen 1 und 100 liegen, und der Standard liegt bei 20.
order Anfrage No string
Mögliche Werte: asc, desc
Sortiere die Reihenfolge nach dem created_at Zeitstempel der Objekte. asc für aufsteigende und desc absteigende Ordnung.
Nach Anfrage No string Ein Cursor für die Paginierung. after ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, die mit obj_foo enden, kann Ihr nachfolgender Aufruf after=obj_foo enthalten, um die nächste Seite der Liste abzurufen.
before Anfrage No string Ein Cursor für die Paginierung. before ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, beginnend mit obj_foo, kann Ihr nachfolgender Aufruf before=obj_foo enthalten, um die vorherige Seite der Liste abzurufen.
API-Version Anfrage Ja string
include[] Anfrage No array Eine Liste zusätzlicher Felder, die in die Antwort aufgenommen werden sollten. Derzeit ist step_details.tool_calls[*].file_search.results[*].content der einzige unterstützte Wert, den Inhalt der Dateisuchergebnisse abzurufen.

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json listRunStepsResponse

Beispiele

Example

Gibt eine Liste der Laufschritte zurück, die zu einem Lauf gehören.

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "step_abc123",
        "object": "thread.run.step",
        "created_at": 1699063291,
        "run_id": "run_abc123",
        "assistant_id": "asst_abc123",
        "thread_id": "thread_abc123",
        "type": "message_creation",
        "status": "completed",
        "cancelled_at": null,
        "completed_at": 1699063291,
        "expired_at": null,
        "failed_at": null,
        "last_error": null,
        "step_details": {
          "type": "message_creation",
          "message_creation": {
            "message_id": "msg_abc123"
          }
        },
        "usage": {
          "prompt_tokens": 123,
          "completion_tokens": 456,
          "total_tokens": 579
        }
      }
    ],
    "first_id": "step_abc123",
    "last_id": "step_abc456",
    "has_more": false
  }
}

Get - Run Step

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps/{step_id}?api-version=2025-04-01-preview

Holt einen Laufschritt ab.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id path Ja string Die ID des Threads, zu dem der Lauf- und Ausführen-Schritt gehört.
run_id path Ja string Die ID des Durchlaufs, zu dem der Laufschritt gehört.
step_id path Ja string Die ID des Laufschritts zum Abrufen.
include[] Anfrage No array Eine Liste zusätzlicher Felder, die in die Antwort aufgenommen werden sollten. Derzeit ist step_details.tool_calls[*].file_search.results[*].content der einzige unterstützte Wert, den Inhalt der Dateisuchergebnisse abzurufen.
API-Version Anfrage Ja string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json runStepObject

Beispiele

Example

Holt einen Laufschritt ab.

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps/{step_id}?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "step_abc123",
    "object": "thread.run.step",
    "created_at": 1699063291,
    "run_id": "run_abc123",
    "assistant_id": "asst_abc123",
    "thread_id": "thread_abc123",
    "type": "message_creation",
    "status": "completed",
    "cancelled_at": null,
    "completed_at": 1699063291,
    "expired_at": null,
    "failed_at": null,
    "last_error": null,
    "step_details": {
      "type": "message_creation",
      "message_creation": {
        "message_id": "msg_abc123"
      }
    },
    "usage": {
      "prompt_tokens": 123,
      "completion_tokens": 456,
      "total_tokens": 579
    }
  }
}

Liste - Vektorspeicher

GET https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview

Gibt eine Liste der Vektorspeicher zurück.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
Begrenzung Anfrage No Ganzzahl Eine Begrenzung der Anzahl der zurückzugebenden Objekte. Das Limit kann zwischen 1 und 100 liegen, und der Standard liegt bei 20.
order Anfrage No string
Mögliche Werte: asc, desc
Sortiere die Reihenfolge nach dem created_at Zeitstempel der Objekte. asc für aufsteigende und desc absteigende Ordnung.
Nach Anfrage No string Ein Cursor für die Paginierung. after ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, die mit obj_foo enden, kann Ihr nachfolgender Aufruf after=obj_foo enthalten, um die nächste Seite der Liste abzurufen.
before Anfrage No string Ein Cursor für die Paginierung. before ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, beginnend mit obj_foo, kann Ihr nachfolgender Aufruf before=obj_foo enthalten, um die vorherige Seite der Liste abzurufen.
API-Version Anfrage Ja string API-Version

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json listVectorStoresResponse

Beispiele

Example

Gibt eine Liste der Vektorspeicher zurück.

GET https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "vs_abc123",
        "object": "vector_store",
        "created_at": 1699061776,
        "name": "Support FAQ",
        "bytes": 139920,
        "file_counts": {
          "in_progress": 0,
          "completed": 3,
          "failed": 0,
          "cancelled": 0,
          "total": 3
        }
      },
      {
        "id": "vs_abc456",
        "object": "vector_store",
        "created_at": 1699061776,
        "name": "Support FAQ v2",
        "bytes": 139920,
        "file_counts": {
          "in_progress": 0,
          "completed": 3,
          "failed": 0,
          "cancelled": 0,
          "total": 3
        }
      }
    ],
    "first_id": "vs_abc123",
    "last_id": "vs_abc456",
    "has_more": false
  }
}

Erstellen - Vektorspeicher

POST https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview

Erstelle einen Vektorspeicher.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
API-Version Anfrage Ja string API-Version

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name Typ Beschreibung Erforderlich Vorgabe
chunking_strategy autoChunkingStrategyRequestParam oder staticChunkingStrategyRequestParam Die Chunking-Strategie, die verwendet wird, um die Datei(en) zu chunken. Wenn nicht gesetzt, werde ich die Strategie auto verwenden. Nur dann anwendbar, wenn file_ids nicht leer ist. No
expires_after vectorStoreExpirationAfter Die Ablaufrichtlinie für einen Vektorspeicher. No
Datei-IDs array Eine Liste von Datei-IDs, die der Vektorspeicher verwenden sollte. Nützlich für Werkzeuge wie file_search diese, die auf Dateien zugreifen können. No
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
No
Name string Der Name des Vektorspeichers. No

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json vectorStoreObject

Beispiele

Example

Erstellt einen Vektorspeicher.

POST https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "vs_abc123",
    "object": "vector_store",
    "created_at": 1699061776,
    "name": "Support FAQ",
    "bytes": 139920,
    "file_counts": {
      "in_progress": 0,
      "completed": 3,
      "failed": 0,
      "cancelled": 0,
      "total": 3
    }
  }
}

Erhalten - Vektorspeicher

GET https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

Ruft einen Vektorspeicher ab.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id path Ja string Die ID des zu abrufenden Vektorspeichers.
API-Version Anfrage Ja string API-Version

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json vectorStoreObject

Beispiele

Example

Ruft einen Vektorspeicher ab.

GET https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "vs_abc123",
    "object": "vector_store",
    "created_at": 1699061776
  }
}

Modify – Vektorspeicher

POST https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

Verändert einen Vektorspeicher.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id path Ja string Die ID des Vektorspeichers, der modifiziert werden soll.
API-Version Anfrage Ja string API-Version

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name Typ Beschreibung Erforderlich Vorgabe
expires_after vectorStoreExpirationAfter Die Ablaufrichtlinie für einen Vektorspeicher. No
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
No
Name string Der Name des Vektorspeichers. No

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json vectorStoreObject

Beispiele

Example

Verändert einen Vektorspeicher.

POST https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

{
 "name": "Support FAQ"
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "vs_abc123",
    "object": "vector_store",
    "created_at": 1699061776,
    "name": "Support FAQ",
    "bytes": 139920,
    "file_counts": {
      "in_progress": 0,
      "completed": 3,
      "failed": 0,
      "cancelled": 0,
      "total": 3
    }
  }
}

Löschen – Vektorspeicher

DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

Lösche einen Vektorspeicher.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id path Ja string Die ID des Vektorspeichers, den gelöscht werden soll.
API-Version Anfrage Ja string API-Version

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json deleteVectorStoreResponse

Beispiele

Example

Löscht einen Vektorspeicher.

DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "vs_abc123",
    "object": "vector_store.deleted",
    "deleted": true
  }
}

Liste – Vektorspeicherdateien

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview

Gibt eine Liste von Vektorspeicherdateien zurück.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id path Ja string Die ID des Vektorspeichers, zu dem die Dateien gehören.
Begrenzung Anfrage No Ganzzahl Eine Begrenzung der Anzahl der zurückzugebenden Objekte. Das Limit kann zwischen 1 und 100 liegen, und der Standard liegt bei 20.
order Anfrage No string
Mögliche Werte: asc, desc
Sortiere die Reihenfolge nach dem created_at Zeitstempel der Objekte. asc für aufsteigende und desc absteigende Ordnung.
Nach Anfrage No string Ein Cursor für die Paginierung. after ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, die mit obj_foo enden, kann Ihr nachfolgender Aufruf after=obj_foo enthalten, um die nächste Seite der Liste abzurufen.
before Anfrage No string Ein Cursor für die Paginierung. before ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, beginnend mit obj_foo, kann Ihr nachfolgender Aufruf before=obj_foo enthalten, um die vorherige Seite der Liste abzurufen.
filter Anfrage No string
Mögliche Werte: in_progress, completed, failed, cancelled
Filtern Sie nach Dateistatus. Einer von in_progress, completed, failed, . cancelled
API-Version Anfrage Ja string API-Version

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json listVectorStoreFilesResponse

Beispiele

Example

Gibt eine Liste von Vektorspeicherdateien zurück.

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "file-abc123",
        "object": "vector_store.file",
        "created_at": 1699061776,
        "vector_store_id": "vs_abc123"
      },
      {
        "id": "file-abc456",
        "object": "vector_store.file",
        "created_at": 1699061776,
        "vector_store_id": "vs_abc123"
      }
    ],
    "first_id": "file-abc123",
    "last_id": "file-abc456",
    "has_more": false
  }
}

Erstellen - Vektorspeicher-Datei

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview

Erstellen Sie eine Vektorspeicherdatei, indem Sie eine Datei an einen Vektorspeicher anhängen.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id path Ja string Die ID des Vektorspeichers, für den eine Datei erstellt werden soll.
API-Version Anfrage Ja string API-Version

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name Typ Beschreibung Erforderlich Vorgabe
chunking_strategy chunkingStrategyRequestParam Die Chunking-Strategie, die verwendet wird, um die Datei(en) zu chunken. Wenn nicht gesetzt, werde ich die Strategie auto verwenden. No
Datei-ID string Eine Datei-ID, die der Vektorspeicher verwenden sollte. Nützlich für Werkzeuge wie file_search diese, die auf Dateien zugreifen können. Ja

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json vectorStoreFileObject

Beispiele

Example

Erstellen Sie eine Vektorspeicherdatei, indem Sie eine Datei an einen Vektorspeicher anhängen.

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview

{
 "file_id": "file-abc123"
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "file-abc123",
    "object": "vector_store.file",
    "created_at": 1699061776,
    "usage_bytes": 1234,
    "vector_store_id": "vs_abcd",
    "status": "completed",
    "last_error": null
  }
}

Get - Vektorspeicher-Datei

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview

Ruft eine Vektorspeicherdatei ab.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id path Ja string Die ID des Vektorspeichers, zu dem die Datei gehört.
Datei-ID path Ja string Die ID der gesicherten Datei.
API-Version Anfrage Ja string API-Version

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json vectorStoreFileObject

Beispiele

Example

Ruft eine Vektorspeicherdatei ab.

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "file-abc123",
    "object": "vector_store.file",
    "created_at": 1699061776,
    "vector_store_id": "vs_abcd",
    "status": "completed",
    "last_error": null
  }
}

Löschen – Vektorspeicher-Datei

DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview

Lösche eine Vektorspeicherdatei. Dadurch wird die Datei aus dem Vektorspeicher entfernt, aber die Datei selbst wird nicht gelöscht. Um die Datei zu löschen, verwenden Sie den Endpunkt für das Löschen der Datei.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id path Ja string Die ID des Vektorspeichers, zu dem die Datei gehört.
Datei-ID path Ja string Die ID der zu löschenden Datei.
API-Version Anfrage Ja string API-Version

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json deleteVectorStoreFileResponse

Beispiele

Example

Lösche eine Vektorspeicherdatei. Dadurch wird die Datei aus dem Vektorspeicher entfernt, aber die Datei selbst wird nicht gelöscht. Um die Datei zu löschen, verwenden Sie den Endpunkt für das Löschen der Datei.

DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "file_abc123",
    "object": "vector_store.file.deleted",
    "deleted": true
  }
}

Updatevectorstorefileattributes

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview

Aktualisiere Attribute in einer Vektorspeicherdatei.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id path Ja string Die ID des Vektorspeichers, zu dem die Datei gehört.
Datei-ID path Ja string Die ID der Datei, um die Attribute zu aktualisieren.

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name Typ Beschreibung Erforderlich Vorgabe
attributes VectorStoreFileAttributes Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern und Objekte über die API oder das Dashboard abzufragen. Tasten sind Zeichenketten mit einer maximalen Länge von 64 Zeichen. Werte sind Zeichenketten mit einer maximalen Länge von 512 Zeichen, Booleans oder Zahlen.
Ja

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json vectorStoreFileObject

Vektorspeicher-Dateiinhalt abrufen

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}/content?api-version=2025-04-01-preview

Rufen Sie den geparsten Inhalt einer Vektorspeicherdatei ab.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id path Ja string Die ID des Vektorspeichers.
Datei-ID path Ja string Die ID der Datei im Vektorspeicher.

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json VectorStoreFileContentResponse

Suchvektorspeicher

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/search?api-version=2025-04-01-preview

Durchsuche einen Vektorspeicher nach relevanten Chunks basierend auf einem Abfrage- und Dateiattributfilter.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id path Ja string Die ID des zu suchenden Vektorspeichers.

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name Typ Beschreibung Erforderlich Vorgabe
Filter ComparisonFilter oder CompoundFilter Ein Filter, der basierend auf Dateiattributen angewendet wird. No
max_anzahl_ergebnisse Ganzzahl Die maximale Anzahl an Ergebnissen, die du ergeben kannst. Diese Zahl sollte zwischen 1 und 50 liegen. No 10
Anfrage Saite oder Array Eine Abfragefolge für eine Suche Ja
Ranglistenoptionen Objekt Rangfolgeoptionen für die Suche. No
└– Ranker enum
Mögliche Werte: auto, default-2024-11-15
No
└─ Punktschwelle number No 0
rewrite_query Boolescher Wert Ob die natürliche Sprachanfrage für die Vektorsuche umgeschrieben werden soll. No Falsch

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json VectorStoreSearchResultsPage

Erstellen – Vektorspeicher-Datei-Batch

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches?api-version=2025-04-01-preview

Erstellen Sie eine Vektorspeicher-Datei-Batch.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id path Ja string Die ID des Vektorspeichers, für den ein File Batch erstellt werden soll.
API-Version Anfrage Ja string API-Version

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name Typ Beschreibung Erforderlich Vorgabe
chunking_strategy chunkingStrategyRequestParam Die Chunking-Strategie, die verwendet wird, um die Datei(en) zu chunken. Wenn nicht gesetzt, werde ich die Strategie auto verwenden. No
Datei-IDs array Eine Liste von Datei-IDs, die der Vektorspeicher verwenden sollte. Nützlich für Werkzeuge wie file_search diese, die auf Dateien zugreifen können. Ja

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json vectorStoreFileBatchObject

Beispiele

Example

Erstellen Sie eine Vektorspeicher-Datei-Batch.

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches?api-version=2025-04-01-preview

{
 "file_ids": [
  "file-abc123",
  "file-abc456"
 ]
}

Antworten: Statuscode: 200

{
  "id": "vsfb_abc123",
  "object": "vector_store.file_batch",
  "created_at": 1699061776,
  "vector_store_id": "vs_abc123",
  "status": "in_progress",
  "file_counts": {
    "in_progress": 1,
    "completed": 1,
    "failed": 0,
    "cancelled": 0,
    "total": 0
  }
}

Get - Vektorspeicher-Dateibatch

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}?api-version=2025-04-01-preview

Ruft einen Vektorspeicher-Dateibatch ab.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id path Ja string Die ID des Vektorspeichers, zu dem der Dateibatch gehört.
batch_id path Ja string Die ID des Dateibatches, der abgerufen wird.
API-Version Anfrage Ja string API-Version

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json vectorStoreFileBatchObject

Beispiele

Example

Ruft einen Vektorspeicher-Dateibatch ab.

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "vsfb_abc123",
    "object": "vector_store.file_batch",
    "created_at": 1699061776,
    "vector_store_id": "vs_abc123",
    "status": "in_progress",
    "file_counts": {
      "in_progress": 1,
      "completed": 1,
      "failed": 0,
      "cancelled": 0,
      "total": 0
    }
  }
}

Abbrechen – Vektorspeicher-Datei-Batch

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/cancel?api-version=2025-04-01-preview

Einen Vektorspeicher-Dateibatch abbrechen. Dies versucht, die Verarbeitung der Dateien in diesem Batch so schnell wie möglich zu beenden.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id path Ja string Die ID des Vektorspeichers, zu dem der Dateibatch gehört.
batch_id path Ja string Die ID des Dateibatches, um zu stornieren.
API-Version Anfrage Ja string API-Version

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json vectorStoreFileBatchObject

Beispiele

Example

Einen Vektorspeicher-Dateibatch abbrechen. Dies versucht, die Verarbeitung der Dateien in diesem Batch so schnell wie möglich zu beenden.

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/cancel?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "vsfb_abc123",
    "object": "vector_store.file_batch",
    "created_at": 1699061776,
    "vector_store_id": "vs_abc123",
    "status": "cancelling",
    "file_counts": {
      "in_progress": 12,
      "completed": 3,
      "failed": 0,
      "cancelled": 0,
      "total": 15
    }
  }
}

Liste – Vektorspeicher-Datei-Batchdateien

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/files?api-version=2025-04-01-preview

Gibt eine Liste von Vektorspeicherdateien in einem Batch zurück.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id path Ja string Die ID des Vektorspeichers, zu dem die Dateien gehören.
batch_id path Ja string Die ID des Dateibatches, zu dem die Dateien gehören.
Begrenzung Anfrage No Ganzzahl Eine Begrenzung der Anzahl der zurückzugebenden Objekte. Das Limit kann zwischen 1 und 100 liegen, und der Standard liegt bei 20.
order Anfrage No string
Mögliche Werte: asc, desc
Sortiere die Reihenfolge nach dem created_at Zeitstempel der Objekte. asc für aufsteigende und desc absteigende Ordnung.
Nach Anfrage No string Ein Cursor für die Paginierung. after ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, die mit obj_foo enden, kann Ihr nachfolgender Aufruf after=obj_foo enthalten, um die nächste Seite der Liste abzurufen.
before Anfrage No string Ein Cursor für die Paginierung. before ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, beginnend mit obj_foo, kann Ihr nachfolgender Aufruf before=obj_foo enthalten, um die vorherige Seite der Liste abzurufen.
filter Anfrage No string
Mögliche Werte: in_progress, completed, failed, cancelled
Filtern Sie nach Dateistatus. Einer von in_progress, completed, failed, . cancelled
API-Version Anfrage Ja string API-Version

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json listVectorStoreFilesResponse

Beispiele

Example

Gibt eine Liste von Vektorspeicherdateien zurück.

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/files?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "file-abc123",
        "object": "vector_store.file",
        "created_at": 1699061776,
        "vector_store_id": "vs_abc123"
      },
      {
        "id": "file-abc456",
        "object": "vector_store.file",
        "created_at": 1699061776,
        "vector_store_id": "vs_abc123"
      }
    ],
    "first_id": "file-abc123",
    "last_id": "file-abc456",
    "has_more": false
  }
}

Erstellen – Realtimesession

POST https://{endpoint}/openai/realtimeapi/sessions?api-version=2025-04-01-preview

Erstellen Sie ein flüchtiges API-Token für die Verwendung in clientseitigen Anwendungen mit der Realtime API. Kann mit denselben Sitzungsparametern wie das session.update Client-Event konfiguriert werden. Es antwortet mit einem Sitzungsobjekt sowie einem client_secret Schlüssel, der ein brauchbares ephemeres API-Token enthält, das zur Authentifizierung von Browser-Clients für die Echtzeit-API verwendet werden kann.

Anforderungstext

Content-Type: application/json

Name Typ Beschreibung Erforderlich Vorgabe
input_audio_format enum Das Format des Eingabeaudios. Optionen sind pcm16, g711_ulaw, oder g711_alaw.
Für pcm16muss das Eingangsaudio 16-Bit-PCM mit einer Abtastrate von 24 kHz, Einkanal-(Mono) und Little-Endian-Byte-Ordnung sein.

Mögliche Werte: pcm16, g711_ulaw, g711_alaw
No
input_audio_noise_reduction Objekt Konfiguration zur Rauschreduktion des Eingangs-Audios. Dieser kann auf null ausgeschaltet eingestellt werden.
Rauschunterdrückung filtert Audio, der dem Eingangs-Audiopuffer hinzugefügt wird, bevor er an VAD und das Modell gesendet wird.
Das Filtern des Audios kann die Genauigkeit von VAD und Kurvenerkennung verbessern (Fehlalarme reduzieren) und die Leistung modellieren, indem die Wahrnehmung des Eingabetons verbessert wird.
No
└– Typ enum Art der Lärmunterdrückung. near_field ist für nah sprechende Mikrofone wie Kopfhörer, far_field ist für Fernfeldmikrofone wie Laptop- oder Konferenzraummikrofone.

Mögliche Werte: near_field, far_field
No
input_audio_transcription Objekt Die Konfiguration für die Eingangs-Audiotranskription ist standardmäßig auf aus eingestellt und kann so null eingestellt werden, dass sie sich nach Einschalten ausschaltet. Eingabe-Audiotranskription ist nicht native im Modell, da das Modell Audio direkt konsumiert. Die Transkription läuft asynchron über das Transkriptions-Endpunkt und sollte als Leitfaden für die Eingabe-Audioinhalte behandelt werden, statt als genau das, was das Modell gehört hat. Der Kunde kann optional die Sprache und den Prompt für die Transkription einstellen; diese bieten dem Transkriptionsdienst zusätzliche Orientierung.
No
└– Sprache string Die Sprache des eingegebenen Audios. Die Bereitstellung der Eingabesprache im ISO-639-1 (z. B. en) Format verbessert die Genauigkeit und Latenz.
No
└─ Modell string Das Modell für die Transkription, aktuelle Optionen sind gpt-4o-transcribe, gpt-4o-transcribe-diarize, , gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15und whisper-1.
No
└– Eingabeaufforderung string Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen.
Für whisper-1, ist der Prompt eine Liste von Schlüsselwörtern.
Für gpt-4o-transcribe Modelle ist die Aufforderung eine Freitextzeichenkette, zum Beispiel "erwarten Sie Wörter, die mit Technologie zu tun haben".
No
Anweisungen string Die Standard-Systeminstruktionen (d. h. Systemnachricht) wurden vorangestellt, um Modellaufrufe zu erstellen. Dieses Feld ermöglicht es dem Client, das Modell anhand der gewünschten Antworten zu steuern. Das Modell kann zum Inhalt und Format der Antwort angewiesen werden (z. B. "sehr prägnant sein", "freundlich handeln", "hier sind Beispiele für gute Antworten") und zum Audioverhalten (z. B. "schnell sprechen", "Emotion in deine Stimme einbringen", "häufig lachen"). Die Anweisungen werden nicht garantiert vom Modell befolgt, aber sie geben dem Modell Hinweise auf das gewünschte Verhalten.

Beachten Sie, dass der Server Standardbefehle setzt, die verwendet werden, wenn dieses Feld nicht gesetzt ist und zu Beginn der Sitzung im session.created Event sichtbar sind.
No
max_response_output_tokens Ganzzahl oder String Maximale Anzahl von Ausgabetoken für eine einzelne Assistentenantwort, einschließlich Werkzeugaufrufe. Geben Sie eine ganze Zahl zwischen 1 und 4096 an, um die Ausgabetoken zu begrenzen oder inf für die maximal verfügbaren Token für ein bestimmtes Modell. Standardmäßig gilt inf.
No
modalities Die Menge der Modalitäten, mit denen das Modell antworten kann. Um Audio zu deaktivieren, setze dies auf ["text"].
No
Modell string Der Name der für diese Sitzung verwendeten Einsatz.
No
output_audio_format enum Das Format der Ausgabe des Audios. Optionen sind pcm16, g711_ulaw, oder g711_alaw.
Für pcm16wird das Ausgangsaudio mit einer Frequenz von 24 kHz abgetastet.

Mögliche Werte: pcm16, g711_ulaw, g711_alaw
No
Temperatur number Stichprobentemperatur für das Modell, begrenzt auf [0,6, 1,2]. Für Audiomodelle wird eine Temperatur von 0,8 für die beste Leistung sehr empfohlen.
No 0.8
tool_choice string Wie das Modell Werkzeuge auswählt. Optionen sind auto, none, , requiredoder geben Sie eine Funktion an.
No auto
tools array Werkzeuge (Funktionen), die dem Modell zur Verfügung stehen. No
turn_detection Objekt Konfiguration für Zugerkennung, entweder Server-VAD oder semantisches VAD. Dies kann auf null deaktiviert eingestellt werden, wobei der Client die Modellantwort manuell auslösen muss.
Server-VAD bedeutet, dass das Modell den Beginn und das Ende der Sprache basierend auf der Lautstärke erkennt und am Ende der Benutzersprache antwortet.
Semantisches VAD ist fortschrittlicher und verwendet ein Dreherkennungsmodell (in Verbindung mit VAD), um semantisch zu schätzen, ob der Benutzer mit dem Sprechen fertig ist, und setzt dann dynamisch eine Auszeit basierend auf dieser Wahrscheinlichkeit. Wenn zum Beispiel der User-Audio mit uhhmabklingt, wird das Modell eine geringe Wahrscheinlichkeit für das Ende der Zuge erzielen und länger warten, bis der Benutzer weiterspricht. Das kann für natürlichere Gespräche nützlich sein, kann aber eine höhere Latenz haben.
No
└– create_response Boolescher Wert Ob automatisch eine Antwort generiert werden soll, wenn ein VAD-Stopp-Event auftritt.
No Richtig
└– Eifer enum Wird nur für den semantic_vad Modus verwendet. Die Bereitschaft des Modells zu reagieren. low Er wartet länger, bis der Nutzer weiterspricht, antwortet high schneller. auto ist der Standard und äquivalent zu medium.

Mögliche Werte: low, medium, high, auto
No
└– interrupt_response Boolescher Wert Ob man eine laufende Antwort automatisch unterbrechen soll, die zur Standardkonversation (d. h. conversation von auto) führt, wenn ein VAD-Startereignis auftritt.
No Richtig
└– prefix_padding_ms Ganzzahl Wird nur für den server_vad Modus verwendet. Menge an Audio, die vor der Erkennung der Sprache (in Millisekunden) durch das VAD enthalten sein sollte. Standardmäßig liegt es auf 300 ms.
No
└– Dauer_der_Stille_in_ms Ganzzahl Wird nur für den server_vad Modus verwendet. Dauer der Stille zur Erkennung des Sprachstopps (in Millisekunden). Standardmäßig 500 ms. Bei kürzeren Werten reagiert das Modell schneller, kann aber bei kurzen Pausen des Nutzers eingreifen.
No
└– Schwellenwert number Wird nur für den server_vad Modus verwendet. Aktivierungsschwelle für VAD (0,0 bis 1,0) liegt standardmäßig bei 0,5. Ein höherer Schwellenwert erfordert lauteren Ton, um das Modell zu aktivieren, und kann daher in lauten Umgebungen besser abschneiden.
No
└– Typ enum Art der Abzugserkennung.

Mögliche Werte: server_vad, semantic_vad
No
Stimme VoiceIdsShared No

Antworten

Statuscode: 200

Beschreibung: Sitzung erfolgreich erstellt.

Inhaltstyp Typ Beschreibung
application/json RealtimeSessionCreateResponse

Erstellen - TranskriptionEchtzeitsitzung

POST https://{endpoint}/openai/realtimeapi/transcription_sessions?api-version=2025-04-01-preview

Erstellen Sie ein ephemeres API-Token für die Nutzung in clientseitigen Anwendungen mit der Realtime-API speziell für Echtzeit-Transkriptionen. Kann mit denselben Sitzungsparametern wie das transcription_session.update Client-Event konfiguriert werden. Es antwortet mit einem Sitzungsobjekt sowie einem client_secret Schlüssel, der ein brauchbares ephemeres API-Token enthält, das zur Authentifizierung von Browser-Clients für die Echtzeit-API verwendet werden kann.

Anforderungstext

Content-Type: application/json

Name Typ Beschreibung Erforderlich Vorgabe
include array Die Sammlung von Elementen, die in die Transkription aufgenommen werden sollten. Derzeit verfügbare Artikel sind:
- item.input_audio_transcription.logprobs
No
input_audio_format enum Das Format des Eingabeaudios. Optionen sind pcm16, g711_ulaw, oder g711_alaw.
Für pcm16muss das Eingangsaudio 16-Bit-PCM mit einer Abtastrate von 24 kHz, Einkanal-(Mono) und Little-Endian-Byte-Ordnung sein.

Mögliche Werte: pcm16, g711_ulaw, g711_alaw
No
input_audio_noise_reduction Objekt Konfiguration zur Rauschreduktion des Eingangs-Audios. Dieser kann auf null ausgeschaltet eingestellt werden.
Rauschunterdrückung filtert Audio, der dem Eingangs-Audiopuffer hinzugefügt wird, bevor er an VAD und das Modell gesendet wird.
Das Filtern des Audios kann die Genauigkeit von VAD und Kurvenerkennung verbessern (Fehlalarme reduzieren) und die Leistung modellieren, indem die Wahrnehmung des Eingabetons verbessert wird.
No
└– Typ enum Art der Lärmunterdrückung. near_field ist für nah sprechende Mikrofone wie Kopfhörer, far_field ist für Fernfeldmikrofone wie Laptop- oder Konferenzraummikrofone.

Mögliche Werte: near_field, far_field
No
input_audio_transcription Objekt Konfiguration für Eingabe-Audio-Transkription. Der Kunde kann optional die Sprache und den Prompt für die Transkription einstellen; diese bieten dem Transkriptionsdienst zusätzliche Orientierung.
No
└– Sprache string Die Sprache des eingegebenen Audios. Die Bereitstellung der Eingabesprache im ISO-639-1 (z. B. en) Format verbessert die Genauigkeit und Latenz.
No
└─ Modell enum Das Modell für die Transkription, aktuelle Optionen sind gpt-4o-transcribe, gpt-4o-mini-transcribe, , gpt-4o-mini-transcribe-2025-12-15und whisper-1.

Mögliche Werte: gpt-4o-transcribe, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15, whisper-1
No
└– Eingabeaufforderung string Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen.
Für whisper-1, ist der Prompt eine Liste von Schlüsselwörtern.
Für gpt-4o-transcribe Modelle ist die Aufforderung eine Freitextzeichenkette, zum Beispiel "erwarten Sie Wörter, die mit Technologie zu tun haben".
No
modalities Die Menge der Modalitäten, mit denen das Modell antworten kann. Um Audio zu deaktivieren, setze dies auf ["text"].
No
turn_detection Objekt Konfiguration für Zugerkennung, entweder Server-VAD oder semantisches VAD. Dies kann auf null deaktiviert eingestellt werden, wobei der Client die Modellantwort manuell auslösen muss.
Server-VAD bedeutet, dass das Modell den Beginn und das Ende der Sprache basierend auf der Lautstärke erkennt und am Ende der Benutzersprache antwortet.
Semantisches VAD ist fortschrittlicher und verwendet ein Dreherkennungsmodell (in Verbindung mit VAD), um semantisch zu schätzen, ob der Benutzer mit dem Sprechen fertig ist, und setzt dann dynamisch eine Auszeit basierend auf dieser Wahrscheinlichkeit. Wenn zum Beispiel der User-Audio mit uhhmabklingt, wird das Modell eine geringe Wahrscheinlichkeit für das Ende der Zuge erzielen und länger warten, bis der Benutzer weiterspricht. Das kann für natürlichere Gespräche nützlich sein, kann aber eine höhere Latenz haben.
No
└– create_response Boolescher Wert Ob automatisch eine Antwort generiert werden soll, wenn ein VAD-Stopp-Event auftritt. Für Transkriptionssitzungen nicht verfügbar.
No Richtig
└– Eifer enum Wird nur für den semantic_vad Modus verwendet. Die Bereitschaft des Modells zu reagieren. low Er wartet länger, bis der Nutzer weiterspricht, antwortet high schneller. auto ist der Standard und äquivalent zu medium.

Mögliche Werte: low, medium, high, auto
No
└– interrupt_response Boolescher Wert Ob man eine laufende Antwort automatisch unterbrechen soll, die zur Standardkonversation (d. h. conversation von auto) führt, wenn ein VAD-Startereignis auftritt. Für Transkriptionssitzungen nicht verfügbar.
No Richtig
└– prefix_padding_ms Ganzzahl Wird nur für den server_vad Modus verwendet. Menge an Audio, die vor der Erkennung der Sprache (in Millisekunden) durch das VAD enthalten sein sollte. Standardmäßig liegt es auf 300 ms.
No
└– Dauer_der_Stille_in_ms Ganzzahl Wird nur für den server_vad Modus verwendet. Dauer der Stille zur Erkennung des Sprachstopps (in Millisekunden). Standardmäßig 500 ms. Bei kürzeren Werten reagiert das Modell schneller, kann aber bei kurzen Pausen des Nutzers eingreifen.
No
└– Schwellenwert number Wird nur für den server_vad Modus verwendet. Aktivierungsschwelle für VAD (0,0 bis 1,0) liegt standardmäßig bei 0,5. Ein höherer Schwellenwert erfordert lauteren Ton, um das Modell zu aktivieren, und kann daher in lauten Umgebungen besser abschneiden.
No
└– Typ enum Art der Abzugserkennung.

Mögliche Werte: server_vad, semantic_vad
No

Antworten

Statuscode: 200

Beschreibung: Sitzung erfolgreich erstellt.

Inhaltstyp Typ Beschreibung
application/json RealtimeTranscriptionSessionCreateResponse

Antworten

POST https://{endpoint}/openai/responses?api-version=2025-04-01-preview

Erzeugt eine Modellantwort.

Anforderungstext

Content-Type: application/json

Name Typ Beschreibung Erforderlich Vorgabe
include array No
input Saite oder Array Modelleingaben Ja
Anweisungen string Fügt eine System- (oder Entwickler-) Nachricht als erstes Element im Kontext des Modells ein.

Wenn man zusammen mit previous_response_idverwendet, werden die Anweisungen aus einer vorherigen Antwort nicht auf die nächste Antwort übernommen. Dadurch ist es einfach, System- (oder Entwickler-) Nachrichten in neuen Antworten auszutauschen.
No
max_output_tokens Ganzzahl Eine obere Obergrenze für die Anzahl der Tokens, die für eine Antwort generiert werden können, einschließlich sichtbarer Ausgabetoken und des Gesprächszustands.
No
Parallele Werkzeugaufrufe Boolescher Wert Ob das Modell Werkzeugaufrufe parallel ausführen soll.
No Richtig
previous_response_id string Die eindeutige ID der vorherigen Antwort auf das Modell. Nutzen Sie dies, um Gespräche mit mehreren Runden zu erstellen. Erfahren Sie mehr über den Gesprächszustand.
No
reasoning Reasoning Konfigurationsoptionen für Schlussfolgermodelle. No
store Boolescher Wert Ob die generierte Modellantwort für eine spätere Abruf über die API gespeichert werden soll.
No Richtig
stream Boolescher Wert Wenn auf true gesetzt, werden die Antwortdaten des Modells an den Client gestreamt, während sie mithilfe von Server-gesendeten Ereignissen generiert werden.
Weitere Informationen finden Sie im Abschnitt Streaming unten.
No Falsch
Text Objekt Konfigurationsoptionen für eine Textantwort des Modells. Es können Klartext oder strukturierte JSON-Daten sein. Erfahren Sie mehr:
- Texteingaben und -ausgaben
- Strukturierte Ausgaben
No
└─ Format TextResponseFormatConfiguration Ein Objekt, das das Format angibt, das das Modell ausgeben muss.

Die Konfiguration { "type": "json_schema" } aktiviert strukturierte Ausgaben, die sicherstellen, dass das Modell mit dem bereitgestellten JSON-Schema übereinstimmt.

Das Standardformat ist { "type": "text" } ohne zusätzliche Optionen.

Nicht empfohlen für GPT-4o und neuere Modelle:

Einstellung aktiviert den { "type": "json_object" } älteren JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültiges JSON ist. Die Verwendung json_schema ist bevorzugt für Modelle, die sie unterstützen.
No
tool_choice ToolChoiceOptions oder ToolChoiceTypes oder ToolChoiceFunction Wie das Modell auswählen sollte, welches Tool (oder welche Werkzeuge) es bei der Generierung einer Antwort verwendet. Sehen Sie sich den Parameter tools an, um zu sehen, welche Werkzeuge das Modell aufrufen kann.
No
tools array Ein Array von Werkzeugen, die das Modell aufrufen kann, während es eine Antwort erzeugt. Du kannst angeben, welches Werkzeug du verwenden sollst, indem du den Parameter tool_choice einlegst.

Die zwei Kategorien von Werkzeugen, die Sie dem Modell bereitstellen können, sind:

- Integrierte Tools: Werkzeuge, die von OpenAI bereitgestellt werden und das erweitern
Funktionen des Modells
No
truncation enum Die Abschneidungsstrategie, die für die Modellantwort verwendet werden soll.
- auto: Wenn der Kontext dieser und der vorherigen Antwort die Größe des Kontextfensters des Modells übersteigt, wird das Modell die Antwort kürzen, um zum Kontextfenster zu passen, indem es Eingabepunkte mitten im Gespräch platziert.
- disabled (Standard): Wenn eine Modellantwort die Kontextfenstergröße eines Modells überschreitet, schlägt die Anfrage mit einem Fehler von 400 fehl.

Mögliche Werte: auto, disabled
No

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json response
text/event-stream responseStreamEvent

Statuscode: Standard

Beschreibung: Dienst nicht verfügbar

Inhaltstyp Typ Beschreibung
application/json errorResponse

Responses API – Eingabepunkte

GET https://{endpoint}/openai/responses/{response_id}?api-version=2025-04-01-preview

Ruft eine Modellantwort mit der gegebenen ID ab.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
response_id path Ja string Die ID der Antwort, die abgerufen werden soll.
include Anfrage No array Zusätzliche Felder, die in die Antwort aufgenommen werden sollten. Weitere Informationen finden Sie den include obigen Parameter zur Antworterstellung.

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json response

Statuscode: Standard

Beschreibung: Dienst nicht verfügbar

Inhaltstyp Typ Beschreibung
application/json errorResponse

Antwort löschen

DELETE https://{endpoint}/openai/responses/{response_id}?api-version=2025-04-01-preview

Löscht eine Modellantwort mit der angegebenen ID.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
response_id path Ja string Die ID der Antwort zum Löschen.

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Statuscode: 404

Beschreibung: Nicht gefunden

Inhaltstyp Typ Beschreibung
application/json error

Statuscode: Standard

Beschreibung: Dienst nicht verfügbar

Inhaltstyp Typ Beschreibung
application/json errorResponse

Responses API – Liste der Antwortobjekte

GET https://{endpoint}/openai/responses/{response_id}/input_items?api-version=2025-04-01-preview

Gibt eine Liste von Eingabeelementen für eine gegebene Antwort zurück.

URI-Parameter

Name In Erforderlich Typ Beschreibung
endpoint path Ja Zeichenketten-URL Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: https://aoairesource.openai.azure.com. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
response_id path Ja string Die ID der Antwort, für die Eingaben abgerufen werden soll.
Begrenzung Anfrage No Ganzzahl Eine Begrenzung der Anzahl der zurückzugebenden Objekte. Das Limit kann zwischen 1 und 100 liegen, und der Standard liegt bei 20.
order Anfrage No string
Mögliche Werte: asc, desc
Die Reihenfolge, in der die Eingabeelemente zurückgegeben werden. Standard ist asc.
- asc: Geben Sie die Eingabeelemente in aufsteigender Reihenfolge zurück.
- desc: Geben Sie die Eingabeelemente in absteigender Reihenfolge zurück.
Nach Anfrage No string Eine Item-ID, nach der man die Einträge auflisten kann, verwendet in der Paginierung.
before Anfrage No string Eine Item-ID, um vorherige Artikel aufzulisten, verwendet in der Paginierung.

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name Erforderlich Typ Beschreibung
Autorisierung Richtig string Beispiel:Authorization: Bearer {Azure_OpenAI_Auth_Token}

Um ein Authentifizierungstoken mit Azure CLI zu generieren: az account get-access-token --resource https://cognitiveservices.azure.com

Typ: oauth2
Autorisierungs-URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Umfang: https://ai.azure.com/.default
API-Schlüssel Richtig string Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp Typ Beschreibung
application/json responseItemList

Komponenten

errorResponse

Name Typ Beschreibung Erforderlich Vorgabe
Fehler error No

errorBase

Name Typ Beschreibung Erforderlich Vorgabe
code string No
Nachricht string No

Fehler

Name Typ Beschreibung Erforderlich Vorgabe
innerer Fehler innerError Innerer Fehler mit zusätzlichen Details. No
param string No
type string No

innerError

Innerer Fehler mit zusätzlichen Details.

Name Typ Beschreibung Erforderlich Vorgabe
code innerErrorCode Fehlercodes für das innere Fehlerobjekt. No
Content-Filtern-Egebnisse contentFilterPromptResults Informationen über die Kategorie der Inhaltsfilterung (Hass, sexuell, Gewalt, self_harm), ob sie erkannt wurde, sowie das Schweregrad (very_low, niedrig, mittel, hoch im Maßstab, das die Intensität und das Risikoniveau schädlicher Inhalte bestimmt) und ob sie gefiltert wurden oder nicht. Informationen zu Jailbreak-Inhalten und Schimpfwörtern, ob sie erkannt wurden und ob sie gefiltert wurden oder nicht. Und Informationen zur Kundensperrliste, falls sie gefiltert wurde und deren ID es ist. No

innerErrorCode

Fehlercodes für das innere Fehlerobjekt.

Eigentum Wert
Beschreibung Fehlercodes für das innere Fehlerobjekt.
Typ string
Werte ResponsibleAIPolicyViolation

dalleErrorResponse

Name Typ Beschreibung Erforderlich Vorgabe
Fehler dalleError No

dalleError

Name Typ Beschreibung Erforderlich Vorgabe
innerer Fehler dalleInnerError Innerer Fehler mit zusätzlichen Details. No
param string No
type string No

dalleInnerError

Innerer Fehler mit zusätzlichen Details.

Name Typ Beschreibung Erforderlich Vorgabe
code innerErrorCode Fehlercodes für das innere Fehlerobjekt. No
Content-Filtern-Egebnisse dalleFilterResults Informationen über die Kategorie der Inhaltsfilterung (Hass, sexuell, Gewalt, self_harm), ob sie erkannt wurde, sowie das Schweregrad (very_low, niedrig, mittel, hoch im Maßstab, das die Intensität und das Risikoniveau schädlicher Inhalte bestimmt) und ob sie gefiltert wurden oder nicht. Informationen zu Jailbreak-Inhalten und Schimpfwörtern, ob sie erkannt wurden und ob sie gefiltert wurden oder nicht. Und Informationen zur Kundensperrliste, falls sie gefiltert wurde und deren ID es ist. No
überarbeitete_Aufforderung string Der Prompt, mit dem das Bild generiert wurde, falls es eine Überarbeitung des Prompts gab. No

contentFilterCompletionTextSpan

Beschreibt einen Zeitraum innerhalb des generierten Vervollständigungstextes. Offset 0 ist der erste UTF32-Codepunkt des Vervollständigungstextes.

Name Typ Beschreibung Erforderlich Vorgabe
completion_end_offset Ganzzahl Versatz des ersten UTF32-Codepunkts, der aus der Spannweite ausgeschlossen ist. Dieses Feld ist für leere Felder immer gleich completion_start_offset. Dieses Feld ist für nichtleere Felder immer größer als completion_start_offset. Ja
completion_start_offset Ganzzahl Versatz des UTF32-Codepunkts, der die Spanne beginnt. Ja

InhaltFilterErgebnisBasis

Name Typ Beschreibung Erforderlich Vorgabe
gefiltert Boolescher Wert Ja

contentFilterSeverityResult

Name Typ Beschreibung Erforderlich Vorgabe
gefiltert Boolescher Wert Ja
severity string No

Ergebnis der Inhaltserkennungsfilterung

Name Typ Beschreibung Erforderlich Vorgabe
erkannt Boolescher Wert No
gefiltert Boolescher Wert Ja

Content-Filter mit Zitierungsergebnis erkannt

Name Typ Beschreibung Erforderlich Vorgabe
Zitat Objekt No
└– URL string No
└– Lizenz string No

contentFilterDetectedWithCompletionTextSpansResult

Name Typ Beschreibung Erforderlich Vorgabe
Details array No

contentFilterIdResult

Name Typ Beschreibung Erforderlich Vorgabe
gefiltert Boolescher Wert Ja
id string No

contentFilterResultsBase

Informationen zu den Inhaltsfilterergebnissen.

Name Typ Beschreibung Erforderlich Vorgabe
custom_blocklists contentFilterDetailedResults Das Filtern von Inhalten liefert eine detaillierte Anzahl der Inhaltsfilter-IDs für die gefilterten Segmente. No
Fehler errorBase No
hate Inhaltsfilter-Schweregrad-Ergebnis No
Profanität Ergebnis des Inhaltsfilters erkannt No
Selbstverletzung Inhaltsfilter-Schweregrad-Ergebnis No
Sexuelle Inhaltsfilter-Schweregrad-Ergebnis No
Gewalt Inhaltsfilter-Schweregrad-Ergebnis No

contentFilterPromptResults

Informationen über die Kategorie der Inhaltsfilterung (Hass, sexuell, Gewalt, self_harm), ob sie erkannt wurde, sowie das Schweregrad (very_low, niedrig, mittel, hoch im Maßstab, das die Intensität und das Risikoniveau schädlicher Inhalte bestimmt) und ob sie gefiltert wurden oder nicht. Informationen zu Jailbreak-Inhalten und Schimpfwörtern, ob sie erkannt wurden und ob sie gefiltert wurden oder nicht. Und Informationen zur Kundensperrliste, falls sie gefiltert wurde und deren ID es ist.

Name Typ Beschreibung Erforderlich Vorgabe
custom_blocklists contentFilterDetailedResults Das Filtern von Inhalten liefert eine detaillierte Anzahl der Inhaltsfilter-IDs für die gefilterten Segmente. No
Fehler errorBase No
hate Inhaltsfilter-Schweregrad-Ergebnis No
indirect_attack Ergebnis des Inhaltsfilters erkannt No
Jailbreak Ergebnis des Inhaltsfilters erkannt No
Profanität Ergebnis des Inhaltsfilters erkannt No
Selbstverletzung Inhaltsfilter-Schweregrad-Ergebnis No
Sexuelle Inhaltsfilter-Schweregrad-Ergebnis No
Gewalt Inhaltsfilter-Schweregrad-Ergebnis No

Inhaltsfilterauswahl-Ergebnisse

Informationen über die Kategorie der Inhaltsfilterung (Hass, sexuell, Gewalt, self_harm), ob sie erkannt wurde, sowie das Schweregrad (very_low, niedrig, mittel, hoch im Maßstab, das die Intensität und das Risikoniveau schädlicher Inhalte bestimmt) und ob sie gefiltert wurden oder nicht. Informationen über Texte und Schimpfwörter von Drittanbietern, ob sie erkannt wurden und ob sie gefiltert wurden oder nicht. Und Informationen zur Kundensperrliste, falls sie gefiltert wurde und deren ID es ist.

Name Typ Beschreibung Erforderlich Vorgabe
custom_blocklists contentFilterDetailedResults Das Filtern von Inhalten liefert eine detaillierte Anzahl der Inhaltsfilter-IDs für die gefilterten Segmente. No
Fehler errorBase No
hate Inhaltsfilter-Schweregrad-Ergebnis No
Profanität Ergebnis des Inhaltsfilters erkannt No
protected_material_code contentFilterDetectedWithCitationResult No
protected_material_text Ergebnis des Inhaltsfilters erkannt No
Selbstverletzung Inhaltsfilter-Schweregrad-Ergebnis No
Sexuelle Inhaltsfilter-Schweregrad-Ergebnis No
ungrounded_material contentFilterDetectedWithCompletionTextSpansResult No
Gewalt Inhaltsfilter-Schweregrad-Ergebnis No

contentFilterDetailedResults

Das Filtern von Inhalten liefert eine detaillierte Anzahl der Inhaltsfilter-IDs für die gefilterten Segmente.

Name Typ Beschreibung Erforderlich Vorgabe
Details array No
gefiltert Boolescher Wert Ja

PromptFilterErgebnis

Inhaltsfilterung führt für einen einzelnen Prompt in der Anfrage.

Name Typ Beschreibung Erforderlich Vorgabe
Content-Filtern-Egebnisse contentFilterPromptResults Informationen über die Kategorie der Inhaltsfilterung (Hass, sexuell, Gewalt, self_harm), ob sie erkannt wurde, sowie das Schweregrad (very_low, niedrig, mittel, hoch im Maßstab, das die Intensität und das Risikoniveau schädlicher Inhalte bestimmt) und ob sie gefiltert wurden oder nicht. Informationen zu Jailbreak-Inhalten und Schimpfwörtern, ob sie erkannt wurden und ob sie gefiltert wurden oder nicht. Und Informationen zur Kundensperrliste, falls sie gefiltert wurde und deren ID es ist. No
prompt_index Ganzzahl No

promptFilterResults

Inhaltsfilterung führt zu null oder mehr Prompts in der Anfrage. Bei einer Streaming-Anfrage können Ergebnisse für verschiedene Prompts zu unterschiedlichen Zeiten oder in unterschiedlicher Reihenfolge eingehen.

Für diese Komponente sind keine Eigenschaften definiert.

dalleContentFilterResults

Informationen zu den Inhaltsfilterergebnissen.

Name Typ Beschreibung Erforderlich Vorgabe
hate Inhaltsfilter-Schweregrad-Ergebnis No
Selbstverletzung Inhaltsfilter-Schweregrad-Ergebnis No
Sexuelle Inhaltsfilter-Schweregrad-Ergebnis No
Gewalt Inhaltsfilter-Schweregrad-Ergebnis No

dalleFilterResults

Informationen über die Kategorie der Inhaltsfilterung (Hass, sexuell, Gewalt, self_harm), ob sie erkannt wurde, sowie das Schweregrad (very_low, niedrig, mittel, hoch im Maßstab, das die Intensität und das Risikoniveau schädlicher Inhalte bestimmt) und ob sie gefiltert wurden oder nicht. Informationen zu Jailbreak-Inhalten und Schimpfwörtern, ob sie erkannt wurden und ob sie gefiltert wurden oder nicht. Und Informationen zur Kundensperrliste, falls sie gefiltert wurde und deren ID es ist.

Name Typ Beschreibung Erforderlich Vorgabe
custom_blocklists contentFilterDetailedResults Das Filtern von Inhalten liefert eine detaillierte Anzahl der Inhaltsfilter-IDs für die gefilterten Segmente. No
hate Inhaltsfilter-Schweregrad-Ergebnis No
Jailbreak Ergebnis des Inhaltsfilters erkannt No
Profanität Ergebnis des Inhaltsfilters erkannt No
Selbstverletzung Inhaltsfilter-Schweregrad-Ergebnis No
Sexuelle Inhaltsfilter-Schweregrad-Ergebnis No
Gewalt Inhaltsfilter-Schweregrad-Ergebnis No

chatCompletionsRequestCommon

Name Typ Beschreibung Erforderlich Vorgabe
frequency_penalty number Zahl zwischen -2,0 und 2,0. Positive Werte bestrafen neue Token basierend auf ihrer bisherigen Häufigkeit im Text, wodurch die Wahrscheinlichkeit des Modells verringert, dieselbe Zeile wortwörtlich zu wiederholen. No 0
Logit-Bias Objekt Ändere die Wahrscheinlichkeit, dass bestimmte Token im Completion erscheinen. Akzeptiert ein JSON-Objekt, das Token (angegeben durch ihre Token-ID im Tokenizer) auf einen zugehörigen Bias-Wert von -100 bis 100 zuordnet. Mathematisch wird der Bias zu den vom Modell vor der Stichprobe erzeugten Logits addiert. Der genaue Effekt variiert je nach Modell, aber Werte zwischen -1 und 1 sollten die Selektionswahrscheinlichkeit verringern oder erhöhen; Werte wie -100 oder 100 sollten zu einem Bann oder zur exklusiven Auswahl des entsprechenden Tokens führen. No
max_completion_tokens Ganzzahl Eine obere Schranke für die Anzahl der Tokens, die für einen Abschluss generiert werden können, einschließlich sichtbarer Ausgabetoken und Reasoning-Tokens. No
maximale_Anzahl_von_Tokens Ganzzahl Die maximale Anzahl der Token, die für die generierte Antwort erlaubt war. Standardmäßig beträgt die Anzahl der Tokens, die das Modell zurückgeben kann, (4096 – Prompt-Token). Das ist nicht mit O1-Modellen kompatibel. No 4096
metadata Objekt Vom Entwickler definierte Tags und Werte, die zum Filtern von Abschlüssen im gespeicherten Abschluss-Dashboard verwendet werden. No
presence_penalty number Zahl zwischen -2,0 und 2,0. Positive Werte bestrafen neue Tokens basierend darauf, ob sie bisher im Text erscheinen, was die Wahrscheinlichkeit erhöht, dass das Modell über neue Themen spricht. No 0
Stopp Saite oder Array Bis zu 4 Sequenzen, bei denen die API aufhört, weitere Token zu generieren. No
store Boolescher Wert Ob das Ergebnis dieser Chat-Abschlussanfrage für die Verwendung in unseren Modelldestillations- oder Bewertungsprodukten gespeichert werden soll oder nicht. No
stream Boolescher Wert Wenn gesetzt, werden partielle Nachrichtendeltas gesendet, wie in ChatGPT. Token werden als rein datenbasierte, servergesendete Ereignisse gesendet, sobald sie verfügbar sind, wobei der Strom durch eine data: [DONE] Nachricht beendet wird. No Falsch
Temperatur number Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen.
Wir empfehlen im Allgemeinen, dies zu ändern oder top_p , aber nicht beides.
No 1
top_p number Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden.
Wir empfehlen im Allgemeinen, dies zu ändern oder temperature , aber nicht beides.
No 1
user string Eine eindeutige Identifikator, die Ihren Endnutzer repräsentiert und Azure OpenAI helfen kann, Missbrauch zu überwachen und zu erkennen. No

erstellenAbschlussanfrage

Name Typ Beschreibung Erforderlich Vorgabe
best_of Ganzzahl Erzeugt best_of serverseitige Komplettierungen und gibt das "beste" zurück (das mit der höchsten Log-Wahrscheinlichkeit pro Token). Die Ergebnisse können nicht gestreamt werden.

Wenn mit nverwendet, steuert die best_of Anzahl der Kandidatenkomplettierungen und n gibt an, wie viele zurückgegeben werden sollen. best_of muss größer als nsein.

Hinweis: Da dieser Parameter viele Vervollständigungen erzeugt, kann er Ihre Token-Quote schnell verbrauchen. Verwenden Sie sorgfältig und stellen Sie sicher, dass Sie angemessene Einstellungen für max_tokens und stophaben.
No 1
Echo Boolescher Wert Echo den Prompt zusätzlich zum Abschluss
No Falsch
frequency_penalty number Zahl zwischen -2,0 und 2,0. Positive Werte bestrafen neue Token basierend auf ihrer bisherigen Häufigkeit im Text, wodurch die Wahrscheinlichkeit des Modells verringert, dieselbe Zeile wortwörtlich zu wiederholen.
No 0
Logit-Bias Objekt Ändere die Wahrscheinlichkeit, dass bestimmte Token im Completion erscheinen.

Akzeptiert ein JSON-Objekt, das Token (angegeben durch ihre Token-ID im GPT-Tokenizer) auf einen zugehörigen Bias-Wert von -100 bis 100 zuordnet. Mathematisch wird der Bias zu den vom Modell vor der Stichprobe erzeugten Logits addiert. Der genaue Effekt variiert je nach Modell, aber Werte zwischen -1 und 1 sollten die Selektionswahrscheinlichkeit verringern oder erhöhen; Werte wie -100 oder 100 sollten zu einem Bann oder zur exklusiven Auswahl des entsprechenden Tokens führen.

Zum Beispiel kannst du passen {"50256": -100} , um zu verhindern, dass das <|endoftext|> Token generiert wird.
No Nichts
logprobs Ganzzahl Beziehen Sie die Log-Wahrscheinlichkeiten der logprobs wahrscheinlichsten Ausgabetoken sowie der ausgewählten Token ein. Zum Beispiel, wenn logprobs 5 ist, gibt die API eine Liste der 5 wahrscheinlichsten Token zurück. Die API gibt immer das logprob von dem abgetasteten Token zurück, sodass es bis zu viele logprobs+1 Elemente in der Antwort geben kann.

Der maximale Wert für logprobs ist 5.
No Nichts
maximale_Anzahl_von_Tokens Ganzzahl Die maximale Anzahl der Token, die bei der Fertigstellung generiert werden können.

Die Token-Anzahl deines Prompts plus max_tokens darf die Kontextlänge des Modells nicht überschreiten.
No 16
n Ganzzahl Wie viele Abschlüsse für jeden Prompt generiert werden sollen.

Hinweis: Da dieser Parameter viele Vervollständigungen erzeugt, kann er Ihre Token-Quote schnell verbrauchen. Verwenden Sie sorgfältig und stellen Sie sicher, dass Sie angemessene Einstellungen für max_tokens und stophaben.
No 1
presence_penalty number Zahl zwischen -2,0 und 2,0. Positive Werte bestrafen neue Tokens basierend darauf, ob sie bisher im Text erscheinen, was die Wahrscheinlichkeit erhöht, dass das Modell über neue Themen spricht.
No 0
Eingabeaufforderung Saite oder Array Die Eingabeaufforderung(en) zur Generierung von Komplettierungen, codiert als String, Array von Strings, Array von Token oder Array von Token-Arrays.

Beachten Sie, dass <|endoftext|> der Dokumentseparator ist, den das Modell während des Trainings sieht, sodass das Modell generiert, wenn kein Prompt angegeben ist, als ob es vom Anfang eines neuen Dokuments stammt.
Ja
seed Ganzzahl Wenn angegeben, bemüht sich unser System, deterministisch zu samplingen, sodass wiederholte Anfragen mit denselben seed Parametern dasselbe Ergebnis liefern.

Determinismus ist nicht garantiert, und du solltest auf den Antwortparameter system_fingerprint zurückgreifen, um Änderungen im Backend zu überwachen.
No
Stopp Saite oder Array Bis zu 4 Sequenzen, bei denen die API aufhört, weitere Token zu generieren. Der zurückgegebene Text enthält die Stoppsequenz nicht.
No
stream Boolescher Wert Ob ich den Teilfortschritt zurückstreamen soll. Wenn gesetzt, werden Token als rein datenbasierte, servergesendete Ereignisse gesendet, sobald sie verfügbar sind, wobei der Strom durch eine data: [DONE] Nachricht beendet wird. Beispiel Python Code.
No Falsch
Suffix string Das Suffix, das nach dem Abschluss des eingefügten Textes kommt.

Dieser Parameter wird nur für gpt-3.5-turbo-instructunterstützt.
No Nichts
Temperatur number Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen.

Wir empfehlen im Allgemeinen, dies zu ändern oder top_p , aber nicht beides.
No 1
top_p number Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden.

Wir empfehlen im Allgemeinen, dies zu ändern oder temperature , aber nicht beides.
No 1
user string Eine eindeutige Kennung, die Ihren Endnutzer repräsentiert und dabei helfen kann, Missbrauch zu überwachen und zu erkennen.
No

createCompletionResponse

Stellt eine Vervollständigungsantwort der API dar. Hinweis: Sowohl das gestreamte als auch das nicht gestreamte Antwortobjekt haben die gleiche Form (im Gegensatz zum Chat-Endpunkt).

Name Typ Beschreibung Erforderlich Vorgabe
Optionen array Die Liste der Vervollständigungsoptionen, die das Modell für die Eingabeaufforderung generiert hat. Ja
erstellt Ganzzahl Der Unix-Zeitstempel (in Sekunden) des Zeitpunkts, an dem die Fertigstellung erstellt wurde. Ja
id string Eine eindeutige Kennung für den Abschluss. Ja
Modell string Das Modell, das für die Fertigstellung verwendet wird. Ja
Objekt enum Der Objekttyp, der immer "text_completion" ist.
Mögliche Werte: text_completion
Ja
prompt_filter_results promptFilterResults Inhaltsfilterung führt zu null oder mehr Prompts in der Anfrage. Bei einer Streaming-Anfrage können Ergebnisse für verschiedene Prompts zu unterschiedlichen Zeiten oder in unterschiedlicher Reihenfolge eingehen. No
Systemfingerabdruck string Dieser Fingerabdruck stellt die Backend-Konfiguration dar, mit der das Modell läuft.

Kann zusammen mit dem seed Anfrageparameter verwendet werden, um zu verstehen, wann Backend-Änderungen vorgenommen wurden, die den Determinismus beeinflussen könnten.
No
Nutzung completionUsage Nutzungsstatistiken für die Abschlussanfrage. No

Chat-Vervollständigungsanfrage erstellen

Name Typ Beschreibung Erforderlich Vorgabe
Audio Objekt Parameter für den Audioausgang. Erforderlich, wenn die Audioausgabe mit modalities: ["audio"]angefordert wird. No
└─ Format enum Spezifiziert das Ausgabe-Audioformat. Muss einer von wav, mp3, flac, , opusoder pcm16sein.

Mögliche Werte: wav, mp3, flac, opus, pcm16
No
└– Stimme enum Spezifiziert den Sprachtyp. Unterstützte Stimmen sind alloy, echo, fable, , onyx, novaund shimmer.

Mögliche Werte: alloy, echo, , fableonyx, nova,shimmer
No
data_sources array Die Konfigurationseinträge für Azure OpenAI-Chat-Erweiterungen, die sie verwenden.
Diese zusätzliche Spezifikation ist nur mit Azure OpenAI kompatibel.
No
frequency_penalty number Zahl zwischen -2,0 und 2,0. Positive Werte bestrafen neue Token basierend auf ihrer bisherigen Häufigkeit im Text, wodurch die Wahrscheinlichkeit des Modells verringert, dieselbe Zeile wortwörtlich zu wiederholen.
No 0
function_call string oder chatCompletionFunctionCallOption Veraltet zugunsten von tool_choice.

Kontrolliert, welche (falls vorhandene) Funktion vom Modell aufgerufen wird.
none das bedeutet, dass das Modell keine Funktion aufruft, sondern stattdessen eine Nachricht generiert.
auto das bedeutet, dass das Modell zwischen der Erzeugung einer Nachricht oder dem Aufruf einer Funktion wählen kann.
Die Spezifizierung einer bestimmten Funktion über {"name": "my_function"} zwingt das Modell, diese Funktion aufzurufen.

none ist der Standard, wenn keine Funktionen vorhanden sind. auto ist der Standard, wenn Funktionen vorhanden sind.
No
functions array Veraltet zugunsten von tools.

Eine Liste von Funktionen, für die das Modell JSON-Eingaben generieren kann.
No
Logit-Bias Objekt Ändere die Wahrscheinlichkeit, dass bestimmte Token im Completion erscheinen.

Akzeptiert ein JSON-Objekt, das Token (angegeben durch ihre Token-ID im Tokenizer) auf einen zugehörigen Bias-Wert von -100 bis 100 abbildet. Mathematisch wird der Bias zu den vom Modell vor der Stichprobe erzeugten Logits addiert. Der genaue Effekt variiert je nach Modell, aber Werte zwischen -1 und 1 sollten die Selektionswahrscheinlichkeit verringern oder erhöhen; Werte wie -100 oder 100 sollten zu einem Bann oder zur exklusiven Auswahl des entsprechenden Tokens führen.
No Nichts
logprobs Boolescher Wert Ob die Log-Wahrscheinlichkeiten der Ausgabetoken zurückgegeben werden sollen oder nicht. Wenn wahr, gibt die logaritarischen Wahrscheinlichkeiten jedes in der contentmessagevon zurückgegebenen Ausgabetokens zurück. No Falsch
max_completion_tokens Ganzzahl Eine obere Schranke für die Anzahl der Tokens, die für einen Abschluss generiert werden können, einschließlich sichtbarer Ausgabetoken und Reasoning-Tokens. No
maximale_Anzahl_von_Tokens Ganzzahl Die maximale Anzahl der Token, die im Chat-Abschluss generiert werden kann.

Die Gesamtlänge der Eingabetoken und generierten Tokens ist durch die Kontextlänge des Modells begrenzt.
No
Nachrichten array Eine Liste der Nachrichten, die das bisherige Gespräch ausmachen. Beispiel Python Code. Ja
metadata Objekt Vom Entwickler definierte Tags und Werte, die zum Filtern von Abschlüssen im gespeicherten Abschluss-Dashboard verwendet werden. No
modalities ChatCompletionModalities Ausgabetypen, die das Modell für diese Anfrage generieren soll.
Die meisten Modelle sind in der Lage, Text zu generieren, was standardmäßig ist:

["text"]

Das gpt-4o-audio-preview Modell kann auch zur Audioerzeugung verwendet werden. Um zu verlangen, dass dieses Modell sowohl Text- als auch Audioantworten erzeugt, können Sie verwenden:

["text", "audio"]
No
n Ganzzahl Wie viele Chat-Abschlussoptionen soll für jede Eingabenachricht generiert werden? Beachten Sie, dass Sie basierend auf der Anzahl der generierten Token in allen Optionen berechnet werden. Achten Sie n darauf, 1 die Kosten zu minimieren. No 1
Parallele Werkzeugaufrufe ParallelToolCalls Ob man während der Werkzeugnutzung parallele Funktionsaufrufe aktivieren soll. No Richtig
prediction PredictionContent Konfiguration für eine vorhergesagte Ausgabe, die die Reaktionszeiten erheblich verbessern kann, wenn große Teile der Modellantwort im Voraus bekannt sind. Dies tritt am häufigsten auf, wenn Sie eine Datei mit nur geringfügigen Änderungen an den meisten Inhalten neu generieren. No
presence_penalty number Zahl zwischen -2,0 und 2,0. Positive Werte bestrafen neue Tokens basierend darauf, ob sie bisher im Text erscheinen, was die Wahrscheinlichkeit erhöht, dass das Modell über neue Themen spricht.
No 0
Denkanstrengung enum Nur O1-Modelle

Begrenzt den Aufwand beim Schließen bei Denkmustern.

Derzeit unterstützte Werte sind low, medium, und high. Eine Reduzierung des Schlussarbeitsaufwands kann zu schnelleren Antworten und weniger Token beim Schließen in einer Antwort führen.
Mögliche Werte: low, medium, high
No
Antwortformat ResponseFormatText oder ResponseFormatJsonObject oder ResponseFormatJsonSchema Ein Objekt, das das Format angibt, das das Modell ausgeben muss. Kompatibel mit GPT-4o,GPT-4o Mini, GPT-4 Turbo und allen GPT-3.5 Turbo Modellen, die neuer als gpt-3.5-turbo-1106.

Einstellung auf { "type": "json_schema", "json_schema": {...} } aktiviert strukturierte Ausgaben, die garantieren, dass das Modell mit deinem bereitgestellten JSON-Schema übereinstimmt.

Die Einstellung aktiviert den { "type": "json_object" } JSON-Modus, der garantiert, dass die vom Modell erzeugte Nachricht gültig ist.

Wichtig: Beim Einsatz des JSON-Modus müssen Sie das Modell auch anweisen, selbst JSON über eine System- oder Benutzernachricht zu erzeugen. Ohne dies kann das Modell einen endlosen Strom von Leerraum erzeugen, bis die Erzeugung das Token-Limit erreicht, was zu einer langanhaltenden und scheinbar "festgefahrenen" Anfrage führt. Beachten Sie auch, dass der Nachrichteninhalt teilweise abgeschnitten werden kann, wenn finish_reason="length", was darauf hinweist, dass die Generation überschritten max_tokens wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.
No
seed Ganzzahl Diese Funktion befindet sich noch in der Beta.
Wenn angegeben, bemüht sich unser System, deterministisch zu samplingen, sodass wiederholte Anfragen mit denselben seed Parametern dasselbe Ergebnis liefern.
Determinismus ist nicht garantiert, und du solltest auf den Antwortparameter system_fingerprint zurückgreifen, um Änderungen im Backend zu überwachen.
No
Stopp Saite oder Array Bis zu 4 Sequenzen, bei denen die API aufhört, weitere Token zu generieren.
No
store Boolescher Wert Ob das Ergebnis dieser Chat-Abschlussanfrage für die Verwendung in unseren Modelldestillations- oder Bewertungsprodukten gespeichert werden soll oder nicht. No
stream Boolescher Wert Wenn gesetzt, werden partielle Nachrichtendeltas gesendet, wie in ChatGPT. Token werden als rein datenbasierte, servergesendete Ereignisse gesendet, sobald sie verfügbar sind, wobei der Strom durch eine data: [DONE] Nachricht beendet wird. Beispiel Python Code.
No Falsch
stream_options chatCompletionStreamOptions Optionen für Streaming-Antworten. Setzen Sie dies nur, wenn Sie stream: truesetzen.
No Nichts
Temperatur number Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen.

Wir empfehlen im Allgemeinen, dies zu ändern oder top_p , aber nicht beides.
No 1
tool_choice chatCompletionToolChoiceOption Kontrolliert, welches (falls vorhandenes) Werkzeug vom Modell aufgerufen wird. none Das bedeutet, dass das Modell kein Tool aufruft, sondern stattdessen eine Nachricht generiert. auto das bedeutet, dass das Modell zwischen der Generierung einer Nachricht oder dem Aufrufen eines oder mehrerer Werkzeuge wählen kann. required das bedeutet, dass das Modell ein oder mehrere Werkzeuge aufrufen muss. Die Angabe eines bestimmten Werkzeugs über {"type": "function", "function": {"name": "my_function"}} zwingt das Modell, dieses Werkzeug aufzurufen. none ist der Standard, wenn keine Werkzeuge vorhanden sind. auto ist der Standard, wenn Werkzeuge vorhanden sind. No
tools array Eine Liste der Werkzeuge, die das Modell aufrufen kann. Derzeit werden nur Funktionen als Werkzeug unterstützt. Nutzen Sie dies, um eine Liste von Funktionen bereitzustellen, für die das Modell JSON-Eingaben generieren kann. Maximal 128 Funktionen werden unterstützt.
No
top_logprobs Ganzzahl Eine ganze Zahl zwischen 0 und 20, die die Anzahl der wahrscheinlichsten Token angibt, die an jeder Tokenposition zurückgegeben werden sollen, jeweils mit einer zugehörigen Log-Wahrscheinlichkeit. logprobs muss auf true gesetzt werden, wenn dieser Parameter verwendet wird. No
top_p number Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden.

Wir empfehlen im Allgemeinen, dies zu ändern oder temperature , aber nicht beides.
No 1
user string Eine eindeutige Kennung, die Ihren Endnutzer repräsentiert und dabei helfen kann, Missbrauch zu überwachen und zu erkennen.
No
user_security_context userSecurityContext Der Benutzersicherheitskontext enthält mehrere Parameter, die die KI-Anwendung selbst und den Endnutzer beschreiben, der mit der KI-Anwendung interagiert. Diese Bereiche unterstützen Ihre Sicherheitsteams dabei, Sicherheitsvorfälle zu untersuchen und zu mindern, indem sie einen umfassenden Ansatz zum Schutz Ihrer KI-Anwendungen bieten. Erfahren Sie mehr zum Schutz von KI-Anwendungen mit Microsoft Defender for Cloud. No

userSecurityContext

Der Benutzersicherheitskontext enthält mehrere Parameter, die die KI-Anwendung selbst und den Endnutzer beschreiben, der mit der KI-Anwendung interagiert. Diese Bereiche unterstützen Ihre Sicherheitsteams dabei, Sicherheitsvorfälle zu untersuchen und zu mindern, indem sie einen umfassenden Ansatz zum Schutz Ihrer KI-Anwendungen bieten. Erfahren Sie mehr zum Schutz von KI-Anwendungen mit Microsoft Defender for Cloud.

Name Typ Beschreibung Erforderlich Vorgabe
application_name string Der Name der Anwendung. Sensible personenbezogene Daten sollten in diesem Bereich nicht enthalten sein. No
end_user_id string Diese Kennung ist die Microsoft Entra ID (früher Azure Active Directory) Benutzerobjekt-ID, die zur Authentifizierung von Endbenutzern innerhalb der generativen KI-Anwendung verwendet wird. Sensible personenbezogene Daten sollten in diesem Bereich nicht enthalten sein. No
end_user_tenant_id string Die Microsoft 365-Tenant-ID, zu der der Endnutzer gehört. Es ist erforderlich, wenn die generative KI-Anwendung Multitenant ist. No
source_ip string Erfasst die IP-Adresse des ursprünglichen Clients und akzeptiert sowohl IPv4- als auch IPv6-Formate. No

chatCompletionFunctions

Name Typ Beschreibung Erforderlich Vorgabe
Beschreibung string Eine Beschreibung dessen, was die Funktion tut, verwendet vom Modell, um zu entscheiden, wann und wie die Funktion aufgerufen wird. No
Name string Der Name der aufzurufenden Funktion. Muss a-z, A-Z, 0-9 sein oder Unterstriche und Striche enthalten, mit einer maximalen Länge von 64. Ja
parameters FunctionParameters Die Parameter, die die Funktion akzeptiert, werden als JSON-Schema-Objekt beschrieben. Siehe den Leitfaden für Beispiele und die JSON-Schema-Referenz für die Dokumentation zum Format.

Das Weglassen parameters definiert eine Funktion mit einer leeren Parameterliste.
No

chatCompletionFunctionCallOption

Die Spezifizierung einer bestimmten Funktion über {"name": "my_function"} zwingt das Modell, diese Funktion aufzurufen.

Name Typ Beschreibung Erforderlich Vorgabe
Name string Der Name der Funktion, die aufgerufen werden soll. Ja

chatCompletionFunctionParameters

Die Parameter, die die Funktion akzeptiert, werden als JSON-Schema-Objekt beschrieben. Siehe die Anleitung/ Beispiele und die JSON-Schema-Referenz für die Dokumentation zum Format.

Für diese Komponente sind keine Eigenschaften definiert.

chatCompletionRequestMessage

Diese Komponente kann eine der folgenden sein:

ChatCompletionRequestDeveloperMessage

Vom Entwickler bereitgestellte Anweisungen, denen das Modell folgen sollte, unabhängig davon, welche Nachrichten der Nutzer gesendet hat. Bei O1-Modellen und neueren developer ersetzen Nachrichten die vorherigen system Nachrichten.

Name Typ Beschreibung Erforderlich Vorgabe
Inhalt Saite oder Array Der Inhalt der Entwicklernachricht. Ja
Name string Ein optionaler Name für den Teilnehmer. Liefert die Modellinformationen, um Teilnehmer derselben Rolle zu unterscheiden. No
Rolle enum Die Rolle des Verfassers der Nachrichten, in diesem Fall developer.
Mögliche Werte: developer
Ja

chatCompletionRequestSystemMessage

Name Typ Beschreibung Erforderlich Vorgabe
Inhalt Saite oder Array Der Inhalt der Systemnachricht. Ja
Name string Ein optionaler Name für den Teilnehmer. Liefert die Modellinformationen, um Teilnehmer derselben Rolle zu unterscheiden. No
Rolle enum Die Rolle des Verfassers der Nachrichten, in diesem Fall system.
Mögliche Werte: system
Ja

chatCompletionRequestUserMessage

Name Typ Beschreibung Erforderlich Vorgabe
Inhalt Saite oder Array Der Inhalt der Benutzernachricht.
Ja
Name string Ein optionaler Name für den Teilnehmer. Liefert die Modellinformationen, um Teilnehmer derselben Rolle zu unterscheiden. No
Rolle enum Die Rolle des Verfassers der Nachrichten, in diesem Fall user.
Mögliche Werte: user
Ja

chatCompletionRequestAssistantMessage

Name Typ Beschreibung Erforderlich Vorgabe
Inhalt Saite oder Array Der Inhalt der Assistentennachricht. Erforderlich, sofern tool_calls nicht angegeben oder function_call angegeben ist.
No
function_call Objekt Abgeschafft und durch tool_calls. Der Name und die Argumente einer Funktion, die aufgerufen werden sollte, wie sie vom Modell erzeugt werden. No
└- Argumente string Die Argumente, mit denen die Funktion aufgerufen werden können, wie sie vom Modell im JSON-Format erzeugt werden. Beachte, dass das Modell nicht immer gültiges JSON erzeugt und Parameter halluzinieren kann, die nicht durch dein Funktionsschema definiert sind. Validiere die Argumente in deinem Code, bevor du deine Funktion aufrufst. No
└– Name string Der Name der Funktion, die aufgerufen werden soll. No
Name string Ein optionaler Name für den Teilnehmer. Liefert die Modellinformationen, um Teilnehmer derselben Rolle zu unterscheiden. No
Weigerung string Die Ablehnungsnachricht der Assistentin. No
Rolle enum Die Rolle des Verfassers der Nachrichten, in diesem Fall assistant.
Mögliche Werte: assistant
Ja
tool_calls chatCompletionMessageToolCalls Die vom Modell generierten Werkzeugaufrufe, wie zum Beispiel Funktionsaufrufe. No

chatCompletionRequestToolMessage

Name Typ Beschreibung Erforderlich Vorgabe
Inhalt Saite oder Array Der Inhalt der Werkzeugnachricht. Ja
Rolle enum Die Rolle des Verfassers der Nachrichten, in diesem Fall tool.
Mögliche Werte: tool
Ja
tool_call_id string Tool-Anruf, auf den diese Nachricht reagiert. Ja

chatCompletionRequestFunctionMessage

Name Typ Beschreibung Erforderlich Vorgabe
Inhalt string Der Inhalt der Funktionsnachricht. Ja
Name string Der Name der Funktion, die aufgerufen werden soll. Ja
Rolle enum Die Rolle des Verfassers der Nachrichten, in diesem Fall function.
Mögliche Werte: function
Ja

chatCompletionRequestDeveloperMessageContentPart

Diese Komponente kann eine der folgenden sein:

chatCompletionRequestSystemMessageContentPart

Diese Komponente kann eine der folgenden sein:

ChatabschlussanfrageBenutzernachrichtInhaltTeil

Diese Komponente kann eine der folgenden sein:

chatCompletionRequestAssistantMessageContentPart

Diese Komponente kann eine der folgenden sein:

chatCompletionRequestToolMessageContentPart

Diese Komponente kann eine der folgenden sein:

ChatVervollständigungsAnfrageNachrichtenInhaltTeilText

Name Typ Beschreibung Erforderlich Vorgabe
Text string Der Textinhalt. Ja
type enum Die Art des Inhalts.
Mögliche Werte: text
Ja

chatCompletionRequestMessageContentPartAudio

Name Typ Beschreibung Erforderlich Vorgabe
input_audio Objekt Ja
└– Daten string Base64-kodierte Audiodaten. No
└─ Format enum Das Format der codierten Audiodaten. Derzeit unterstützt es "wav" und "mp3".

Mögliche Werte: wav, mp3
No
type enum Die Art des Inhalts. Immer input_audio.
Mögliche Werte: input_audio
Ja

chatCompletionRequestMessageContentPartImage

Name Typ Beschreibung Erforderlich Vorgabe
image_url Objekt Ja
└– Detail enum Spezifiziert den Detailgrad des Bildes. Erfahren Sie mehr im Vision-Leitfaden.
Mögliche Werte: auto, low, high
No
└– URL string Entweder eine URL des Bildes oder die von base64 codierten Bilddaten. No
type enum Die Art des Inhalts.
Mögliche Werte: image_url
Ja

chatCompletionRequestMessageContentPartRefusal

Name Typ Beschreibung Erforderlich Vorgabe
Weigerung string Die vom Modell generierte Ablehnungsnachricht. Ja
type enum Die Art des Inhalts.
Mögliche Werte: refusal
Ja

Azure-Chat-Erweiterungskonfiguration

Eine Darstellung von Konfigurationsdaten für eine einzelne Azure OpenAI Chat-Erweiterung. Dies wird von einer Chat-Abschlussanfrage verwendet, die Azure OpenAI-Chaterweiterungen nutzen sollte, um das Antwortverhalten zu verbessern. Die Verwendung dieser Konfiguration ist nur mit Azure OpenAI kompatibel.

###Discriminator für azureChatExtensionConfiguration

Diese Komponente nutzt die Eigenschaft type , um zwischen verschiedenen Typen zu unterscheiden:

Typwert Schema
azure_search azureSearchChatExtensionConfiguration
azure_cosmos_db azureCosmosDBChatExtensionConfiguration
elasticsearch elasticsearchChatExtensionConfiguration
mongo_db mongoDBChatExtensionConfiguration
pinecone pineconeChatExtensionConfiguration
Name Typ Beschreibung Erforderlich Vorgabe
type azureChatExtensionType Eine Darstellung von Konfigurationsdaten für eine einzelne Azure OpenAI Chat-Erweiterung. Dies wird von einer Chat-Abschlussanfrage verwendet, die Azure OpenAI-Chaterweiterungen nutzen sollte, um das Antwortverhalten zu verbessern.
Die Verwendung dieser Konfiguration ist nur mit Azure OpenAI kompatibel.
Ja

Azure-Chat-Erweiterungs-Typ

Eine Darstellung von Konfigurationsdaten für eine einzelne Azure OpenAI Chat-Erweiterung. Dies wird von einer Chat-Abschlussanfrage verwendet, die Azure OpenAI-Chaterweiterungen nutzen sollte, um das Antwortverhalten zu verbessern. Die Verwendung dieser Konfiguration ist nur mit Azure OpenAI kompatibel.

Eigentum Wert
Beschreibung Eine Darstellung von Konfigurationsdaten für eine einzelne Azure OpenAI Chat-Erweiterung. Dies wird von einer Chat-Abschlussanfrage verwendet, die Azure OpenAI-Chaterweiterungen nutzen sollte, um das Antwortverhalten zu verbessern.
Die Verwendung dieser Konfiguration ist nur mit Azure OpenAI kompatibel.
Typ string
Werte azure_search
azure_cosmos_db
elasticsearch
mongo_db
pinecone

azureSearchChatExtensionConfiguration

Eine spezifische Darstellung konfigurierbarer Optionen für Azure Search bei Verwendung als Azure OpenAI Chat-Erweiterung.

Name Typ Beschreibung Erforderlich Vorgabe
parameters azureSearchChatErweiterungsParameter Parameter für Azure Search, wenn sie als Azure OpenAI Chat-Erweiterung verwendet werden. No
type azureChatExtensionType Eine Darstellung von Konfigurationsdaten für eine einzelne Azure OpenAI Chat-Erweiterung. Dies wird von einer Chat-Abschlussanfrage verwendet, die Azure OpenAI-Chaterweiterungen nutzen sollte, um das Antwortverhalten zu verbessern.
Die Verwendung dieser Konfiguration ist nur mit Azure OpenAI kompatibel.
Ja

azureSearchChatExtensionParameters

Parameter für Azure Search, wenn sie als Azure OpenAI Chat-Erweiterung verwendet werden.

Name Typ Beschreibung Erforderlich Vorgabe
allow_partial_result Boolescher Wert Wenn es als wahr angegeben ist, erlaubt das System die Verwendung von teilweisen Suchergebnissen, und die Anfrage schlägt ab, wenn alle Abfragen fehlschlagen. Wenn nicht angegeben oder als falsch angegeben, schlägt die Anfrage fehl, wenn eine Suchanfrage fehlschlägt. No Falsch
authentication onYourDataApiKeyAuthenticationOptions oder onYourDataSystemAssignedManagedIdentityAuthenticationOptions oder onYourDataUserAssignedManagedIdentityAuthenticationOptions oder onYourDataAccessTokenAuthenticationOptions Ja
Einbettungsabhängigkeit onYourDataEndpointVectorizationSource oder onYourDataDeploymentNameVectorizationSource oder onYourDataIntegratedVectorizationSource No
endpoint string Der absolute Endpunktpfad für die Azure Search-Ressource. Ja
Feldzuordnung Azure-Suche-Index-Feldzuordnungsoptionen Optionale Einstellungen zur Steuerung, wie Felder verarbeitet werden, wenn eine konfigurierte Azure Search-Ressource verwendet wird. No
filter string Suchfilter. No
in_scope Boolescher Wert Ob Abfragen auf die Verwendung indexierter Daten beschränkt werden sollten. No
include_contexts array Die enthaltenen Eigenschaften des Ausgabekontexts. Wenn nicht angegeben, ist citations der Standardwert und intent. No
index_name string Der Name des Indexes, der in der referenzierten Azure Search-Ressource verfügbar ist. Ja
max_search_queries Ganzzahl Die maximale Anzahl umgeschriebener Abfragen sollte für eine Benutzernachricht an den Suchanbieter gesendet werden. Wenn dies nicht angegeben ist, bestimmt das System die Anzahl der zu sendenden Anfragen. No
Abfrage_typ azureSearchQueryType Die Art der Azure Search-Abfrage, die ausgeführt werden sollte, wenn sie als Azure OpenAI-Chat-Erweiterung verwendet wird. No
semantische_Konfiguration string Die zusätzliche semantische Konfiguration für die Abfrage. No
Striktheit Ganzzahl Die konfigurierte Strenge der Suchrelevanzfilterung. Je höher die Strenge, desto höher ist die Präzision, aber das Erinnern an die Antwort. No
top_n_documents Ganzzahl Die konfigurierte Anzahl an Dokumenten, die für die konfigurierte Abfrage angezeigt werden sollen. No

Azure-Suche-Index-Feldzuordnungsoptionen

Optionale Einstellungen zur Steuerung, wie Felder verarbeitet werden, wenn eine konfigurierte Azure Search-Ressource verwendet wird.

Name Typ Beschreibung Erforderlich Vorgabe
Inhaltsfelder array Die Namen der Indexfelder, die als Inhalt behandelt werden sollten. No
content_fields_separator string Das Trennungsmuster, das Inhaltsfelder verwenden sollten. No
filepath_field string Der Name des Indexfeldes, das als Dateipfad verwendet werden soll. No
image_vector_fields array Die Namen von Feldern, die Bildvektordaten darstellen. No
Titel_Feld string Der Name des Indexfeldes, das als Titel verwendet werden soll. No
url_field string Der Name des Indexfeldes, das als URL verwendet werden soll. No
Vektorfelder array Die Namen von Feldern, die Vektordaten repräsentieren. No

Azure-Suchanfragetyp

Die Art der Azure Search-Abfrage, die ausgeführt werden sollte, wenn sie als Azure OpenAI-Chat-Erweiterung verwendet wird.

Eigentum Wert
Beschreibung Die Art der Azure Search-Abfrage, die ausgeführt werden sollte, wenn sie als Azure OpenAI-Chat-Erweiterung verwendet wird.
Typ string
Werte simple
semantic
vector
vector_simple_hybrid
vector_semantic_hybrid

Azure Cosmos DB Chat Erweiterung Konfiguration

Eine spezifische Darstellung konfigurierbarer Optionen für Azure Cosmos DB, wenn es als Azure OpenAI Chat-Erweiterung verwendet wird.

Name Typ Beschreibung Erforderlich Vorgabe
parameters azureCosmosDBChatExtensionParameters Parameter, die bei der Konfiguration von Azure OpenAI On Your Data Chat-Erweiterungen verwendet werden sollten, wenn man Azure Cosmos DB für MongoDB vCore verwendet. No
type azureChatExtensionType Eine Darstellung von Konfigurationsdaten für eine einzelne Azure OpenAI Chat-Erweiterung. Dies wird von einer Chat-Abschlussanfrage verwendet, die Azure OpenAI-Chaterweiterungen nutzen sollte, um das Antwortverhalten zu verbessern.
Die Verwendung dieser Konfiguration ist nur mit Azure OpenAI kompatibel.
Ja

azureCosmosDBChatExtensionParameters

Parameter, die bei der Konfiguration von Azure OpenAI On Your Data Chat-Erweiterungen verwendet werden sollten, wenn man Azure Cosmos DB für MongoDB vCore verwendet.

Name Typ Beschreibung Erforderlich Vorgabe
allow_partial_result Boolescher Wert Wenn es als wahr angegeben ist, erlaubt das System die Verwendung von teilweisen Suchergebnissen, und die Anfrage schlägt ab, wenn alle Abfragen fehlschlagen. Wenn nicht angegeben oder als falsch angegeben, schlägt die Anfrage fehl, wenn eine Suchanfrage fehlschlägt. No Falsch
authentication onYourDataConnectionStringAuthenticationOptions Die Authentifizierungsoptionen für Azure OpenAI On Your Data bei Verwendung einer Verbindungszeichenfolge. Ja
container_name string Der Name des Azure Cosmos DB Resource Containers. Ja
Datenbankname string Der Name der MongoDB vCore-Datenbank zur Verwendung mit Azure Cosmos DB. Ja
Einbettungsabhängigkeit onYourDataEndpointVectorizationSource oder onYourDataDeploymentNameVectorizationSource Ja
Feldzuordnung azureCosmosDBFieldMappingOptions Optionale Einstellungen zur Steuerung, wie Felder verarbeitet werden, wenn eine konfigurierte Azure Cosmos DB-Ressource verwendet wird. Ja
in_scope Boolescher Wert Ob Abfragen auf die Verwendung indexierter Daten beschränkt werden sollten. No
include_contexts array Die enthaltenen Eigenschaften des Ausgabekontexts. Wenn nicht angegeben, ist citations der Standardwert und intent. No
index_name string Der MongoDB vCore-Indexname zur Verwendung mit Azure Cosmos DB. Ja
max_search_queries Ganzzahl Die maximale Anzahl umgeschriebener Abfragen sollte für eine Benutzernachricht an den Suchanbieter gesendet werden. Wenn dies nicht angegeben ist, bestimmt das System die Anzahl der zu sendenden Anfragen. No
Striktheit Ganzzahl Die konfigurierte Strenge der Suchrelevanzfilterung. Je höher die Strenge, desto höher ist die Präzision, aber das Erinnern an die Antwort. No
top_n_documents Ganzzahl Die konfigurierte Anzahl an Dokumenten, die für die konfigurierte Abfrage angezeigt werden sollen. No

Azure-Cosmos-DB-Feldzuordnungsoptionen

Optionale Einstellungen zur Steuerung, wie Felder verarbeitet werden, wenn eine konfigurierte Azure Cosmos DB-Ressource verwendet wird.

Name Typ Beschreibung Erforderlich Vorgabe
Inhaltsfelder array Die Namen der Indexfelder, die als Inhalt behandelt werden sollten. Ja
content_fields_separator string Das Trennungsmuster, das Inhaltsfelder verwenden sollten. No
filepath_field string Der Name des Indexfeldes, das als Dateipfad verwendet werden soll. No
Titel_Feld string Der Name des Indexfeldes, das als Titel verwendet werden soll. No
url_field string Der Name des Indexfeldes, das als URL verwendet werden soll. No
Vektorfelder array Die Namen von Feldern, die Vektordaten repräsentieren. Ja

elasticsearchChatExtensionConfiguration

Eine spezifische Darstellung konfigurierbarer Optionen für Elasticsearch, wenn es als Azure OpenAI-Chat-Erweiterung verwendet wird.

Name Typ Beschreibung Erforderlich Vorgabe
parameters elasticsearchChatExtensionParameters Parameter, die bei der Konfiguration von Elasticsearch® als Azure OpenAI Chat-Erweiterung verwendet werden sollten. No
type azureChatExtensionType Eine Darstellung von Konfigurationsdaten für eine einzelne Azure OpenAI Chat-Erweiterung. Dies wird von einer Chat-Abschlussanfrage verwendet, die Azure OpenAI-Chaterweiterungen nutzen sollte, um das Antwortverhalten zu verbessern.
Die Verwendung dieser Konfiguration ist nur mit Azure OpenAI kompatibel.
Ja

elasticsearchChatExtensionParameters

Parameter, die bei der Konfiguration von Elasticsearch® als Azure OpenAI Chat-Erweiterung verwendet werden sollten.

Name Typ Beschreibung Erforderlich Vorgabe
allow_partial_result Boolescher Wert Wenn es als wahr angegeben ist, erlaubt das System die Verwendung von teilweisen Suchergebnissen, und die Anfrage schlägt ab, wenn alle Abfragen fehlschlagen. Wenn nicht angegeben oder als falsch angegeben, schlägt die Anfrage fehl, wenn eine Suchanfrage fehlschlägt. No Falsch
authentication onYourDataKeyUndKeyIdAuthenticationOptions oder onYourDataEncodedApiKeyAuthenticationOptions Ja
Einbettungsabhängigkeit onYourDataEndpointVectorizationSource oder onYourDataDeploymentNameVectorizationSource oder onYourDataModelIdVectorizationSource No
endpoint string Der Endpunkt von Elasticsearch.® Ja
Feldzuordnung elasticsearchIndexFieldMappingOptions Optionale Einstellungen zur Steuerung, wie Felder verarbeitet werden, wenn eine konfigurierte Elasticsearch-Ressource® verwendet wird. No
in_scope Boolescher Wert Ob Abfragen auf die Verwendung indexierter Daten beschränkt werden sollten. No
include_contexts array Die enthaltenen Eigenschaften des Ausgabekontexts. Wenn nicht angegeben, ist citations der Standardwert und intent. No
index_name string Der Indexname von Elasticsearch.® Ja
max_search_queries Ganzzahl Die maximale Anzahl umgeschriebener Abfragen sollte für eine Benutzernachricht an den Suchanbieter gesendet werden. Wenn dies nicht angegeben ist, bestimmt das System die Anzahl der zu sendenden Anfragen. No
Abfrage_typ elasticsearchQueryType Die Art der Elasticsearch-Abrufanfrage®, die ausgeführt werden sollte, wenn sie als Azure OpenAI-Chaterweiterung verwendet wird. No
Striktheit Ganzzahl Die konfigurierte Strenge der Suchrelevanzfilterung. Je höher die Strenge, desto höher ist die Präzision, aber das Erinnern an die Antwort. No
top_n_documents Ganzzahl Die konfigurierte Anzahl an Dokumenten, die für die konfigurierte Abfrage angezeigt werden sollen. No

elasticsearchIndexFieldMappingOptions

Optionale Einstellungen zur Steuerung, wie Felder verarbeitet werden, wenn eine konfigurierte Elasticsearch-Ressource® verwendet wird.

Name Typ Beschreibung Erforderlich Vorgabe
Inhaltsfelder array Die Namen der Indexfelder, die als Inhalt behandelt werden sollten. No
content_fields_separator string Das Trennungsmuster, das Inhaltsfelder verwenden sollten. No
filepath_field string Der Name des Indexfeldes, das als Dateipfad verwendet werden soll. No
Titel_Feld string Der Name des Indexfeldes, das als Titel verwendet werden soll. No
url_field string Der Name des Indexfeldes, das als URL verwendet werden soll. No
Vektorfelder array Die Namen von Feldern, die Vektordaten repräsentieren. No

elasticsearchQueryType

Die Art der Elasticsearch-Abrufanfrage®, die ausgeführt werden sollte, wenn sie als Azure OpenAI-Chaterweiterung verwendet wird.

Eigentum Wert
Beschreibung Die Art der Elasticsearch-Abrufanfrage®, die ausgeführt werden sollte, wenn sie als Azure OpenAI-Chaterweiterung verwendet wird.
Typ string
Werte simple
vector

mongoDBChatExtensionConfiguration

Eine spezifische Darstellung konfigurierbarer Optionen für Mongo DB, wenn es als Azure OpenAI Chat-Erweiterung verwendet wird.

Name Typ Beschreibung Erforderlich Vorgabe
parameters mongoDBChatExtensionParameters Parameter, die bei der Konfiguration von Azure OpenAI On Your Data Chat-Erweiterungen bei der Verwendung von Mongo DB verwendet werden sollten. No
type azureChatExtensionType Eine Darstellung von Konfigurationsdaten für eine einzelne Azure OpenAI Chat-Erweiterung. Dies wird von einer Chat-Abschlussanfrage verwendet, die Azure OpenAI-Chaterweiterungen nutzen sollte, um das Antwortverhalten zu verbessern.
Die Verwendung dieser Konfiguration ist nur mit Azure OpenAI kompatibel.
Ja

mongoDBChatExtensionParameters

Parameter, die bei der Konfiguration von Azure OpenAI On Your Data Chat-Erweiterungen bei der Verwendung von Mongo DB verwendet werden sollten.

Name Typ Beschreibung Erforderlich Vorgabe
allow_partial_result Boolescher Wert Wenn es als wahr angegeben ist, erlaubt das System die Verwendung von teilweisen Suchergebnissen, und die Anfrage schlägt ab, wenn alle Abfragen fehlschlagen. Wenn nicht angegeben oder als falsch angegeben, schlägt die Anfrage fehl, wenn eine Suchanfrage fehlschlägt. No Falsch
app_name string Der Name der Mongo DB-Anwendung. Ja
authentication onYourDataUsernameAndPasswordAuthenticationOptions Die Authentifizierungsoptionen für Azure OpenAI On Your Data, wenn man einen Benutzernamen und ein Passwort verwendet. Ja
collection_name string Der Name der Mongo DB-Sammlung. Ja
Datenbankname string Der Name der Mongo DB-Datenbank. Ja
Einbettungsabhängigkeit onYourDataEndpointVectorizationSource oder onYourDataDeploymentNameVectorizationSource Ja
endpoint string Der Name des Mongo-DB-Cluster-Endpunkts. Ja
Feldzuordnung mongoDBFieldMappingOptions Optionale Einstellungen zur Steuerung, wie Felder verarbeitet werden, wenn eine konfigurierte Mongo-Datenbank-Ressource verwendet wird. Ja
in_scope Boolescher Wert Ob Abfragen auf die Verwendung indexierter Daten beschränkt werden sollten. No
include_contexts array Die enthaltenen Eigenschaften des Ausgabekontexts. Wenn nicht angegeben, ist citations der Standardwert und intent. No
index_name string Der Name des Mongo DB-Indexes. Ja
max_search_queries Ganzzahl Die maximale Anzahl umgeschriebener Abfragen sollte für eine Benutzernachricht an den Suchanbieter gesendet werden. Wenn dies nicht angegeben ist, bestimmt das System die Anzahl der zu sendenden Anfragen. No
Striktheit Ganzzahl Die konfigurierte Strenge der Suchrelevanzfilterung. Je höher die Strenge, desto höher ist die Präzision, aber das Erinnern an die Antwort. No
top_n_documents Ganzzahl Die konfigurierte Anzahl an Dokumenten, die für die konfigurierte Abfrage angezeigt werden sollen. No

mongoDBFieldMappingOptions

Optionale Einstellungen zur Steuerung, wie Felder verarbeitet werden, wenn eine konfigurierte Mongo-Datenbank-Ressource verwendet wird.

Name Typ Beschreibung Erforderlich Vorgabe
Inhaltsfelder array Die Namen der Indexfelder, die als Inhalt behandelt werden sollten. Ja
content_fields_separator string Das Trennungsmuster, das Inhaltsfelder verwenden sollten. No
filepath_field string Der Name des Indexfeldes, das als Dateipfad verwendet werden soll. No
Titel_Feld string Der Name des Indexfeldes, das als Titel verwendet werden soll. No
url_field string Der Name des Indexfeldes, das als URL verwendet werden soll. No
Vektorfelder array Die Namen von Feldern, die Vektordaten repräsentieren. Ja

pineconeChatExtensionConfiguration

Eine spezifische Darstellung konfigurierbarer Optionen für Pinecone, wenn es als Azure OpenAI Chat-Erweiterung verwendet wird.

Name Typ Beschreibung Erforderlich Vorgabe
parameters pineconeChatExtensionParameters Parameter zur Konfiguration von Azure OpenAI Pinecone Chat-Erweiterungen. No
type azureChatExtensionType Eine Darstellung von Konfigurationsdaten für eine einzelne Azure OpenAI Chat-Erweiterung. Dies wird von einer Chat-Abschlussanfrage verwendet, die Azure OpenAI-Chaterweiterungen nutzen sollte, um das Antwortverhalten zu verbessern.
Die Verwendung dieser Konfiguration ist nur mit Azure OpenAI kompatibel.
Ja

pineconeChatExtensionParameters

Parameter zur Konfiguration von Azure OpenAI Pinecone Chat-Erweiterungen.

Name Typ Beschreibung Erforderlich Vorgabe
allow_partial_result Boolescher Wert Wenn es als wahr angegeben ist, erlaubt das System die Verwendung von teilweisen Suchergebnissen, und die Anfrage schlägt ab, wenn alle Abfragen fehlschlagen. Wenn nicht angegeben oder als falsch angegeben, schlägt die Anfrage fehl, wenn eine Suchanfrage fehlschlägt. No Falsch
authentication onYourDataApiKeyAuthenticationOptions Die Authentifizierungsoptionen für Azure OpenAI auf Ihren Daten bei Verwendung eines API-Schlüssels. Ja
Einbettungsabhängigkeit onYourDataDeploymentNameVectorizationSource Die Details einer Vektorisierungsquelle, die von Azure OpenAI On Your Data bei der Anwendung der Vektorsuche verwendet wird, die auf einem internen Embeddings-Modell-Deployment-Namen in derselben Azure OpenAI-Ressource basiert. Ja
environment string Der Umweltname Pinecone. Ja
Feldzuordnung pineconeFieldMappingOptions Optionale Einstellungen, um zu steuern, wie Felder bei Verwendung einer konfigurierten Pinecone-Ressource verarbeitet werden. Ja
in_scope Boolescher Wert Ob Abfragen auf die Verwendung indexierter Daten beschränkt werden sollten. No
include_contexts array Die enthaltenen Eigenschaften des Ausgabekontexts. Wenn nicht angegeben, ist citations der Standardwert und intent. No
index_name string Der Name des Pinecone-Datenbankindexes. Ja
max_search_queries Ganzzahl Die maximale Anzahl umgeschriebener Abfragen sollte für eine Benutzernachricht an den Suchanbieter gesendet werden. Wenn dies nicht angegeben ist, bestimmt das System die Anzahl der zu sendenden Anfragen. No
Striktheit Ganzzahl Die konfigurierte Strenge der Suchrelevanzfilterung. Je höher die Strenge, desto höher ist die Präzision, aber das Erinnern an die Antwort. No
top_n_documents Ganzzahl Die konfigurierte Anzahl an Dokumenten, die für die konfigurierte Abfrage angezeigt werden sollen. No

pineconeFieldMappingOptions

Optionale Einstellungen, um zu steuern, wie Felder bei Verwendung einer konfigurierten Pinecone-Ressource verarbeitet werden.

Name Typ Beschreibung Erforderlich Vorgabe
Inhaltsfelder array Die Namen der Indexfelder, die als Inhalt behandelt werden sollten. Ja
content_fields_separator string Das Trennungsmuster, das Inhaltsfelder verwenden sollten. No
filepath_field string Der Name des Indexfeldes, das als Dateipfad verwendet werden soll. No
Titel_Feld string Der Name des Indexfeldes, das als Titel verwendet werden soll. No
url_field string Der Name des Indexfeldes, das als URL verwendet werden soll. No

onYourDataAuthenticationOptions

Die Authentifizierungsoptionen für Azure OpenAI On Your Data.

Discriminator für onYourDataAuthenticationOptions

Diese Komponente nutzt die Eigenschaft type , um zwischen verschiedenen Typen zu unterscheiden:

Typwert Schema
api_key onYourDataApiKeyAuthenticationOptions
connection_string onYourDataConnectionStringAuthenticationOptions
key_and_key_id onYourDataKeyAndKeyIdAuthenticationOptions
encoded_api_key onYourDataEncodedApiKeyAuthenticationOptions
access_token onYourDataAccessTokenAuthenticationOptions
system_assigned_managed_identity onYourDataSystemAssignedManagedIdentityAuthenticationOptions
user_assigned_managed_identity onYourDataUserAssignedManagedIdentityAuthenticationOptions
username_and_password onYourDataUsernameAndPasswordAuthenticationOptions
Name Typ Beschreibung Erforderlich Vorgabe
type onYourDataAuthenticationType Die Authentifizierungstypen, die mit Azure OpenAI On Your Data unterstützt werden. Ja

onYourDataContextProperty

Die Kontexteigenschaft.

Eigentum Wert
Beschreibung Die Kontexteigenschaft.
Typ string
Werte citations
intent
all_retrieved_documents

onYourDataAuthenticationType

Die Authentifizierungstypen, die mit Azure OpenAI On Your Data unterstützt werden.

Eigentum Wert
Beschreibung Die Authentifizierungstypen, die mit Azure OpenAI On Your Data unterstützt werden.
Typ string
Werte api_key
connection_string
key_and_key_id
encoded_api_key
access_token
system_assigned_managed_identity
user_assigned_managed_identity
username_and_password

onYourDataApiKeyAuthenticationOptions

Die Authentifizierungsoptionen für Azure OpenAI auf Ihren Daten bei Verwendung eines API-Schlüssels.

Name Typ Beschreibung Erforderlich Vorgabe
Schlüssel string Der API-Schlüssel zur Authentifizierung. No
type onYourDataAuthenticationType Die Authentifizierungstypen, die mit Azure OpenAI On Your Data unterstützt werden. Ja

onYourDataConnectionStringAuthentifizierungsoptionen

Die Authentifizierungsoptionen für Azure OpenAI On Your Data bei Verwendung einer Verbindungszeichenfolge.

Name Typ Beschreibung Erforderlich Vorgabe
connection_string string Die Verbindungszeichenfolge zur Authentifizierung. No
type onYourDataAuthenticationType Die Authentifizierungstypen, die mit Azure OpenAI On Your Data unterstützt werden. Ja

onYourDataKeyAndKeyIdAuthenticationOptions

Die Authentifizierungsoptionen für Azure OpenAI On Your Data bei Verwendung eines Elasticsearch-Schlüssel- und Schlüssel-ID-Paares.

Name Typ Beschreibung Erforderlich Vorgabe
Schlüssel string Der Elasticsearch-Schlüssel für die Authentifizierung. No
key_id string Die Elasticsearch-Schlüssel-ID zur Verwendung zur Authentifizierung. No
type onYourDataAuthenticationType Die Authentifizierungstypen, die mit Azure OpenAI On Your Data unterstützt werden. Ja

onYourDataEncodedApiKeyAuthenticationOptions

Die Authentifizierungsoptionen für Azure OpenAI On Your Data bei Verwendung eines Elasticsearch-codierten API-Schlüssels.

Name Typ Beschreibung Erforderlich Vorgabe
encoded_api_key string Der Elasticsearch kodierte API-Schlüssel zur Verwendung zur Authentifizierung. No
type onYourDataAuthenticationType Die Authentifizierungstypen, die mit Azure OpenAI On Your Data unterstützt werden. Ja

onYourDataAccessTokenAuthenticationOptions

Die Authentifizierungsoptionen für Azure OpenAI On Your Data bei Verwendung des Zugriffstokens.

Name Typ Beschreibung Erforderlich Vorgabe
access_token string Der Zugangstoken zur Authentifizierung. No
type onYourDataAuthenticationType Die Authentifizierungstypen, die mit Azure OpenAI On Your Data unterstützt werden. Ja

onYourDataSystemAssignedManagedIdentityAuthenticationOptions

Die Authentifizierungsoptionen für Azure OpenAI On Your Data bei Verwendung einer systemzugeordneten verwalteten Identität.

Name Typ Beschreibung Erforderlich Vorgabe
type onYourDataAuthenticationType Die Authentifizierungstypen, die mit Azure OpenAI On Your Data unterstützt werden. Ja

onYourDataUserAssignedManagedIdentityAuthenticationOptions

Die Authentifizierungsoptionen für Azure OpenAI On Your Data bei Verwendung einer benutzerdefinierten verwalteten Identität.

Name Typ Beschreibung Erforderlich Vorgabe
managed_identity_resource_id string Die Ressourcen-ID der vom Benutzer zugewiesenen verwalteten Identität zur Verwendung zur Authentifizierung. No
type onYourDataAuthenticationType Die Authentifizierungstypen, die mit Azure OpenAI On Your Data unterstützt werden. Ja

onYourDataUsernameAndPasswordAuthenticationOptions

Die Authentifizierungsoptionen für Azure OpenAI On Your Data, wenn man einen Benutzernamen und ein Passwort verwendet.

Name Typ Beschreibung Erforderlich Vorgabe
Passwort string Das Kennwort. zur Authentifizierung. No
type onYourDataAuthenticationType Die Authentifizierungstypen, die mit Azure OpenAI On Your Data unterstützt werden. Ja
username string Der Benutzername für die Authentifizierung. No

onYourDataVectorizationSource

Eine abstrakte Darstellung einer Vektorisierungsquelle für Azure OpenAI On Your Data mit Vektorsuche.

Diese Komponente nutzt die Eigenschaft type , um zwischen verschiedenen Typen zu unterscheiden:

Typwert Schema
endpoint onYourDataEndpointVectorizationSource
deployment_name onYourDataDeploymentNameVectorizationSource
integrated onYourDataIntegratedVectorizationSource
model_id onYourDataModelIdVectorizationSource
Name Typ Beschreibung Erforderlich Vorgabe
type onYourDataVectorizationSourceType Repräsentiert die verfügbaren Quellen, die Azure OpenAI On Your Data verwenden kann, um die Vektorisierung von Daten für die Vektorsuche zu konfigurieren. Ja

onYourDataVectorizationSourceType

Repräsentiert die verfügbaren Quellen, die Azure OpenAI On Your Data verwenden kann, um die Vektorisierung von Daten für die Vektorsuche zu konfigurieren.

Eigentum Wert
Beschreibung Repräsentiert die verfügbaren Quellen, die Azure OpenAI On Your Data verwenden kann, um die Vektorisierung von Daten für die Vektorsuche zu konfigurieren.
Typ string
Werte endpoint
deployment_name
integrated
model_id

onYourDataEndpointVectorizationSource

Die Details einer Vektorisierungsquelle, die von Azure OpenAI On Your Data bei der Anwendung der Vektorsuche verwendet wird und auf einem öffentlichen Azure OpenAI-Endpunktaufruf für Embeddings basiert.

Name Typ Beschreibung Erforderlich Vorgabe
authentication onYourDataApiKeyAuthenticationOptions oder onYourDataAccessTokenAuthenticationOptions No
Abmessungen Ganzzahl Die Anzahl der Dimensionen, die die Einbettungen haben sollten. Nur in text-embedding-3 und neueren Modellen unterstützt. No
endpoint string Spezifiziert die URL des Ressourcenendpunkts, von der Einbettungen abgerufen werden sollen. Es sollte im Format von https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings. Der API-Version Query-Parameter ist nicht erlaubt. No
type onYourDataVectorizationSourceType Repräsentiert die verfügbaren Quellen, die Azure OpenAI On Your Data verwenden kann, um die Vektorisierung von Daten für die Vektorsuche zu konfigurieren. Ja

onYourDataDeploymentNameVectorizationSource

Die Details einer Vektorisierungsquelle, die von Azure OpenAI On Your Data bei der Anwendung der Vektorsuche verwendet wird und auf einem internen Embeddings-Modell-Deploymentsnamen in derselben Azure OpenAI-Ressource basiert.

Name Typ Beschreibung Erforderlich Vorgabe
deployment_name string Spezifiziert den Namen der Modellbereitstellung, die für die Vektorisierung verwendet werden soll. Diese Modellbereitstellung muss in derselben Azure OpenAI-Ressource erfolgen, aber On Your Data verwendet diese Modellbereitstellung über einen internen Aufruf statt eines öffentlichen Aufrufs, was Vektorsuche auch in privaten Netzwerken ermöglicht. No
Abmessungen Ganzzahl Die Anzahl der Dimensionen, die die Einbettungen haben sollten. Nur in text-embedding-3 und neueren Modellen unterstützt. No
type onYourDataVectorizationSourceType Repräsentiert die verfügbaren Quellen, die Azure OpenAI On Your Data verwenden kann, um die Vektorisierung von Daten für die Vektorsuche zu konfigurieren. Ja

onYourDataIntegratedVectorizationSource

Repräsentiert den integrierten Vektorizer, der innerhalb der Suchressource definiert ist.

Name Typ Beschreibung Erforderlich Vorgabe
type onYourDataVectorizationSourceType Repräsentiert die verfügbaren Quellen, die Azure OpenAI On Your Data verwenden kann, um die Vektorisierung von Daten für die Vektorsuche zu konfigurieren. Ja

onYourDataModelIdVectorizationSource

Die Details einer Vektorisierungsquelle, die von Azure OpenAI On Your Data bei der Anwendung der Vektorsuche verwendet wird, die auf der Modell-ID eines Suchdienstes basiert. Derzeit nur von Elasticsearch® unterstützt.

Name Typ Beschreibung Erforderlich Vorgabe
model_id string Spezifiziert die Modell-ID für die Vektorisierung. Diese Modell-ID muss im Suchdienst definiert werden. No
type onYourDataVectorizationSourceType Repräsentiert die verfügbaren Quellen, die Azure OpenAI On Your Data verwenden kann, um die Vektorisierung von Daten für die Vektorsuche zu konfigurieren. Ja

Azure-Chat-ErweiterungenNachrichtKontext

Eine Darstellung der zusätzlichen Kontextinformationen, die verfügbar sind, wenn Azure OpenAI-Chat-Erweiterungen an der Erstellung einer entsprechenden Antwort auf Chat-Abschlüsse beteiligt sind. Diese Kontextinformationen werden nur ausgefüllt, wenn eine Azure OpenAI-Anfrage verwendet wird, die so konfiguriert ist, dass eine passende Erweiterung verwendet wird.

Name Typ Beschreibung Erforderlich Vorgabe
all_retrieved_documents array Alle gesicherten Dokumente. No
Zitationen array Das Ergebnis der Datenquellenabruf, das zur Erzeugung der Assistentennachricht in der Antwort verwendet wird. No
Absicht string Die erkannte Absicht aus dem Chatverlauf wurde verwendet, um an die nächste Runde weitergegeben zu werden, um den Kontext zu übertragen. No

Zitat

Zitationsinformationen für eine Chat-Komplettantwort-Nachricht.

Name Typ Beschreibung Erforderlich Vorgabe
chunk_id string Die Chunk-ID der Strafzettel. No
Inhalt string Der Inhalt der Zitate. Ja
Dateipfad string Der Dateipfad des Zitats. No
rerank_score number Die Rerang-Punktzahl des geborgenen Dokuments. No
title string Der Titel der Auszeichnung. No
url string Die URL des Zitats. No

retrievedDocument

Das abgerufene Dokument.

Name Typ Beschreibung Erforderlich Vorgabe
chunk_id string Die Chunk-ID der Strafzettel. No
Inhalt string Der Inhalt der Zitate. Ja
data_source_index Ganzzahl Der Index der Datenquelle. No
Dateipfad string Der Dateipfad des Zitats. No
filter_reason filterReason Der Filtergrund des abgerufenen Dokuments. No
original_search_score number Die ursprüngliche Suchwertung des abgerufenen Dokuments. No
rerank_score number Die Rerang-Punktzahl des geborgenen Dokuments. No
search_queries array Die Suchanfragen wurden verwendet, um das Dokument abzurufen. No
title string Der Titel der Auszeichnung. No
url string Die URL des Zitats. No

filterReason

Der Filtergrund des abgerufenen Dokuments.

Eigentum Wert
Beschreibung Der Filtergrund des abgerufenen Dokuments.
Typ string
Werte score
rerank

chatCompletionMessageToolCall

Name Typ Beschreibung Erforderlich Vorgabe
Funktion Objekt Die Funktion, die das Modell aufgerufen hat. Ja
└- Argumente string Die Argumente, mit denen die Funktion aufgerufen werden können, wie sie vom Modell im JSON-Format erzeugt werden. Beachte, dass das Modell nicht immer gültiges JSON erzeugt und Parameter halluzinieren kann, die nicht durch dein Funktionsschema definiert sind. Validiere die Argumente in deinem Code, bevor du deine Funktion aufrufst. No
└– Name string Der Name der Funktion, die aufgerufen werden soll. No
id string Die ID des Werkzeugrufs. Ja
type toolCallType Der Typ des Werkzeugaufrufs, in diesem Fall function. Ja

toolCallType

Der Typ des Werkzeugaufrufs, in diesem Fall function.

Eigentum Wert
Beschreibung Der Typ des Werkzeugaufrufs, in diesem Fall function.
Typ string
Werte function

chatCompletionRequestMessageTool

Name Typ Beschreibung Erforderlich Vorgabe
Inhalt string Der Inhalt der Nachricht. No
tool_call_id string Tool-Anruf, auf den diese Nachricht reagiert. No

chatCompletionRequestMessageFunction

Name Typ Beschreibung Erforderlich Vorgabe
Inhalt string Der Inhalt der Nachricht. No
Name string Der Inhalt der Nachricht. No
Rolle enum Die Rolle des Verfassers der Nachrichten, in diesem Fall function.
Mögliche Werte: function
No

createChatCompletionResponse

Repräsentiert eine vom Modell zurückgegebene Chat-Abschlussantwort, basierend auf der bereitgestellten Eingabe.

Name Typ Beschreibung Erforderlich Vorgabe
Optionen array Eine Liste von Chat-Abschlussmöglichkeiten. Kann mehr als eins sein, wenn n größer als 1 ist. Ja
erstellt Ganzzahl Der Unix-Zeitstempel (in Sekunden) von der Erstellung des Chat-Abschlusses. Ja
id string Eine eindeutige Kennung für den Abschluss des Chats. Ja
Modell string Das Modell, das für den Chat-Abschluss verwendet wird. Ja
Objekt enum Der Objekttyp, der immer chat.completionist.
Mögliche Werte: chat.completion
Ja
prompt_filter_results promptFilterResults Inhaltsfilterung führt zu null oder mehr Prompts in der Anfrage. Bei einer Streaming-Anfrage können Ergebnisse für verschiedene Prompts zu unterschiedlichen Zeiten oder in unterschiedlicher Reihenfolge eingehen. No
Systemfingerabdruck string Dieser Fingerabdruck stellt die Backend-Konfiguration dar, mit der das Modell läuft.

Kann zusammen mit dem seed Anfrageparameter verwendet werden, um zu verstehen, wann Backend-Änderungen vorgenommen wurden, die den Determinismus beeinflussen könnten.
No
Nutzung completionUsage Nutzungsstatistiken für die Abschlussanfrage. No

createChatCompletionStreamResponse

Repräsentiert einen gestreamten Chunk einer Chat-Abschlussantwort, die vom Modell auf Basis der bereitgestellten Eingabe zurückgegeben wird.

Name Typ Beschreibung Erforderlich Vorgabe
Optionen array Eine Liste von Chat-Abschlussmöglichkeiten. Kann mehr als ein Element enthalten, wenn n größer als 1 ist.
Ja
erstellt Ganzzahl Der Unix-Zeitstempel (in Sekunden) von der Erstellung des Chat-Abschlusses. Jeder Chunk hat denselben Zeitstempel. Ja
id string Eine eindeutige Kennung für den Abschluss des Chats. Jeder Chunk hat dieselbe ID. Ja
Modell string Das Modell, um die Komplettierung zu erzeugen. Ja
Objekt enum Der Objekttyp, der immer chat.completion.chunkist.
Mögliche Werte: chat.completion.chunk
Ja
Systemfingerabdruck string Dieser Fingerabdruck stellt die Backend-Konfiguration dar, mit der das Modell läuft.
Kann zusammen mit dem seed Anfrageparameter verwendet werden, um zu verstehen, wann Backend-Änderungen vorgenommen wurden, die den Determinismus beeinflussen könnten.
No

chatCompletionStreamResponseDelta

Ein Chat-Abschluss-Delta, das durch gestreamte Modellantworten erzeugt wird.

Name Typ Beschreibung Erforderlich Vorgabe
Inhalt string Der Inhalt der Chunk-Nachricht. No
function_call Objekt Abgeschafft und durch tool_calls. Der Name und die Argumente einer Funktion, die aufgerufen werden sollte, wie sie vom Modell erzeugt werden. No
└- Argumente string Die Argumente, mit denen die Funktion aufgerufen werden können, wie sie vom Modell im JSON-Format erzeugt werden. Beachte, dass das Modell nicht immer gültiges JSON erzeugt und Parameter halluzinieren kann, die nicht durch dein Funktionsschema definiert sind. Validiere die Argumente in deinem Code, bevor du deine Funktion aufrufst. No
└– Name string Der Name der Funktion, die aufgerufen werden soll. No
Weigerung string Die vom Modell generierte Ablehnungsnachricht. No
Rolle enum Die Rolle des Verfassers dieser Botschaft.
Mögliche Werte: system, user, assistant, tool
No
tool_calls array No

chatCompletionMessageToolCallChunk

Name Typ Beschreibung Erforderlich Vorgabe
Funktion Objekt No
└- Argumente string Die Argumente, mit denen die Funktion aufgerufen werden können, wie sie vom Modell im JSON-Format erzeugt werden. Beachte, dass das Modell nicht immer gültiges JSON erzeugt und Parameter halluzinieren kann, die nicht durch dein Funktionsschema definiert sind. Validiere die Argumente in deinem Code, bevor du deine Funktion aufrufst. No
└– Name string Der Name der Funktion, die aufgerufen werden soll. No
id string Die ID des Werkzeugrufs. No
index Ganzzahl Ja
type enum Die Art des Werkzeugs. Derzeit wird nur function unterstützt.
Mögliche Werte: function
No

chatCompletionStreamOptions

Optionen für Streaming-Antworten. Setzen Sie dies nur, wenn Sie stream: truesetzen.

Name Typ Beschreibung Erforderlich Vorgabe
include_usage Boolescher Wert Wenn gesetzt, wird ein zusätzlicher Chunk vor der data: [DONE] Nachricht gestreamt. Das Feld usage in diesem Chunk zeigt die Token-Nutzungsstatistiken für die gesamte Anfrage, und das choices Feld bleibt immer ein leeres Array. Alle anderen Chunks enthalten ebenfalls ein Feld usage , allerdings mit einem Nullwert.
No

chatCompletionChoiceLogProbs

Protokollieren Sie die Wahrscheinlichkeitsinformationen für die Wahl.

Name Typ Beschreibung Erforderlich Vorgabe
Inhalt array Eine Liste von Nachrichteninhaltstoken mit Log-Wahrscheinlichkeitsinformationen. Ja
Weigerung array Eine Liste von Nachrichten-Ablehnungstoken mit Log-Wahrscheinlichkeitsinformationen. No

chatCompletionTokenLogprob

Name Typ Beschreibung Erforderlich Vorgabe
Bytes array Eine Liste von ganzen Zahlen, die die UTF-8-Bytes-Darstellung des Tokens darstellen. Nützlich in Fällen, in denen Zeichen durch mehrere Token dargestellt werden und deren Byte-Darstellungen kombiniert werden müssen, um die korrekte Textrepräsentation zu erzeugen. Kann passieren null , wenn es keine Bytes-Darstellung für das Token gibt. Ja
logprob number Die Log-Wahrscheinlichkeit dieses Tokens. Ja
Token string Das Token. Ja
top_logprobs array Liste der wahrscheinlichsten Token und deren Log-Wahrscheinlichkeit an dieser Token-Position. In seltenen Fällen können weniger als die Anzahl der zurückgefragten top_logprobs Personen sein. Ja

chatCompletionResponseMessage

Eine vom Modell generierte Chat-Abschluss-Nachricht.

Name Typ Beschreibung Erforderlich Vorgabe
Audio Objekt Wenn die Audioausgabemodalität angefordert wird, enthält dieses Objekt Daten über die Audioantwort des Modells. No
└– Daten string Base64 kodierte Audiobytes, die vom Modell generiert wurden, in dem in der Anfrage angegebenen Format.
No
└– abläuft_am Ganzzahl Der Unix-Zeitstempel (in Sekunden) dafür, wann diese Audioantwort auf dem Server nicht mehr für mehrfache Rundengespräche zugänglich ist.
No
└– ID string Eindeutige Kennung für diese Audioantwort. No
└– Transkript string Transkript des vom Modell erzeugten Audios. No
Inhalt string Der Inhalt der Nachricht. Ja
context azureChatExtensionsMessageContext Eine Darstellung der zusätzlichen Kontextinformationen, die verfügbar sind, wenn Azure OpenAI-Chat-Erweiterungen an der Erstellung einer entsprechenden Antwort auf Chat-Abschlüsse beteiligt sind. Diese Kontextinformationen werden nur ausgefüllt, wenn eine Azure OpenAI-Anfrage verwendet wird, die so konfiguriert ist, dass eine passende Erweiterung verwendet wird. No
function_call chatCompletionFunctionCall Abgeschafft und durch tool_calls. Der Name und die Argumente einer Funktion, die aufgerufen werden sollte, wie sie vom Modell erzeugt werden. No
Weigerung string Die vom Modell generierte Ablehnungsnachricht. Ja
Rolle chatCompletionResponseMessageRole Die Rolle des Autors der Antwortnachricht. Ja
tool_calls array Die vom Modell generierten Werkzeugaufrufe, wie zum Beispiel Funktionsaufrufe. No

chatCompletionResponseMessageRole

Die Rolle des Autors der Antwortnachricht.

Eigentum Wert
Beschreibung Die Rolle des Autors der Antwortnachricht.
Typ string
Werte assistant

chatCompletionToolChoiceOption

Kontrolliert, welches (falls vorhandenes) Werkzeug vom Modell aufgerufen wird. none Das bedeutet, dass das Modell kein Tool aufruft, sondern stattdessen eine Nachricht generiert. auto das bedeutet, dass das Modell zwischen der Generierung einer Nachricht oder dem Aufrufen eines oder mehrerer Werkzeuge wählen kann. required das bedeutet, dass das Modell ein oder mehrere Werkzeuge aufrufen muss. Die Angabe eines bestimmten Werkzeugs über {"type": "function", "function": {"name": "my_function"}} zwingt das Modell, dieses Werkzeug aufzurufen. none ist der Standard, wenn keine Werkzeuge vorhanden sind. auto ist der Standard, wenn Werkzeuge vorhanden sind.

Diese Komponente kann eine der folgenden sein:

chatCompletionNamedToolChoice

Spezifiziert ein Werkzeug, das das Modell verwenden soll. Verwenden Sie, um das Modell zu zwingen, eine bestimmte Funktion aufzurufen.

Name Typ Beschreibung Erforderlich Vorgabe
Funktion Objekt Ja
└– Name string Der Name der Funktion, die aufgerufen werden soll. No
type enum Die Art des Werkzeugs. Derzeit wird nur function unterstützt.
Mögliche Werte: function
Ja

ParallelToolCalls

Ob man während der Werkzeugnutzung parallele Funktionsaufrufe aktivieren soll.

Für diese Komponente sind keine Eigenschaften definiert.

PredictionContent

Statisch vorhergesagte Ausgabeinhalte, wie zum Beispiel der Inhalt einer Textdatei, die regeneriert wird.

Name Typ Beschreibung Erforderlich Vorgabe
Inhalt Saite oder Array Der Inhalt, der bei der Erstellung einer Modellantwort abgestimmt werden sollte. Wenn generierte Tokens mit diesem Inhalt übereinstimmen, kann die gesamte Modellantwort viel schneller zurückgegeben werden. Ja
type enum Die Art der vorhergesagten Inhalte, die Sie bereitstellen möchten. Dieser Typ ist derzeit immer content.
Mögliche Werte: content
Ja

chatCompletionMessageToolCalls

Die vom Modell generierten Werkzeugaufrufe, wie zum Beispiel Funktionsaufrufe.

Für diese Komponente sind keine Eigenschaften definiert.

ChatCompletionModalities

Ausgabetypen, die das Modell für diese Anfrage generieren soll. Die meisten Modelle sind in der Lage, Text zu generieren, was standardmäßig ist:

["text"]

Das gpt-4o-audio-preview Modell kann auch zur Audioerzeugung verwendet werden. Um zu verlangen, dass dieses Modell sowohl Text- als auch Audioantworten erzeugt, können Sie verwenden:

["text", "audio"]

Für diese Komponente sind keine Eigenschaften definiert.

chatCompletionFunctionCall

Abgeschafft und durch tool_calls. Der Name und die Argumente einer Funktion, die aufgerufen werden sollte, wie sie vom Modell erzeugt werden.

Name Typ Beschreibung Erforderlich Vorgabe
Argumente string Die Argumente, mit denen die Funktion aufgerufen werden können, wie sie vom Modell im JSON-Format erzeugt werden. Beachte, dass das Modell nicht immer gültiges JSON erzeugt und Parameter halluzinieren kann, die nicht durch dein Funktionsschema definiert sind. Validiere die Argumente in deinem Code, bevor du deine Funktion aufrufst. Ja
Name string Der Name der Funktion, die aufgerufen werden soll. Ja

completionUsage

Nutzungsstatistiken für die Abschlussanfrage.

Name Typ Beschreibung Erforderlich Vorgabe
completion_tokens Ganzzahl Anzahl der Token in der generierten Komplettierung. Ja
completion_tokens_details Objekt Aufschlüsselung der in einer Komplettierung verwendeten Token. No
└– akzeptierte_Vorhersage_Token Ganzzahl Bei Verwendung von Predicted Outputs ist die Anzahl der Token in der Vorhersage, die in der Completion erschienen sind. No
└– audio_tokens Ganzzahl Audio-Eingangstoken, die vom Modell generiert werden. No
└– reasoning_tokens Ganzzahl Tokens, die vom Modell zur Argumentation generiert werden. No
└– rejected_prediction_tokens Ganzzahl Bei Verwendung von Predicted Outputs ist die Anzahl der Token in der Vorhersage, die in der Completion nicht erschienen sind. Wie Reasoning-Tokens werden diese Token jedoch weiterhin in die Gesamtvervollständigungstoken für Abrechnungs-, Ausgabe- und Kontextfenstergrenzen gezählt. No
prompt_tokens Ganzzahl Anzahl der Tokens im Prompt. Ja
prompt_tokens_details Objekt Details zu den Prompt-Tokens. No
└– audio_tokens Ganzzahl Audio-Eingabetoken sind im Prompt vorhanden. No
└– zwischengespeicherte_Token Ganzzahl Die Anzahl der zwischengespeicherten Prompt-Token. No
Gesamtanzahl Tokens Ganzzahl Gesamtzahl der in der Anfrage verwendeten Token (Prompt + Abschluss). Ja

chatCompletionTool

Name Typ Beschreibung Erforderlich Vorgabe
Funktion FunctionObject Ja
type enum Die Art des Werkzeugs. Derzeit wird nur function unterstützt.
Mögliche Werte: function
Ja

FunctionParameters

Die Parameter, die die Funktion akzeptiert, werden als JSON-Schema-Objekt beschrieben. Siehe den Leitfaden für Beispiele und die JSON-Schema-Referenz für die Dokumentation zum Format.

Das Weglassen parameters definiert eine Funktion mit einer leeren Parameterliste.

Für diese Komponente sind keine Eigenschaften definiert.

FunctionObject

Name Typ Beschreibung Erforderlich Vorgabe
Beschreibung string Eine Beschreibung dessen, was die Funktion tut, verwendet vom Modell, um zu entscheiden, wann und wie die Funktion aufgerufen wird. No
Name string Der Name der aufzurufenden Funktion. Muss a-z, A-Z, 0-9 sein oder Unterstriche und Striche enthalten, mit einer maximalen Länge von 64. Ja
parameters FunctionParameters Die Parameter, die die Funktion akzeptiert, werden als JSON-Schema-Objekt beschrieben. Siehe den Leitfaden für Beispiele und die JSON-Schema-Referenz für die Dokumentation zum Format.

Das Weglassen parameters definiert eine Funktion mit einer leeren Parameterliste.
No
strict Boolescher Wert Ob beim Erstellen des Funktionsaufrufs strikte Schema-Treue aktiviert werden soll. Wenn auf true gesetzt, folgt das Modell dem exakt im Feld parameters definierten Schema. Nur eine Teilmenge des JSON-Schemas wird unterstützt, wenn strict .true No Falsch

ResponseFormatText

Name Typ Beschreibung Erforderlich Vorgabe
type enum Der definierte Antwortformat: text
Mögliche Werte: text
Ja

ResponseFormatJsonObject

Name Typ Beschreibung Erforderlich Vorgabe
type enum Der definierte Antwortformat: json_object
Mögliche Werte: json_object
Ja

ResponseFormatJsonSchemaSchema

Das Schema für das Antwortformat, beschrieben als JSON-Schema-Objekt.

Für diese Komponente sind keine Eigenschaften definiert.

AntwortformatJsonSchema

Name Typ Beschreibung Erforderlich Vorgabe
JSON-Schema Objekt Ja
└– Beschreibung string Eine Beschreibung, wofür das Antwortformat dient, verwendet vom Modell zur Bestimmung der Antwort im Format. No
└– Name string Der Name des Antwortformats. Muss a-z, A-Z, 0-9 sein oder Unterstriche und Striche enthalten, mit einer maximalen Länge von 64. No
└- Schema ResponseFormatJsonSchemaSchema Das Schema für das Antwortformat, beschrieben als JSON-Schema-Objekt. No
└– streng Boolescher Wert Ob strikte Schema-Compliance bei der Erzeugung der Ausgabe aktiviert werden soll. Setzt es auf wahr, folgt das Modell immer dem exakt im Feld schema definierten Schema. Nur eine Teilmenge des JSON-Schemas wird unterstützt, wenn strict .true No Falsch
type enum Der definierte Antwortformat: json_schema
Mögliche Werte: json_schema
Ja

chatCompletionChoiceCommon

Name Typ Beschreibung Erforderlich Vorgabe
Beendigungsgrund string No
index Ganzzahl No

Übersetzungsanforderung erstellen

Übersetzungsanforderung.

Name Typ Beschreibung Erforderlich Vorgabe
Datei string Die Audiodatei zum Übersetzen. Ja
Eingabeaufforderung string Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen. Der Prompt sollte auf Englisch sein. No
Antwortformat audioResponseFormat Definiert das Format der Ausgabe. No
Temperatur number Die Probentemperatur liegt zwischen 0 und 1. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen. Wenn auf 0 gesetzt, verwendet das Modell die logaritarische Wahrscheinlichkeit, um die Temperatur automatisch zu erhöhen, bis bestimmte Schwellenwerte erreicht sind. No 0

Audio-Antwort

Übersetzungs- oder Transkriptionsantwort, wenn response_format json war

Name Typ Beschreibung Erforderlich Vorgabe
Text string Übersetzter oder transkribierter Text. Ja

audioVerboseResponse

Übersetzungs- oder Transkriptionsantwort, wenn response_format verbose_json

Name Typ Beschreibung Erforderlich Vorgabe
Dauer number Dauer. No
language string Language. No
Segmente array No
Aufgabe string Art von Audioaufgabe. No
Text string Übersetzter oder transkribierter Text. Ja
words array No

audioResponseFormat

Definiert das Format der Ausgabe.

Eigentum Wert
Beschreibung Definiert das Format der Ausgabe.
Typ string
Werte json
text
srt
verbose_json
vtt

createTranscriptionRequest

Transkriptionsanforderung.

Name Typ Beschreibung Erforderlich Vorgabe
Datei string Das Audiodatei-Objekt, das transkribiert werden soll. Ja
language string Die Sprache des eingegebenen Audios. Die Bereitstellung der Eingabesprache im ISO-639-1-Format verbessert die Genauigkeit und Latenz. No
Eingabeaufforderung string Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen. Der Prompt sollte mit der Audiosprache übereinstimmen. No
Antwortformat audioResponseFormat Definiert das Format der Ausgabe. No
Temperatur number Die Probentemperatur liegt zwischen 0 und 1. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen. Wenn auf 0 gesetzt, verwendet das Modell die logaritarische Wahrscheinlichkeit, um die Temperatur automatisch zu erhöhen, bis bestimmte Schwellenwerte erreicht sind. No 0
timestamp_granularities[] array Die Zeitstempel-Granularitäten, die für diese Transkription gefüllt werden sollen. response_format muss so eingestellt verbose_json werden, dass Zeitstempel-Granularitäten verwendet werden. Entweder oder beide dieser Optionen werden unterstützt: word, oder segment. Hinweis: Es gibt keine zusätzliche Latenz für Segmentzeitstempel, aber das Erstellen von Wortzeitstempeln verursacht zusätzliche Latenz. No ['segment']

audioSegment

Transkriptions- oder Übersetzungssegment.

Name Typ Beschreibung Erforderlich Vorgabe
avg_logprob number Durchschnittliche Log-Wahrscheinlichkeit. No
Kompressionsverhältnis number Kompressionsrate. No
end number Segmentend-Offset. No
id Ganzzahl Segmentbezeichner. No
no_speech_prob number Wahrscheinlichkeit für 'keine Rede'. No
seek number Versatz des Segments. No
start number Segmentstart-Offset. No
Temperatur number Temperatur. No
Text string Segmentierungstext. No
tokens array Symbole des Textes. No

audioWord

Transkription oder Übersetzungswort.

Name Typ Beschreibung Erforderlich Vorgabe
end number Word end-Offset. No
start number Word Start Offset. No
word string Word No

createSpeechRequest

Sprachanforderung.

Name Typ Beschreibung Erforderlich Vorgabe
input string Der Text, um Audio zu synthetisieren. Die maximale Länge beträgt 4.096 Zeichen. Ja
Antwortformat enum Das Format, um das Audio zu synthetisieren.
Mögliche Werte: mp3, opus, , aacflac, wav,pcm
No
Geschwindigkeit number Die Geschwindigkeit des synthetisierten Audios. Wählen Sie einen Wert von bis 0.254.0aus. 1.0 ist der Standard. No 1.0
Stimme enum Die Stimme für Sprachsynthese.
Mögliche Werte: alloy, echo, , fableonyx, nova,shimmer
Ja

imageQuality

Die Qualität des erzeugten Bildes.

Eigentum Wert
Beschreibung Die Qualität des erzeugten Bildes.
Typ string
Vorgabe auto
Werte auto
high
medium
low
hd
standard

imagesResponseFormat

Das Format, in dem die generierten Bilder zurückgegeben werden.

Eigentum Wert
Beschreibung Das Format, in dem die generierten Bilder zurückgegeben werden.
Typ string
Vorgabe url
Werte url
b64_json

imagesOutputFormat

Das Dateiformat, in dem die generierten Bilder zurückgegeben werden. Nur für Serienmodelle unterstützt.

Eigentum Wert
Beschreibung Das Dateiformat, in dem die generierten Bilder zurückgegeben werden. Wird nur für GPT-Image-1-Modelle unterstützt.
Typ string
Vorgabe png
Werte png
jpeg

imageSize

Die Größe der generierten Bilder.

Eigentum Wert
Beschreibung Die Größe der generierten Bilder.
Typ string
Vorgabe auto
Werte auto
1792x1024
1024x1792
1024x1024
1024x1536
1536x1024

imageStyle

Der Stil der generierten Bilder. Nur für DALL-e-3 unterstützt.

Eigentum Wert
Beschreibung Der Stil der generierten Bilder. Nur für DALL-e-3 unterstützt.
Typ string
Vorgabe vivid
Werte vivid
natural

imageBackground

Ermöglicht es, Transparenz für den Hintergrund der generierten Bilder einzustellen. Dieser Parameter wird nur für GPT-Image-1-Serienmodelle unterstützt.

Eigentum Wert
Beschreibung Ermöglicht es, Transparenz für den Hintergrund der generierten Bilder einzustellen. Dieser Parameter wird nur für GPT-Image-1-Serienmodelle unterstützt.
Typ string
Vorgabe auto
Werte transparent
opaque
auto

Bildgenerierungsanfrage

Name Typ Beschreibung Erforderlich Vorgabe
Hintergrund imageBackground Ermöglicht es, Transparenz für den Hintergrund der generierten Bilder einzustellen. Dieser Parameter wird nur für GPT-Image-1-Serienmodelle unterstützt. No auto
n Ganzzahl Die Anzahl der zu erzeugenden Bilder. Für dall-e-3 wird nur n=1 unterstützt. No 1
Ausgabekomprimierung Ganzzahl Der Kompressionswert (0–100%) für die erzeugten Bilder. Dieser Parameter wird nur für GPT-Image-1-Serienmodelle mit dem JPEG-Ausgabeformat unterstützt. No 100
Ausgabeformat imagesOutputFormat Das Dateiformat, in dem die generierten Bilder zurückgegeben werden. Wird nur für GPT-Image-1-Modelle unterstützt. No png
Eingabeaufforderung string Eine Textbeschreibung des gewünschten Bildes. Die maximale Länge beträgt 32.000 Zeichen für GPT-Image-1-Serienmodelle und 4000 Zeichen für DALL-e-3 Ja
Qualität imageQuality Die Qualität des erzeugten Bildes. No auto
Antwortformat imagesResponseFormat Das Format, in dem die generierten Bilder zurückgegeben werden. Nur für DALL-e-3 unterstützt. No url
size imageSize Die Größe der generierten Bilder. No auto
Stil imageStyle Der Stil der generierten Bilder. Nur für DALL-e-3 unterstützt. No vivid
user string Eine eindeutige Kennung, die Ihren Endnutzer repräsentiert und dabei helfen kann, Missbrauch zu überwachen und zu erkennen. No

imageEditsRequest

Name Typ Beschreibung Erforderlich Vorgabe
Bild Saite oder Array Die Bild(e) zum Bearbeiten. Muss eine unterstützte Bilddatei oder ein Array von Bildern sein. Jedes Bild sollte eine PNG- oder jpg-Datei mit weniger als 25 MB sein. Ja
mask string Ein zusätzliches Bild, dessen vollständig transparente Flächen (z. B. bei null Alpha) anzeigen, wo das Bild bearbeitet werden soll. Wenn mehrere Bilder bereitgestellt werden, wird die Maske auf das erste Bild angewendet. Es muss eine gültige PNG-Datei sein, weniger als 4 MB, und die gleichen Abmessungen wie das Bild haben. No
n Ganzzahl Die Anzahl der zu erzeugenden Bilder. No 1
Eingabeaufforderung string Eine Textbeschreibung des gewünschten Bildes. Die maximale Länge beträgt 32.000 Zeichen. Ja
Qualität imageQuality Die Qualität des erzeugten Bildes. No auto
Antwortformat imagesResponseFormat Das Format, in dem die generierten Bilder zurückgegeben werden. No url
size imageSize Die Größe der generierten Bilder. No auto
user string Eine eindeutige Kennung, die Ihren Endnutzer repräsentiert und dabei helfen kann, Missbrauch zu überwachen und zu erkennen. No

generateImagesResponse

Name Typ Beschreibung Erforderlich Vorgabe
erstellt Ganzzahl Der Unix-Zeitstempel, als die Operation erstellt wurde. Ja
data array Die Ergebnisdaten der Operation, falls erfolgreich Ja
Nutzung imageGenerationsUsage Repräsentiert Details zur Tokennutzung für Bildgenerierungsanfragen. Nur für Modelle der GPT-Image-1-Serie. No

imageResult

Die Bild-URL oder das codierte Bild, falls erfolgreich, und ansonsten ein Fehler.

Name Typ Beschreibung Erforderlich Vorgabe
b64_json string Das base64-kodierte Bild No
Content-Filtern-Egebnisse dalleContentFilterResults Informationen zu den Inhaltsfilterergebnissen. No
prompt_filter_results dalleFilterResults Informationen über die Kategorie der Inhaltsfilterung (Hass, sexuell, Gewalt, self_harm), ob sie erkannt wurde, sowie das Schweregrad (very_low, niedrig, mittel, hoch im Maßstab, das die Intensität und das Risikoniveau schädlicher Inhalte bestimmt) und ob sie gefiltert wurden oder nicht. Informationen zu Jailbreak-Inhalten und Schimpfwörtern, ob sie erkannt wurden und ob sie gefiltert wurden oder nicht. Und Informationen zur Kundensperrliste, falls sie gefiltert wurde und deren ID es ist. No
überarbeitete_Aufforderung string Der Prompt, mit dem das Bild generiert wurde, falls es eine Überarbeitung des Prompts gab. No
url string Die Bild-URL. No

imageGenerationsUsage

Repräsentiert Details zur Tokennutzung für Bildgenerierungsanfragen. Nur für Modelle der GPT-Image-1-Serie.

Name Typ Beschreibung Erforderlich Vorgabe
input_tokens Ganzzahl Die Anzahl der Eingabetoken. No
input_tokens_details Objekt Eine detaillierte Aufschlüsselung der Eingabetoken. No
└– image_tokens Ganzzahl Die Anzahl der Bildtokens. No
└- text_tokens Ganzzahl Die Anzahl der Texttokens. No
output_tokens Ganzzahl Die Anzahl der Ausgabetoken. No
Gesamtanzahl Tokens Ganzzahl Die Gesamtzahl der verwendeten Token. No

Linie

Ein Inhaltszeilenobjekt, das aus einer benachbarten Folge von Inhaltselementen besteht, wie Wörter und Auswahlmarkierungen.

Name Typ Beschreibung Erforderlich Vorgabe
spans array Ein Array von Spans, die erkannte Objekte und deren Begrenzungsbox-Informationen repräsentieren. Ja
Text string Ja

span

Ein Spannobjekt, das ein erkanntes Objekt und seine Begrenzungsbox-Informationen darstellt.

Name Typ Beschreibung Erforderlich Vorgabe
length Ganzzahl Die Länge des Spannes in Zeichen, gemessen in Unicode-Codepunkten. Ja
offset Ganzzahl Der Zeichenversatz innerhalb des Textes, wo der Abschnitt beginnt. Dieser Offset ist definiert als die Position des ersten Zeichens des Spans, der vom Anfang des Textes als Unicode-Codepunkte zählt. Ja
Polygon array Ein Array von Objekten, die Punkte im Polygon repräsentieren, das das erkannte Objekt umschließt. Ja
Text string Der Textinhalt des Spanns, der das erkannte Objekt darstellt. Ja

runCompletionUsage

Nutzungsstatistiken im Zusammenhang mit dem Lauf. Dieser Wert gilt, null wenn der Run sich nicht im terminalen Zustand befindet (d. h. in_progress, queued, usw.).

Name Typ Beschreibung Erforderlich Vorgabe
completion_tokens Ganzzahl Anzahl der im Verlauf des Durchlaufs verwendeten Komplettmarker. Ja
prompt_tokens Ganzzahl Anzahl der im Verlauf des Durchlaufs verwendeten Prompt-Tokens. Ja
Gesamtanzahl Tokens Ganzzahl Gesamtzahl der verwendeten Tokens (Prompt + Abschluss). Ja

runStepCompletionUsage

Nutzungsstatistiken im Zusammenhang mit dem Laufschritt. Dieser Wert gilt, null während der Status in_progressdes Laufschritts ist.

Name Typ Beschreibung Erforderlich Vorgabe
completion_tokens Ganzzahl Anzahl der im Verlauf des Laufschritts verwendeten Vervollständigungstokens. Ja
prompt_tokens Ganzzahl Anzahl der im Verlauf des Laufschritts verwendeten Prompt-Tokens. Ja
Gesamtanzahl Tokens Ganzzahl Gesamtzahl der verwendeten Tokens (Prompt + Abschluss). Ja

assistantsApiResponseFormatOption

Spezifiziert das Format, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit gpt-3.5-turbo-1106.

Einstellung aktiviert { "type": "json_schema", "json_schema": {...} } strukturierte Ausgaben, die sicherstellen, dass das Modell mit deinem bereitgestellten JSON-Schema übereinstimmt. Erfahren Sie mehr im Leitfaden für strukturierte Ausgaben.

Einstellung aktiviert den { "type": "json_object" } JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültig ist.

Wichtig: Beim Einsatz des JSON-Modus müssen Sie das Modell auch anweisen, selbst JSON über eine System- oder Benutzernachricht zu erzeugen. Ohne dies kann das Modell einen endlosen Strom von Leerraum erzeugen, bis die Erzeugung das Token-Limit erreicht, was zu einer langanhaltenden und scheinbar "festgefahrenen" Anfrage führt. Beachten Sie auch, dass der Nachrichteninhalt teilweise abgeschnitten werden kann, wenn finish_reason="length", was darauf hinweist, dass die Generation überschritten max_tokens wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.

Diese Komponente kann eine der folgenden sein:

assistantsApiResponseFormat

Ein Objekt, das die erwartete Ausgabe des Modells beschreibt. Wenn json_object nur function der Typ tools an den Run weitergegeben werden darf. Ob text das Modell Text oder einen beliebigen benötigten Wert zurückgeben kann.

Name Typ Beschreibung Erforderlich Vorgabe
type string Muss eines von oder textjson_objectsein. No Text

type Enum: AssistantsApiResponseFormat

Wert Beschreibung
Text
json_object

assistantObject

Stellt ein assistant dar, das das Modell aufrufen und Werkzeuge verwenden kann.

Name Typ Beschreibung Erforderlich Vorgabe
erstellt_am Ganzzahl Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem der Assistent erstellt wurde. Ja
Beschreibung string Die Beschreibung des Assistenten. Die maximale Länge beträgt 512 Zeichen.
Ja
id string Der Identifikator, der in API-Endpunkten referenziert werden kann. Ja
Anweisungen string Die Systemanweisungen, die der Assistent verwendet. Die maximale Länge beträgt 256.000 Zeichen.
Ja
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
Ja
Modell string ID des zu verwendenden Modells. Ja
Name string Der Name des Assistenten. Die maximale Länge beträgt 256 Zeichen.
Ja
Objekt string Der Objekttyp, der immer assistantist. Ja
Antwortformat assistantsApiResponseFormatOption Spezifiziert das Format, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit gpt-3.5-turbo-1106.

Einstellung aktiviert { "type": "json_schema", "json_schema": {...} } strukturierte Ausgaben, die sicherstellen, dass das Modell mit deinem bereitgestellten JSON-Schema übereinstimmt. Erfahren Sie mehr im Leitfaden für strukturierte Ausgaben.

Einstellung aktiviert den { "type": "json_object" } JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültig ist.

Wichtig: Beim Einsatz des JSON-Modus müssen Sie das Modell auch anweisen, selbst JSON über eine System- oder Benutzernachricht zu erzeugen. Ohne dies kann das Modell einen endlosen Strom von Leerraum erzeugen, bis die Erzeugung das Token-Limit erreicht, was zu einer langanhaltenden und scheinbar "festgefahrenen" Anfrage führt. Beachten Sie auch, dass der Nachrichteninhalt teilweise abgeschnitten werden kann, wenn finish_reason="length", was darauf hinweist, dass die Generation überschritten max_tokens wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.
No
Temperatur number Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen.
No 1
tool_resources Objekt Eine Sammlung von Ressourcen, die von den Werkzeugen des Assistenten genutzt werden. Die Ressourcen sind spezifisch für die Art des Werkzeugs. Zum Beispiel benötigt das code_interpreter Tool eine Liste von Datei-IDs, während das file_search Tool eine Liste von Vektorspeicher-IDs benötigt.
No
└– code_interpreter Objekt No
└– file_ids array Eine Liste der Datei-IDs, die dem code_interpreter Tool zur Verfügung gestellt wurden. Es können maximal 20 Dateien mit dem Tool verknüpft sein.
No []
└– Dateisuche Objekt No
└– vector_store_ids array Die ID des Vektorspeichers, der mit diesem Assistenten verbunden ist. Maximal 1 Vektorspeicher kann an den Assistenten angeschlossen sein.
No
tools array Eine Liste der auf dem Assistenten aktivierten Tools. Es können maximal 128 Werkzeuge pro Assistent sein. Werkzeuge können von den Typen code_interpreter, file_search, oder functionsein.
Ja []
top_p number Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden.

Wir empfehlen im Allgemeinen, diese oder die Temperatur zu verändern, aber nicht beides.
No 1

objekt Enum: AssistantObjectType

Wert Beschreibung
Assistent Der Objekttyp, der immer Assistant ist

createAssistantRequest

Name Typ Beschreibung Erforderlich Vorgabe
Beschreibung string Die Beschreibung des Assistenten. Die maximale Länge beträgt 512 Zeichen.
No
Anweisungen string Die Systemanweisungen, die der Assistent verwendet. Die maximale Länge beträgt 256.000 Zeichen.
No
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
No
Modell string Ja
Name string Der Name des Assistenten. Die maximale Länge beträgt 256 Zeichen.
No
Antwortformat assistantsApiResponseFormatOption Spezifiziert das Format, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit gpt-3.5-turbo-1106.

Einstellung aktiviert { "type": "json_schema", "json_schema": {...} } strukturierte Ausgaben, die sicherstellen, dass das Modell mit deinem bereitgestellten JSON-Schema übereinstimmt. Erfahren Sie mehr im Leitfaden für strukturierte Ausgaben.

Einstellung aktiviert den { "type": "json_object" } JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültig ist.

Wichtig: Beim Einsatz des JSON-Modus müssen Sie das Modell auch anweisen, selbst JSON über eine System- oder Benutzernachricht zu erzeugen. Ohne dies kann das Modell einen endlosen Strom von Leerraum erzeugen, bis die Erzeugung das Token-Limit erreicht, was zu einer langanhaltenden und scheinbar "festgefahrenen" Anfrage führt. Beachten Sie auch, dass der Nachrichteninhalt teilweise abgeschnitten werden kann, wenn finish_reason="length", was darauf hinweist, dass die Generation überschritten max_tokens wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.
No
Temperatur number Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen.
No 1
tool_resources Objekt Eine Sammlung von Ressourcen, die von den Werkzeugen des Assistenten genutzt werden. Die Ressourcen sind spezifisch für die Art des Werkzeugs. Zum Beispiel benötigt das code_interpreter Tool eine Liste von Datei-IDs, während das file_search Tool eine Liste von Vektorspeicher-IDs benötigt.
No
└– code_interpreter Objekt No
└– file_ids array Eine Liste der Datei-IDs, die dem code_interpreter Tool zur Verfügung gestellt wurden. Es können maximal 20 Dateien mit dem Tool verknüpft sein.
No []
└– Dateisuche Objekt No
└– vector_store_ids array Der Vektorspeicher ist mit diesem Assistenten verbunden. Maximal 1 Vektorspeicher kann an den Assistenten angeschlossen sein.
No
└– Vektorspeicher array Ein Helfer, um mit file_ids einen Vektorspeicher zu erstellen und ihn an diesen Assistenten anzuhängen. Maximal 1 Vektorspeicher kann an den Assistenten angeschlossen sein.
No
tools array Eine Liste der auf dem Assistenten aktivierten Tools. Es können maximal 128 Werkzeuge pro Assistent sein. Werkzeuge können von den Typen code_interpreter, retrieval, oder functionsein.
No []
top_p number Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden.

Wir empfehlen im Allgemeinen, diese oder die Temperatur zu verändern, aber nicht beides.
No 1

modifyAssistantRequest

Name Typ Beschreibung Erforderlich Vorgabe
Beschreibung string Die Beschreibung des Assistenten. Die maximale Länge beträgt 512 Zeichen.
No
Anweisungen string Die Systemanweisungen, die der Assistent verwendet. Die maximale Länge beträgt 32.768 Zeichen.
No
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
No
Modell string No
Name string Der Name des Assistenten. Die maximale Länge beträgt 256 Zeichen.
No
Antwortformat assistantsApiResponseFormatOption Spezifiziert das Format, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit gpt-3.5-turbo-1106.

Einstellung aktiviert { "type": "json_schema", "json_schema": {...} } strukturierte Ausgaben, die sicherstellen, dass das Modell mit deinem bereitgestellten JSON-Schema übereinstimmt. Erfahren Sie mehr im Leitfaden für strukturierte Ausgaben.

Einstellung aktiviert den { "type": "json_object" } JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültig ist.

Wichtig: Beim Einsatz des JSON-Modus müssen Sie das Modell auch anweisen, selbst JSON über eine System- oder Benutzernachricht zu erzeugen. Ohne dies kann das Modell einen endlosen Strom von Leerraum erzeugen, bis die Erzeugung das Token-Limit erreicht, was zu einer langanhaltenden und scheinbar "festgefahrenen" Anfrage führt. Beachten Sie auch, dass der Nachrichteninhalt teilweise abgeschnitten werden kann, wenn finish_reason="length", was darauf hinweist, dass die Generation überschritten max_tokens wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.
No
Temperatur number Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen.
No 1
tool_resources Objekt Eine Sammlung von Ressourcen, die von den Werkzeugen des Assistenten genutzt werden. Die Ressourcen sind spezifisch für die Art des Werkzeugs. Zum Beispiel benötigt das code_interpreter Tool eine Liste von Datei-IDs, während das file_search Tool eine Liste von Vektorspeicher-IDs benötigt.
No
└– code_interpreter Objekt No
└– file_ids array Überschreibt die Liste der Datei-IDs, die dem code_interpreter Tool zur Verfügung stehen. Es können maximal 20 Dateien mit dem Tool verknüpft sein.
No []
└– Dateisuche Objekt No
└– vector_store_ids array Überschreibt den Vektorspeicher, der diesem Assistenten zugeordnet ist. Maximal 1 Vektorspeicher kann an den Assistenten angeschlossen sein.
No
tools array Eine Liste der auf dem Assistenten aktivierten Tools. Es können maximal 128 Werkzeuge pro Assistent sein. Werkzeuge können von den Typen code_interpreter, retrieval, oder functionsein.
No []
top_p number Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden.

Wir empfehlen im Allgemeinen, diese oder die Temperatur zu verändern, aber nicht beides.
No 1

deleteAssistantResponse

Name Typ Beschreibung Erforderlich Vorgabe
gelöscht Boolescher Wert Ja
id string Ja
Objekt string Ja

Objekt-Enum: DeleteAssistantResponseState

Wert Beschreibung
assistant.deleted

listAssistantsResponse

Name Typ Beschreibung Erforderlich Vorgabe
data array Ja
first_id string Ja
has_more Boolescher Wert Ja
last_id string Ja
Objekt string Ja

assistantToolsCode

Name Typ Beschreibung Erforderlich Vorgabe
type string Der definierte Werkzeugtyp: code_interpreter Ja

type Enum: assistantToolsCodeType

Wert Beschreibung
code_interpreter

assistantToolsFileSearch

Name Typ Beschreibung Erforderlich Vorgabe
file_search Objekt Überschreibungen für das Dateisuchwerkzeug. No
└– max_num_results Ganzzahl Die maximale Anzahl an Ergebnissen, die das Dateisuchtool liefern sollte. Standardmäßig sind 20 für GPT-4*-Modelle und 5 für GPT-3.5-Turbo. Diese Zahl sollte zwischen 1 und 50 liegen.

Beachten Sie, dass das Dateisuchwerkzeug möglicherweise weniger als max_num_results Ergebnisse liefert.
No
type string Der definierte Werkzeugtyp: file_search Ja

type Enum: assistantToolsFileSearchType

Wert Beschreibung
file_search

assistantToolsFileSearchTypeOnly

Name Typ Beschreibung Erforderlich Vorgabe
type string Der definierte Werkzeugtyp: file_search Ja

type Enum: assistantToolsFileSearchType

Wert Beschreibung
file_search

assistantToolsFunction

Name Typ Beschreibung Erforderlich Vorgabe
Funktion Objekt Die Funktionsdefinition. Ja
└– Beschreibung string Eine Beschreibung dessen, was die Funktion tut, verwendet vom Modell, um zu entscheiden, wann und wie die Funktion aufgerufen wird. No
└– Name string Der Name der aufzurufenden Funktion. Muss a-z, A-Z, 0-9 sein oder Unterstriche und Striche enthalten, mit einer maximalen Länge von 64. No
└- Parameter chatCompletionFunctionParameters Die Parameter, die die Funktion akzeptiert, werden als JSON-Schema-Objekt beschrieben. Siehe die Anleitung/ Beispiele und die JSON-Schema-Referenz für die Dokumentation zum Format. No
type string Der definierte Werkzeugtyp: function Ja

type Enum: assistantToolsFunction

Wert Beschreibung
Funktion

truncationObject

Steuerungen, wie ein Thread vor dem Durchlauf abgeschnitten wird. Nutze dies, um das anfängliche Kontextfenster des Laufs zu steuern.

Name Typ Beschreibung Erforderlich Vorgabe
last_messages Ganzzahl Die Anzahl der aktuellsten Nachrichten aus dem Thread beim Erstellen des Kontexts für den Lauf. No
type string Die Trunkierungsstrategie, die für den Faden verwendet werden sollte. Der Standardwert ist auto. Wenn auf last_messagesgesetzt ist, wird der Thread auf die n aktuellsten Nachrichten im Thread abgeschnitten. Wenn auf autogesetzt wird, werden Nachrichten in der Mitte des Threads verworfen, um die Kontextlänge des Modells anzupassen. max_prompt_tokens Ja

Typ Enum: TrunkationsTyp

Wert Beschreibung
auto
last_messages

assistantsApiToolChoiceOption

Kontrolliert, welches (falls vorhandenes) Werkzeug vom Modell aufgerufen wird. none das bedeutet, dass das Modell keine Werkzeuge aufruft, sondern stattdessen eine Nachricht generiert. auto ist der Standardwert und bedeutet, dass das Modell zwischen der Generierung einer Nachricht oder dem Aufrufen eines Werkzeugs wählen kann. Ein bestimmtes Werkzeug zu spezifizieren oder {"type": "file_search"}{"type": "function", "function": {"name": "my_function"}} das Modell zu zwingen, dieses Tool aufzurufen.

Diese Komponente kann eine der folgenden sein:

assistantsNamedToolChoice

Spezifiziert ein Werkzeug, das das Modell verwenden soll. Nutze es, um das Modell zu zwingen, ein bestimmtes Werkzeug aufzurufen.

Name Typ Beschreibung Erforderlich Vorgabe
Funktion Objekt No
└– Name string Der Name der Funktion, die aufgerufen werden soll. No
type string Die Art des Werkzeugs. Wenn der Typ ist function, muss der Funktionsname gesetzt werden Ja

type Enum: AssistantsNamedToolChoiceType

Wert Beschreibung
Funktion
code_interpreter
file_search

runObject

Repräsentiert eine Ausführung, die auf einem Thread ausgeführt wird.

Name Typ Beschreibung Erforderlich Vorgabe
assistant_id string Die ID des Assistenten, der für die Durchführung dieses Laufs verwendet wurde. Ja
cancelled_at Ganzzahl Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem der Lauf abgebrochen wurde. Ja
abgeschlossen_am Ganzzahl Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem der Durchlauf abgeschlossen wurde. Ja
erstellt_am Ganzzahl Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem der Lauf erstellt wurde. Ja
läuft_ab_am Ganzzahl Der Unix-Zeitstempel (in Sekunden) dafür, wann der Durchlauf abläuft. Ja
failed_at Ganzzahl Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem der Durchlauf fehlgeschlagen ist. Ja
id string Der Identifikator, der in API-Endpunkten referenziert werden kann. Ja
incomplete_details Objekt Details dazu, warum der Durchlauf unvollständig ist. Wird es sein null , solange der Durchlauf nicht unvollständig ist. Ja
└– Grund string Der Grund, warum der Durchlauf unvollständig ist. Dies zeigt an, welches spezifische Token-Limit im Verlauf des Durchlaufs erreicht wurde. No
Anweisungen string Die Anweisungen, die der Assistent für diesen Durchlauf benutzt hat. Ja
last_error Objekt Der letzte Fehler, der mit diesem Durchlauf verbunden ist. Wird es sein null , wenn keine Fehler vorliegen. Ja
└– Code string Einer von server_error oder rate_limit_exceeded. No
└– Nachricht string Eine für Menschen lesbare Beschreibung des Fehlers. No
max_completion_tokens Ganzzahl Die maximale Anzahl der Completion Tokens, die im Verlauf des Durchlaufs verwendet werden sollen.
Ja
max_prompt_tokens Ganzzahl Die maximale Anzahl der Prompt-Token, die im Verlauf des Durchlaufs verwendet werden sollen.
Ja
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
Ja
Modell string Das Modell, das der Assistent für diesen Lauf verwendet hat. Ja
Objekt string Der Objekttyp, der immer thread.runist. Ja
Parallele Werkzeugaufrufe ParallelToolCalls Ob man während der Werkzeugnutzung parallele Funktionsaufrufe aktivieren soll. No Richtig
required_action Objekt Details zur Aktion, die erforderlich ist, um den Lauf fortzusetzen. Wird es sein null , wenn keine Maßnahmen erforderlich sind. Ja
└– submit_tool_outputs Objekt Details zu den Werkzeugausgaben, die für diesen Durchlauf benötigt werden. No
└- tool_calls array Eine Liste der relevanten Werkzeugaufrufe. No
└– Typ enum Für den Moment ist das immer submit_tool_outputsso.
Mögliche Werte: submit_tool_outputs
No
Antwortformat assistantsApiResponseFormatOption Spezifiziert das Format, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit gpt-3.5-turbo-1106.

Einstellung aktiviert { "type": "json_schema", "json_schema": {...} } strukturierte Ausgaben, die sicherstellen, dass das Modell mit deinem bereitgestellten JSON-Schema übereinstimmt. Erfahren Sie mehr im Leitfaden für strukturierte Ausgaben.

Einstellung aktiviert den { "type": "json_object" } JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültig ist.

Wichtig: Beim Einsatz des JSON-Modus müssen Sie das Modell auch anweisen, selbst JSON über eine System- oder Benutzernachricht zu erzeugen. Ohne dies kann das Modell einen endlosen Strom von Leerraum erzeugen, bis die Erzeugung das Token-Limit erreicht, was zu einer langanhaltenden und scheinbar "festgefahrenen" Anfrage führt. Beachten Sie auch, dass der Nachrichteninhalt teilweise abgeschnitten werden kann, wenn finish_reason="length", was darauf hinweist, dass die Generation überschritten max_tokens wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.
Ja
started_at Ganzzahl Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem der Durchlauf gestartet wurde. Ja
Status string Der Status des Laufs, der entweder , , , , queuedin_progressrequires_action, cancellingoder cancelledsein kann. failedcompletedexpired Ja
Temperatur number Die für diesen Durchgang verwendete Probetemperatur. Wenn nicht gesetzt, steht standardmäßig auf 1. No
thread_id string Die ID der Threads, auf denen im Rahmen dieses Durchlaufs ausgeführt wurde. Ja
tool_choice assistantsApiToolChoiceOption Kontrolliert, welches (falls vorhandenes) Werkzeug vom Modell aufgerufen wird.
none das bedeutet, dass das Modell keine Werkzeuge aufruft, sondern stattdessen eine Nachricht generiert.
auto ist der Standardwert und bedeutet, dass das Modell zwischen der Generierung einer Nachricht oder dem Aufrufen eines Werkzeugs wählen kann.
Ein bestimmtes Werkzeug zu spezifizieren oder {"type": "file_search"}{"type": "function", "function": {"name": "my_function"}} das Modell zu zwingen, dieses Tool aufzurufen.
Ja
tools array Die Liste der Werkzeuge, die der Assistent für diesen Durchlauf verwendet hat. Ja []
top_p number Der für diesen Lauf verwendete Kernprobenwert. Wenn nicht gesetzt, steht standardmäßig auf 1. No
truncation_strategy truncationObject Steuerungen, wie ein Thread vor dem Durchlauf abgeschnitten wird. Nutze dies, um das anfängliche Kontextfenster des Laufs zu steuern. Ja
Nutzung runCompletionUsage Nutzungsstatistiken im Zusammenhang mit dem Lauf. Dieser Wert gilt, null wenn der Run sich nicht im terminalen Zustand befindet (d. h. in_progress, queued, usw.). Ja

object Enum: runObjectType

Wert Beschreibung
thread.run Der Run-Objekttyp, der immer thread.run ist, ist immer thread.run

Status Enum: RunObjectStatus

Wert Beschreibung
queued Der Warteschlangezustand
in_progress Der in_progress Staat
requires_action Der required_action Staat
cancelling Der aufhebende Zustand
cancelled Der aufgehobene Staat
misslungen Der gescheiterte Staat
Abgeschlossen Der vollendete Zustand
Abgelaufen Der abgelaufene Zustand

createRunRequest

Name Typ Beschreibung Erforderlich Vorgabe
additional_instructions string Fügen Sie am Ende der Anweisungen für den Durchlauf zusätzliche Anweisungen hinzu. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern, ohne andere Anweisungen zu überschreiben. No
additional_messages array Fügt dem Thread vor dem Erstellen des Runs zusätzliche Nachrichten hinzu. No
assistant_id string Die ID des Assistenten, um diesen Durchgang auszuführen. Ja
Anweisungen string Überschreiben Sie die Standard-Systemnachricht des Assistenten. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern. No
max_completion_tokens Ganzzahl Die maximale Anzahl der Vervollständigungstoken, die im Verlauf des Durchlaufs verwendet werden dürfen. Der Lauf bemüht sich, nur die angegebene Anzahl der Abschlussmarker über mehrere Runden zu verwenden. Übersteigt der Run die angegebene Anzahl der Completion Tokens, endet der Run mit dem Status incomplete. Siehe incomplete_details für weitere Informationen.
No
max_prompt_tokens Ganzzahl Die maximale Anzahl der Prompt-Token, die im Verlauf des Laufs verwendet werden können. Der Lauf bemüht sich, nur die angegebene Anzahl der Prompt-Token über mehrere Runden zu verwenden. Übersteigt der Lauf die angegebene Anzahl der Prompt-Tokens, endet der Lauf mit dem Status incomplete. Siehe incomplete_details für weitere Informationen.
No
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
No
Modell string Die ID des Modells, das für diesen Durchlauf verwendet werden soll. Wenn hier ein Wert angegeben wird, überschreibt er das mit dem Assistenten verbundene Modell. Falls nicht, wird das mit dem Assistenten verbundene Modell verwendet. No
Parallele Werkzeugaufrufe ParallelToolCalls Ob man während der Werkzeugnutzung parallele Funktionsaufrufe aktivieren soll. No Richtig
Antwortformat assistantsApiResponseFormatOption Spezifiziert das Format, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit gpt-3.5-turbo-1106.

Einstellung aktiviert { "type": "json_schema", "json_schema": {...} } strukturierte Ausgaben, die sicherstellen, dass das Modell mit deinem bereitgestellten JSON-Schema übereinstimmt. Erfahren Sie mehr im Leitfaden für strukturierte Ausgaben.

Einstellung aktiviert den { "type": "json_object" } JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültig ist.

Wichtig: Beim Einsatz des JSON-Modus müssen Sie das Modell auch anweisen, selbst JSON über eine System- oder Benutzernachricht zu erzeugen. Ohne dies kann das Modell einen endlosen Strom von Leerraum erzeugen, bis die Erzeugung das Token-Limit erreicht, was zu einer langanhaltenden und scheinbar "festgefahrenen" Anfrage führt. Beachten Sie auch, dass der Nachrichteninhalt teilweise abgeschnitten werden kann, wenn finish_reason="length", was darauf hinweist, dass die Generation überschritten max_tokens wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.
No
stream Boolescher Wert Wenn true, gibt einen Strom von Ereignissen zurück, die während des Runs als servergesendete Ereignisse auftreten, und endet, wenn der Run mit einer data: [DONE] Nachricht in einen Terminalzustand eintritt.
No
Temperatur number Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen.
No 1
tool_choice assistantsApiToolChoiceOption Kontrolliert, welches (falls vorhandenes) Werkzeug vom Modell aufgerufen wird.
none das bedeutet, dass das Modell keine Werkzeuge aufruft, sondern stattdessen eine Nachricht generiert.
auto ist der Standardwert und bedeutet, dass das Modell zwischen der Generierung einer Nachricht oder dem Aufrufen eines Werkzeugs wählen kann.
Ein bestimmtes Werkzeug zu spezifizieren oder {"type": "file_search"}{"type": "function", "function": {"name": "my_function"}} das Modell zu zwingen, dieses Tool aufzurufen.
No
tools array Überschreiben Sie die Werkzeuge, die der Assistent für diesen Durchlauf verwenden kann. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern. No
top_p number Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden.

Wir empfehlen im Allgemeinen, diese oder die Temperatur zu verändern, aber nicht beides.
No 1
truncation_strategy truncationObject Steuerungen, wie ein Thread vor dem Durchlauf abgeschnitten wird. Nutze dies, um das anfängliche Kontextfenster des Laufs zu steuern. No

listRunsResponse

Name Typ Beschreibung Erforderlich Vorgabe
data array Ja
first_id string Ja
has_more Boolescher Wert Ja
last_id string Ja
Objekt string Ja

modifyRunRequest

Name Typ Beschreibung Erforderlich Vorgabe
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
No

submitToolOutputsRunRequest

Name Typ Beschreibung Erforderlich Vorgabe
stream Boolescher Wert Wenn true, gibt einen Strom von Ereignissen zurück, die während des Runs als servergesendete Ereignisse auftreten, und endet, wenn der Run mit einer data: [DONE] Nachricht in einen Terminalzustand eintritt.
No
tool_outputs array Eine Liste der Werkzeuge, für die die Ausgaben eingereicht werden. Ja

runToolCallObject

Werkzeugaufrufobjekte

Name Typ Beschreibung Erforderlich Vorgabe
Funktion Objekt Die Funktionsdefinition. Ja
└- Argumente string Die Argumente, von denen das Modell erwartet, dass du sie an die Funktion weitergibst. No
└– Name string Der Name der Veranstaltung. No
id string Die ID des Werkzeugrufs. Diese ID muss referenziert werden, wenn du die Werkzeugausgaben einreichst, indem du die Eingabe-Tool-Ausgaben nutzt, um Endpoint auszuführen. Ja
type string Die Art des Werkzeugaufrufs, für den die Ausgabe erforderlich ist. Für den Moment ist das immer functionso. Ja

type Enum: RunToolCallObjectType

Wert Beschreibung
Funktion

createThreadAndRunRequest

Name Typ Beschreibung Erforderlich Vorgabe
assistant_id string Die ID des Assistenten, um diesen Durchgang auszuführen. Ja
Anweisungen string Überschreiben Sie die Standard-Systemnachricht des Assistenten. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern. No
max_completion_tokens Ganzzahl Die maximale Anzahl der Vervollständigungstoken, die im Verlauf des Durchlaufs verwendet werden dürfen. Der Lauf bemüht sich, nur die angegebene Anzahl der Abschlussmarker über mehrere Runden zu verwenden. Übersteigt der Run die angegebene Anzahl der Completion Tokens, endet der Run mit dem Status incomplete. Siehe incomplete_details für weitere Informationen.
No
max_prompt_tokens Ganzzahl Die maximale Anzahl der Prompt-Token, die im Verlauf des Laufs verwendet werden können. Der Lauf bemüht sich, nur die angegebene Anzahl der Prompt-Token über mehrere Runden zu verwenden. Übersteigt der Lauf die angegebene Anzahl der Prompt-Tokens, endet der Lauf mit dem Status incomplete. Siehe incomplete_details für weitere Informationen.
No
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
No
Modell string Die ID der Modelle, die für diesen Durchlauf verwendet werden sollen. Wenn hier ein Wert angegeben wird, überschreibt er das mit dem Assistenten verbundene Modell. Falls nicht, wird das mit dem Assistenten verbundene Modell verwendet. No
Parallele Werkzeugaufrufe ParallelToolCalls Ob man während der Werkzeugnutzung parallele Funktionsaufrufe aktivieren soll. No Richtig
Antwortformat assistantsApiResponseFormatOption Spezifiziert das Format, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit gpt-3.5-turbo-1106.

Einstellung aktiviert { "type": "json_schema", "json_schema": {...} } strukturierte Ausgaben, die sicherstellen, dass das Modell mit deinem bereitgestellten JSON-Schema übereinstimmt. Erfahren Sie mehr im Leitfaden für strukturierte Ausgaben.

Einstellung aktiviert den { "type": "json_object" } JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültig ist.

Wichtig: Beim Einsatz des JSON-Modus müssen Sie das Modell auch anweisen, selbst JSON über eine System- oder Benutzernachricht zu erzeugen. Ohne dies kann das Modell einen endlosen Strom von Leerraum erzeugen, bis die Erzeugung das Token-Limit erreicht, was zu einer langanhaltenden und scheinbar "festgefahrenen" Anfrage führt. Beachten Sie auch, dass der Nachrichteninhalt teilweise abgeschnitten werden kann, wenn finish_reason="length", was darauf hinweist, dass die Generation überschritten max_tokens wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.
No
stream Boolescher Wert Wenn true, gibt einen Strom von Ereignissen zurück, die während des Runs als servergesendete Ereignisse auftreten, und endet, wenn der Run mit einer data: [DONE] Nachricht in einen Terminalzustand eintritt.
No
stream_options chatCompletionStreamOptions Optionen für Streaming-Antworten. Setzen Sie dies nur, wenn Sie stream: truesetzen.
No Nichts
Temperatur number Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen.
No 1
thread createThreadRequest No
tool_choice assistantsApiToolChoiceOption Kontrolliert, welches (falls vorhandenes) Werkzeug vom Modell aufgerufen wird.
none das bedeutet, dass das Modell keine Werkzeuge aufruft, sondern stattdessen eine Nachricht generiert.
auto ist der Standardwert und bedeutet, dass das Modell zwischen der Generierung einer Nachricht oder dem Aufrufen eines Werkzeugs wählen kann.
Ein bestimmtes Werkzeug zu spezifizieren oder {"type": "file_search"}{"type": "function", "function": {"name": "my_function"}} das Modell zu zwingen, dieses Tool aufzurufen.
No
tool_resources Objekt Eine Sammlung von Ressourcen, die von den Werkzeugen des Assistenten genutzt werden. Die Ressourcen sind spezifisch für die Art des Werkzeugs. Zum Beispiel benötigt das code_interpreter Tool eine Liste von Datei-IDs, während das file_search Tool eine Liste von Vektorspeicher-IDs benötigt.
No
└– code_interpreter Objekt No
└– file_ids array Eine Liste der Datei-IDs, die dem code_interpreter Tool zur Verfügung gestellt wurden. Es können maximal 20 Dateien mit dem Tool verknüpft sein.
No []
└– Dateisuche Objekt No
└– vector_store_ids array Die ID des Vektorspeichers, der mit diesem Assistenten verbunden ist. Maximal 1 Vektorspeicher kann an den Assistenten angeschlossen sein.
No
tools array Überschreiben Sie die Werkzeuge, die der Assistent für diesen Durchlauf verwenden kann. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern. No
top_p number Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden.

Wir empfehlen im Allgemeinen, diese oder die Temperatur zu verändern, aber nicht beides.
No 1
truncation_strategy truncationObject Steuerungen, wie ein Thread vor dem Durchlauf abgeschnitten wird. Nutze dies, um das anfängliche Kontextfenster des Laufs zu steuern. No

threadObject

Repräsentiert einen Thread, der Nachrichten enthält.

Name Typ Beschreibung Erforderlich Vorgabe
erstellt_am Ganzzahl Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem der Thread erstellt wurde. Ja
id string Der Identifikator, der in API-Endpunkten referenziert werden kann. Ja
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
Ja
Objekt string Der Objekttyp, der immer threadist. Ja
tool_resources Objekt Eine Sammlung von Ressourcen, die den Werkzeugen des Assistenten in diesem Thread zur Verfügung gestellt werden. Die Ressourcen sind spezifisch für die Art des Werkzeugs. Zum Beispiel benötigt das code_interpreter Tool eine Liste von Datei-IDs, während das file_search Tool eine Liste von Vektorspeicher-IDs benötigt.
Ja
└– code_interpreter Objekt No
└– file_ids array Eine Liste der Datei-IDs, die dem code_interpreter Tool zur Verfügung gestellt wurden. Es können maximal 20 Dateien mit dem Tool verknüpft sein.
No []
└– Dateisuche Objekt No
└– vector_store_ids array Der Vektorspeicher, der an diesen Thread angeschlossen ist. Maximal 1 Vektorspeicher kann an den Thread angeschlossen sein.
No

Objekt Enum: ThreadObjectType

Wert Beschreibung
thread Der Typ des Thread-Objekts, der immer ist thread

createThreadRequest

Name Typ Beschreibung Erforderlich Vorgabe
Nachrichten array Eine Liste von Nachrichten, mit denen man den Thread beginnen kann. No
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
No
tool_resources Objekt Eine Sammlung von Ressourcen, die den Werkzeugen des Assistenten in diesem Thread zur Verfügung gestellt werden. Die Ressourcen sind spezifisch für die Art des Werkzeugs. Zum Beispiel benötigt das code_interpreter Tool eine Liste von Datei-IDs, während das file_search Tool eine Liste von Vektorspeicher-IDs benötigt.
No
└– code_interpreter Objekt No
└– file_ids array Eine Liste der Datei-IDs, die dem code_interpreter Tool zur Verfügung gestellt wurden. Es können maximal 20 Dateien mit dem Tool verknüpft sein.
No []
└– Dateisuche Objekt No
└– vector_store_ids array Der Vektorspeicher, der an diesen Thread angeschlossen ist. Maximal 1 Vektorspeicher kann an den Thread angeschlossen sein.
No
└– Vektorspeicher array Ein Helfer, um mit file_ids einen Vektorspeicher zu erstellen und an diesen Thread anzuhängen. Maximal 1 Vektorspeicher kann an den Thread angeschlossen sein.
No

modifyThreadRequest

Name Typ Beschreibung Erforderlich Vorgabe
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
No
tool_resources Objekt Eine Sammlung von Ressourcen, die den Werkzeugen des Assistenten in diesem Thread zur Verfügung gestellt werden. Die Ressourcen sind spezifisch für die Art des Werkzeugs. Zum Beispiel benötigt das code_interpreter Tool eine Liste von Datei-IDs, während das file_search Tool eine Liste von Vektorspeicher-IDs benötigt.
No
└– code_interpreter Objekt No
└– file_ids array Eine Liste der Datei-IDs, die dem code_interpreter Tool zur Verfügung gestellt wurden. Es können maximal 20 Dateien mit dem Tool verknüpft sein.
No []
└– Dateisuche Objekt No
└– vector_store_ids array Der Vektorspeicher, der an diesen Thread angeschlossen ist. Maximal 1 Vektorspeicher kann an den Thread angeschlossen sein.
No

deleteThreadResponse

Name Typ Beschreibung Erforderlich Vorgabe
gelöscht Boolescher Wert Ja
id string Ja
Objekt string Ja

Objekt-Enum: DeleteThreadResponseObjectState

Wert Beschreibung
thread.deleted Der Zustand des Delete-Thread-Antwortobjekts, der ist thread.deleted

listThreadsResponse

Name Typ Beschreibung Erforderlich Vorgabe
data array Ja
first_id string Ja
has_more Boolescher Wert Ja
last_id string Ja
Objekt string Ja

messageObject

Repräsentiert eine Nachricht innerhalb eines Threads.

Name Typ Beschreibung Erforderlich Vorgabe
assistant_id string Falls zutreffend, die ID des Assistenten, der diese Nachricht verfasst hat. Ja
Anhänge array Eine Liste der an die Nachricht angehängten Dateien und die Werkzeuge, zu denen sie hinzugefügt wurden. Ja
abgeschlossen_am Ganzzahl Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem die Nachricht abgeschlossen wurde. Ja
Inhalt array Der Inhalt der Nachricht besteht aus Texten und/oder Bildern. Ja
erstellt_am Ganzzahl Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem die Nachricht erstellt wurde. Ja
id string Der Identifikator, der in API-Endpunkten referenziert werden kann. Ja
incomplete_at Ganzzahl Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, in dem die Nachricht als unvollständig markiert wurde. Ja
incomplete_details Objekt Bei einer unvollständigen Nachricht gibt es Details, warum die Nachricht unvollständig ist. Ja
└– Grund string Der Grund, warum die Nachricht unvollständig ist. No
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
Ja
Objekt string Der Objekttyp, der immer thread.messageist. Ja
Rolle string Die Entität, die die Botschaft erzeugt hat. Einer von user oder assistant. Ja
run_id string Falls zutreffend, die ID des Laufs, der mit der Erstellung dieser Nachricht verbunden ist. Ja
Status string Der Status der Nachricht, der entweder in_progress, incomplete, oder completedsein kann. Ja
thread_id string Die Thread-ID, zu der diese Nachricht gehört. Ja

object Enum: MessageObjectType

Wert Beschreibung
thread.message Der Nachrichtenobjekttyp, der ist thread.message

Status Enum: MessageObjectStatus

Wert Beschreibung
in_progress
incomplete
Abgeschlossen

Rolle Enum: MessageObjectRole

Wert Beschreibung
user
Assistent

messageDeltaObject

Repräsentiert ein Nachrichten-Delta, also alle veränderten Felder einer Nachricht während des Streamings.

Name Typ Beschreibung Erforderlich Vorgabe
delta Objekt Das Delta, das die Felder enthält, die sich auf der Nachricht geändert haben. Ja
└– Inhalt array Der Inhalt der Nachricht besteht aus Texten und/oder Bildern. No
└– Rolle string Die Entität, die die Botschaft erzeugt hat. Einer von user oder assistant. No
id string Die Identifikatorin der Nachricht, die in API-Endpunkten referenziert werden kann. Ja
Objekt string Der Objekttyp, der immer thread.message.deltaist. Ja

Objekt-Enum: MessageDeltaObjectType

Wert Beschreibung
thread.message.delta

createMessageRequest

Name Typ Beschreibung Erforderlich Vorgabe
Anhänge array Eine Liste der an die Nachricht angehängten Dateien und die Werkzeuge, zu denen sie hinzugefügt werden sollten. No
Inhalt string Der Inhalt der Nachricht. Ja
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
No
Rolle string Die Rolle der Entität, die die Botschaft erschafft. Erlaubte Werte umfassen:
- user: Zeigt an, dass die Nachricht von einem tatsächlichen Benutzer gesendet wurde und in den meisten Fällen zur Darstellung von benutzergenerierten Nachrichten verwendet werden sollte.
- assistant: Zeigt an, dass die Nachricht vom Assistenten generiert wurde. Verwenden Sie diesen Wert, um Nachrichten vom Assistenten in das Gespräch einzufügen.
Ja

Rollen-Enum: CreateMessageRequestRole

Wert Beschreibung
user
Assistent

modifyMessageRequest

Name Typ Beschreibung Erforderlich Vorgabe
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
No

deleteMessageResponse

Name Typ Beschreibung Erforderlich Vorgabe
gelöscht Boolescher Wert Ja
id string Ja
Objekt string Ja

Objekt Enum: DeleteMessageResponseObject

Wert Beschreibung
thread.message.deleted Der Zustand des Lösch-Nachrichten-Antwortobjekts

listMessagesResponse

Name Typ Beschreibung Erforderlich Vorgabe
data array Ja
first_id string Ja
has_more Boolescher Wert Ja
last_id string Ja
Objekt string Ja

messageContentImageFileObject

Verweist auf eine Bilddatei im Inhalt einer Nachricht.

Name Typ Beschreibung Erforderlich Vorgabe
image_file Objekt Ja
└– file_id string Die Datei-ID des Bildes im Nachrichteninhalt. No
type string Immer image_file. Ja

type Enum: MessageContentImageFileObjectType

Wert Beschreibung
image_file Der Dateityp des Nachrichteninhalts

messageContentTextObject

Der Text, der Teil einer Nachricht ist.

Name Typ Beschreibung Erforderlich Vorgabe
Text Objekt Ja
└– Anmerkungen array No
└– Wert string Die Daten, aus denen der Text besteht. No
type string Immer text. Ja

type Enum: messageContentTextObjectType

Wert Beschreibung
Text Der Nachrichteninhaltstext Objekttyp

messageContentTextAnnotationsFileCitationObject

Ein Zitat in der Nachricht, das auf ein bestimmtes Zitat aus einer bestimmten Datei verweist, die mit dem Assistenten oder der Nachricht verbunden ist. Generiert, wenn der Assistent das "Abruf"-Tool zur Durchsuchung von Dateien verwendet.

Name Typ Beschreibung Erforderlich Vorgabe
end_index Ganzzahl Ja
file_citation Objekt Ja
└– file_id string Die ID der spezifischen Datei, aus der der Zitat stammt. No
start_index Ganzzahl Ja
Text string Der Text im Nachrichteninhalt, der ersetzt werden muss. Ja
type string Immer file_citation. Ja

type Enum: FileCitationObjectType

Wert Beschreibung
file_citation Der Dateizitationsobjekttyp

messageContentTextAnnotationsFilePathObject

Eine URL für die Datei, die generiert wird, wenn der Assistent das code_interpreter Tool zur Erstellung einer Datei verwendet hat.

Name Typ Beschreibung Erforderlich Vorgabe
end_index Ganzzahl Ja
file_path Objekt Ja
└– file_id string Die ID der erstellten Datei. No
start_index Ganzzahl Ja
Text string Der Text im Nachrichteninhalt, der ersetzt werden muss. Ja
type string Immer file_path. Ja

type Enum: FilePathObjectType

Wert Beschreibung
file_path Der Dateipfad-Objekttyp

messageDeltaContentImageFileObject

Verweist auf eine Bilddatei im Inhalt einer Nachricht.

Name Typ Beschreibung Erforderlich Vorgabe
image_file Objekt No
└– file_id string Die Datei-ID des Bildes im Nachrichteninhalt. No
index Ganzzahl Der Inhaltsindex in der Nachricht. Ja
type string Immer image_file. Ja

type Enum: MessageDeltaContentImageFileObjectType

Wert Beschreibung
image_file

messageDeltaContentTextObject

Der Text, der Teil einer Nachricht ist.

Name Typ Beschreibung Erforderlich Vorgabe
index Ganzzahl Der Inhaltsindex in der Nachricht. Ja
Text Objekt No
└– Anmerkungen array No
└– Wert string Die Daten, aus denen der Text besteht. No
type string Immer text. Ja

type Enum: MessageDeltaContentTextObjectType

Wert Beschreibung
Text

messageDeltaContentTextAnnotationsFileCitationObject

Ein Zitat in der Nachricht, das auf ein bestimmtes Zitat aus einer bestimmten Datei verweist, die mit dem Assistenten oder der Nachricht verbunden ist. Generiert, wenn der Assistent das "file_search"-Tool zur Durchsuchung von Dateien verwendet.

Name Typ Beschreibung Erforderlich Vorgabe
end_index Ganzzahl No
file_citation Objekt No
└– file_id string Die ID der spezifischen Datei, aus der der Zitat stammt. No
└- Zitat string Das konkrete Zitat in der Akte. No
index Ganzzahl Der Index der Annotation im Textinhalt. Ja
start_index Ganzzahl No
Text string Der Text im Nachrichteninhalt, der ersetzt werden muss. No
type string Immer file_citation. Ja

type Enum: MessageDeltaContentTextAnnotationsFileCitationObjectType

Wert Beschreibung
file_citation

messageDeltaContentTextAnnotationsFilePathObject

Eine URL für die Datei, die generiert wird, wenn der Assistent das code_interpreter Tool zur Erstellung einer Datei verwendet hat.

Name Typ Beschreibung Erforderlich Vorgabe
end_index Ganzzahl No
file_path Objekt No
└– file_id string Die ID der erstellten Datei. No
index Ganzzahl Der Index der Annotation im Textinhalt. Ja
start_index Ganzzahl No
Text string Der Text im Nachrichteninhalt, der ersetzt werden muss. No
type string Immer file_path. Ja

type Enum: MessageDeltaContentTextAnnotationsFilePathObjectType

Wert Beschreibung
file_path

runStepObject

Stellt einen Schritt in der Ausführung eines Durchlaufs dar.

Name Typ Beschreibung Erforderlich Vorgabe
assistant_id string Die ID des Assistenten, der mit dem Laufschritt verknüpft ist. Ja
cancelled_at Ganzzahl Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem der Laufschritt abgebrochen wurde. Ja
abgeschlossen_am Ganzzahl Der Unix-Zeitstempel (in Sekunden) für den Abschluss des Laufschritts. Ja
erstellt_am Ganzzahl Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem der Ausführen-Schritt erstellt wurde. Ja
abgelaufen_am Ganzzahl Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt des Ablaufschritts. Ein Schritt gilt als abgelaufen, wenn der Elternlauf abgelaufen ist. Ja
failed_at Ganzzahl Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem der Ausführungsschritt fehlgeschlagen ist. Ja
id string Die Identifikatorin des Ausführens des Schritts, die in API-Endpunkten referenziert werden kann. Ja
last_error Objekt Der letzte Fehler, der mit diesem Laufschritt verbunden ist. Wird es sein null , wenn keine Fehler vorliegen. Ja
└– Code string Einer von server_error oder rate_limit_exceeded. No
└– Nachricht string Eine für Menschen lesbare Beschreibung des Fehlers. No
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
Ja
Objekt string Der Objekttyp, der immer assistant.run.stepist. Ja
run_id string Die ID des Durchlaufs, zu dem dieser Durchlaufschritt gehört. Ja
Status string Der Status des Durchlaufs, der entweder in_progress, cancelled, , failed, completedoder expiredsein kann. Ja
step_details runStepDetailsMessageCreationObject oder runStepDetailsToolCallsObject Die Details des Laufschritts. Ja
thread_id string Die ID der durchgeführten Threads. Ja
type string Der Typ des Laufschritts, der entweder message_creation oder tool_callssein kann. Ja

Objekt-Enum: RunStepObjectType

Wert Beschreibung
assistant.run.step Der Objekttyp, der immer ist assistant.run.step

Typ Enum: RunStepObjectType

Wert Beschreibung
message_creation Der message_creation Laufschritt
tool_calls Der tool_calls Laufschritt

Status Enum: RunStepObjectStatus

Wert Beschreibung
in_progress Der in_progress Run-Status
cancelled Der Status des gestrichenen Laufs
misslungen Der Status des gestrichenen Laufs
Abgeschlossen Der Status des gestrichenen Laufs
Abgelaufen Der Status des gestrichenen Laufs

runStepDeltaObject

Repräsentiert ein Laufschritt-Delta, also alle geänderten Felder auf einem Laufschritt während des Streamings.

Name Typ Beschreibung Erforderlich Vorgabe
delta Objekt Das Delta, das die Felder enthält, die sich im Laufschritt geändert haben. Ja
└– step_details runStepDeltaStepDetailsMessageCreationObject oder runStepDeltaStepDetailsToolCallsObject Die Details des Laufschritts. No
id string Die Identifikatorin des Ausführens des Schritts, die in API-Endpunkten referenziert werden kann. Ja
Objekt string Der Objekttyp, der immer thread.run.step.deltaist. Ja

Objekt-Enum: RunStepDeltaObjectType

Wert Beschreibung
thread.run.step.delta

listRunStepsResponse

Name Typ Beschreibung Erforderlich Vorgabe
data array Ja
first_id string Ja
has_more Boolescher Wert Ja
last_id string Ja
Objekt string Ja

runStepDetailsMessageCreationObject

Details zur Nachrichtenerstellung durch den Laufschritt.

Name Typ Beschreibung Erforderlich Vorgabe
message_creation Objekt Ja
└– Nachrichten-ID string Die ID der Nachricht, die durch diesen Laufschritt erstellt wurde. No
type string Immer message_creation. Ja

Typ Enum: RunStepDetailsMessageCreationObjectType

Wert Beschreibung
message_creation

runStepDeltaStepDetailsMessageCreationObject

Details zur Nachrichtenerstellung durch den Laufschritt.

Name Typ Beschreibung Erforderlich Vorgabe
message_creation Objekt No
└– Nachrichten-ID string Die ID der Nachricht, die durch diesen Laufschritt erstellt wurde. No
type string Immer message_creation. Ja

Typ Enum: RunStepDeltaStepDetailsMessageCreationObjectType

Wert Beschreibung
message_creation

runStepDetailsToolCallsObject

Details des Werkzeugaufrufs.

Name Typ Beschreibung Erforderlich Vorgabe
tool_calls array Eine Reihe von Werkzeugaufrufen, an denen der Laufschritt beteiligt war. Diese können mit einer von drei Arten von Werkzeugen assoziiert werden: code_interpreter, retrieval oder function.
Ja
type string Immer tool_calls. Ja

type Enum: RunStepDetailsToolCallsObjectType

Wert Beschreibung
tool_calls

runStepDeltaStepDetailsToolCallsObject

Details des Werkzeugaufrufs.

Name Typ Beschreibung Erforderlich Vorgabe
tool_calls array Eine Reihe von Werkzeugaufrufen, an denen der Laufschritt beteiligt war. Diese können mit einer von drei Arten von Werkzeugen assoziiert werden: code_interpreter, file_search oder function.
No
type string Immer tool_calls. Ja

type Enum: RunStepDeltaStepDetailsToolCallsObjectType

Wert Beschreibung
tool_calls

runStepDetailsToolCallsCodeObject

Details des Code Interpreter-Tool-Aufrufs, an dem der Ausführen-Schritt beteiligt war.

Name Typ Beschreibung Erforderlich Vorgabe
code_interpreter Objekt Das Code Interpreter-Tool ruft die Definition auf. Ja
└– Eingabe string Die Eingabe für den Code Interpreter-Tool-Aufruf. No
└─ Ausgaben array Die Ausgaben des Code Interpreter-Tool-Aufrufs. Code Interpreter kann ein oder mehrere Elemente ausgeben, darunter Text (logs) oder Bilder (image). Jede dieser Objekte wird durch einen anderen Objekttyp dargestellt. No
id string Die ID des Werkzeugrufs. Ja
type string Die Art von Werkzeugruf. Das gilt immer code_interpreter für diese Art von Tool-Call. Ja

type Enum: RunStepDetailsToolCallsCodeObjectType

Wert Beschreibung
code_interpreter

runStepDeltaStepDetailsToolCallsCodeObject

Details des Code Interpreter-Tool-Aufrufs, an dem der Ausführen-Schritt beteiligt war.

Name Typ Beschreibung Erforderlich Vorgabe
code_interpreter Objekt Das Code Interpreter-Tool ruft die Definition auf. No
└– Eingabe string Die Eingabe für den Code Interpreter-Tool-Aufruf. No
└─ Ausgaben array Die Ausgaben des Code Interpreter-Tool-Aufrufs. Code Interpreter kann ein oder mehrere Elemente ausgeben, darunter Text (logs) oder Bilder (image). Jede dieser Objekte wird durch einen anderen Objekttyp dargestellt. No
id string Die ID des Werkzeugrufs. No
index Ganzzahl Der Index des Werkzeugaufrufs im Werkzeug ruft das Array auf. Ja
type string Die Art von Werkzeugruf. Das gilt immer code_interpreter für diese Art von Tool-Call. Ja

type Enum: RunStepDeltaStepDetailsToolCallsCodeObjectType

Wert Beschreibung
code_interpreter

runStepDetailsToolCallsCodeOutputLogsObject

Textausgabe vom Code Interpreter-Tool-Aufruf als Teil eines Run-Schritts.

Name Typ Beschreibung Erforderlich Vorgabe
logs string Die Textausgabe aus dem Code Interpreter-Tool-Aufruf. Ja
type string Immer logs. Ja

type Enum: RunStepDetailsToolCallsCodeOutputLogsObjectType

Wert Beschreibung
logs

runStepDeltaStepDetailsToolCallsCodeOutputLogsObject

Textausgabe vom Code Interpreter-Tool-Aufruf als Teil eines Run-Schritts.

Name Typ Beschreibung Erforderlich Vorgabe
index Ganzzahl Der Index der Ausgabe im Ausgabearray. Ja
logs string Die Textausgabe aus dem Code Interpreter-Tool-Aufruf. No
type string Immer logs. Ja

type Enum: RunStepDeltaStepDetailsToolCallsCodeOutputLogsObjectType

Wert Beschreibung
logs

runStepDetailsToolCallsCodeOutputImageObject

Name Typ Beschreibung Erforderlich Vorgabe
Bild Objekt Ja
└– file_id string Die Datei-ID des Bildes. No
type string Immer image. Ja

type Enum: RunStepDetailsToolCallsCodeOutputImageObjectType

Wert Beschreibung
Bild

runStepDeltaStepDetailsToolCallsCodeOutputImageObject

Name Typ Beschreibung Erforderlich Vorgabe
Bild Objekt No
└– file_id string Die Datei-ID des Bildes. No
index Ganzzahl Der Index der Ausgabe im Ausgabearray. Ja
type string Immer image. Ja

Typ Enum: RunStepDeltaStepDetailsToolCallsCodeOutputImageObject

Wert Beschreibung
Bild

runStepDetailsToolCallsFileSearchObject

Name Typ Beschreibung Erforderlich Vorgabe
file_search Objekt Im Moment wird das immer ein leeres Objekt sein. Ja
└- Ergebnisse array Die Ergebnisse der Dateisuche. No
id string Die ID des Werkzeugaufrufobjekts. Ja
type string Die Art von Werkzeugruf. Das gilt immer file_search für diese Art von Tool-Call. Ja

Type Enum: RunStepDetailsToolCallsFileSearchObjectType

Wert Beschreibung
file_search

runStepDetailsToolCallsFileSearchResultObject

Eine Ergebnisinstanz der Dateisuche.

Name Typ Beschreibung Erforderlich Vorgabe
Inhalt array Der Inhalt des gefundenen Ergebnisses. Der Inhalt wird nur aufgenommen, wenn er über den Include-Abfrageparameter angefordert wird. No
Datei-ID string Die ID der Datei, in der das Ergebnis gefunden wurde. Ja
file_name string Der Name der Akte, in der dieses Ergebnis gefunden wurde. Ja
Punktzahl number Das Ergebnis des Ergebnisses. Alle Werte müssen eine Gleitkommazahl zwischen 0 und 1 haben. Ja

runStepDeltaStepDetailsToolCallsFileSearchObject

Name Typ Beschreibung Erforderlich Vorgabe
file_search Objekt Im Moment wird das immer ein leeres Objekt sein. Ja
id string Die ID des Werkzeugaufrufobjekts. No
index Ganzzahl Der Index des Werkzeugaufrufs im Werkzeug ruft das Array auf. Ja
type string Die Art von Werkzeugruf. Das gilt immer retrieval für diese Art von Tool-Call. Ja

Type Enum: RunStepDeltaStepDetailsToolCallsFileSearchObjectType

Wert Beschreibung
file_search

runStepDetailsToolCallsFunctionObject

Name Typ Beschreibung Erforderlich Vorgabe
Funktion Objekt Die Definition der Funktion, die genannt wurde. Ja
└- Argumente string Die Argumente wurden an die Veranstaltung weitergegeben. No
└– Name string Der Name der Veranstaltung. No
└─ Ausgabe string Die Ausgabe der Funktion. Dies gilt, null wenn die Ergebnisse noch nicht eingereicht wurden. No
id string Die ID des Werkzeugaufrufobjekts. Ja
type string Die Art von Werkzeugruf. Das gilt immer function für diese Art von Tool-Call. Ja

type Enum: RunStepDetailsToolCallsFunctionObjectType

Wert Beschreibung
Funktion

runStepDeltaStepDetailsToolCallsFunctionObject

Name Typ Beschreibung Erforderlich Vorgabe
Funktion Objekt Die Definition der Funktion, die genannt wurde. No
└- Argumente string Die Argumente wurden an die Veranstaltung weitergegeben. No
└– Name string Der Name der Veranstaltung. No
└─ Ausgabe string Die Ausgabe der Funktion. Dies gilt, null wenn die Ergebnisse noch nicht eingereicht wurden. No
id string Die ID des Werkzeugaufrufobjekts. No
index Ganzzahl Der Index des Werkzeugaufrufs im Werkzeug ruft das Array auf. Ja
type string Die Art von Werkzeugruf. Das gilt immer function für diese Art von Tool-Call. Ja

type Enum: RunStepDetailsToolCallsFunctionObjectType

Wert Beschreibung
Funktion

vectorStoreExpirationAfter

Die Ablaufrichtlinie für einen Vektorspeicher.

Name Typ Beschreibung Erforderlich Vorgabe
Anker string Anker-Zeitstempel, nach dem die Ablaufrichtlinie gilt. Unterstützte Anker: last_active_at. Ja
Tage Ganzzahl Die Anzahl der Tage nach der Ankerzeit, in der der Vektorspeicher abläuft. Ja

Anker-Enum: VectorStoreExpirationAfterAnchor

Wert Beschreibung
last_active_at Der Ankerzeitstempel, nach dem die Ablaufrichtlinie gilt.

vectorStoreObject

Ein Vektorspeicher ist eine Sammlung verarbeiteter Dateien, die vom file_search Tool verwendet werden können.

Name Typ Beschreibung Erforderlich Vorgabe
erstellt_am Ganzzahl Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem der Vektorspeicher erstellt wurde. Ja
expires_after vectorStoreExpirationAfter Die Ablaufrichtlinie für einen Vektorspeicher. No
läuft_ab_am Ganzzahl Der Unix-Zeitstempel (in Sekunden) dafür, wann der Vektorspeicher abläuft. No
file_counts Objekt Ja
└– abgebrochen Ganzzahl Die Anzahl der gelöschten Dateien. No
└– abgeschlossen Ganzzahl Die Anzahl der erfolgreich verarbeiteten Dateien. No
└– fehlgeschlagen Ganzzahl Die Anzahl der Dateien, die nicht verarbeitet wurden. No
└─ in Bearbeitung Ganzzahl Die Anzahl der aktuell bearbeiteten Dateien. No
└– Gesamtsumme Ganzzahl Die Gesamtzahl der Dateien. No
id string Der Identifikator, der in API-Endpunkten referenziert werden kann. Ja
last_active_at Ganzzahl Der Unix-Zeitstempel (in Sekunden) dafür, wann der Vektorspeicher zuletzt aktiv war. Ja
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
Ja
Name string Der Name des Vektorspeichers. Ja
Objekt enum Der Objekttyp, der immer vector_storeist.
Mögliche Werte: vector_store
Ja
Status string Der Status des Vektorspeichers, der entweder expired, in_progress, oder completedsein kann. Ein Status von completed zeigt an, dass der Vektorspeicher einsatzbereit ist. Ja
usage_bytes Ganzzahl Die Gesamtzahl der von den Dateien im Vektorspeicher verwendeten Bytes. Ja

Status Enum: VectorStoreObjectStatus

Wert Beschreibung
Abgelaufen
in_progress
Abgeschlossen

createVectorStoreRequest

Name Typ Beschreibung Erforderlich Vorgabe
chunking_strategy autoChunkingStrategyRequestParam oder staticChunkingStrategyRequestParam Die Chunking-Strategie, die verwendet wird, um die Datei(en) zu chunken. Wenn nicht gesetzt, werde ich die Strategie auto verwenden. Nur dann anwendbar, wenn file_ids nicht leer ist. No
expires_after vectorStoreExpirationAfter Die Ablaufrichtlinie für einen Vektorspeicher. No
Datei-IDs array Eine Liste von Datei-IDs, die der Vektorspeicher verwenden sollte. Nützlich für Werkzeuge wie file_search diese, die auf Dateien zugreifen können. No
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
No
Name string Der Name des Vektorspeichers. No

updateVectorStoreRequest

Name Typ Beschreibung Erforderlich Vorgabe
expires_after vectorStoreExpirationAfter Die Ablaufrichtlinie für einen Vektorspeicher. No
metadata Objekt Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.
No
Name string Der Name des Vektorspeichers. No

listVectorStoresResponse

Name Typ Beschreibung Erforderlich Vorgabe
data array Ja
first_id string Ja
has_more Boolescher Wert Ja
last_id string Ja
Objekt string Ja

deleteVectorStoreResponse

Name Typ Beschreibung Erforderlich Vorgabe
gelöscht Boolescher Wert Ja
id string Ja
Objekt string Ja

Objekt Enum: DeleteVectorStoreResponseObject

Wert Beschreibung
vector_store.deleted Der Zustand des Delete-Vector-Store-Response-Objekts

vectorStoreFileObject

Eine Liste von Dateien, die einem Vektorspeicher zugeordnet sind.

Name Typ Beschreibung Erforderlich Vorgabe
chunking_strategy autoChunkingStrategyRequestParam oder staticChunkingStrategyRequestParam Die Chunking-Strategie, die verwendet wird, um die Datei(en) zu chunken. Wenn nicht gesetzt, werde ich die Strategie auto verwenden. Nur dann anwendbar, wenn file_ids nicht leer ist. No
erstellt_am Ganzzahl Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem die Vektorspeicherdatei erstellt wurde. Ja
id string Der Identifikator, der in API-Endpunkten referenziert werden kann. Ja
last_error Objekt Der letzte Fehler, der mit dieser Vektorspeicherdatei verbunden ist. Wird es sein null , wenn keine Fehler vorliegen. Ja
└– Code string Eines von server_error oder invalid_file oder .unsupported_file No
└– Nachricht string Eine für Menschen lesbare Beschreibung des Fehlers. No
Objekt string Der Objekttyp, der immer vector_store.fileist. Ja
Status string Der Status der Vektorspeicherdatei, die entweder in_progress, completed, cancelled, oder failedsein kann. Der Status completed zeigt an, dass die Vektorspeicherdatei einsatzbereit ist. Ja
usage_bytes Ganzzahl Die Gesamtnutzung des Vektorspeichers in Bytes. Beachten Sie, dass dies sich von der ursprünglichen Dateigröße unterscheiden kann. Ja
vector_store_id string Die ID des Vektorspeichers, an den die Datei angehängt ist. Ja

Objekt-Enum: VectorStoreFileObjectType

Wert Beschreibung
vector_store.file

Status Enum: VectorStoreFileObjectStatus

Wert Beschreibung
in_progress
Abgeschlossen
cancelled
misslungen

otherChunkingStrategyResponseParam

Dies wird zurückgegeben, wenn die Chunking-Strategie unbekannt ist. Typischerweise liegt dies daran, dass die Datei bereits indexiert wurde, bevor das chunking_strategy Konzept in der API eingeführt wurde.

Name Typ Beschreibung Erforderlich Vorgabe
type string Immer other. Ja

Typ Enum: OtherChunkingStrategyResponseParamType

Wert Beschreibung
sonstige

staticChunkingStrategyResponseParam

Name Typ Beschreibung Erforderlich Vorgabe
Statisch staticChunkingStrategy Ja
type string Immer static. Ja

Typ Enum: StaticChunkingStrategyResponseParamType

Wert Beschreibung
Statisch

staticChunkingStrategy

Name Typ Beschreibung Erforderlich Vorgabe
chunk_overlap_tokens Ganzzahl Die Anzahl der Tokens, die sich zwischen den Chunks überschneiden. Der Standardwert ist 400.

Beachte, dass die Überlappung nicht die Hälfte von überschreiten max_chunk_size_tokensdarf.
Ja
max_chunk_size_tokens Ganzzahl Die maximale Anzahl an Token in jedem Chunk. Der Standardwert ist 800. Der Mindestwert ist 100 und der Maximalwert ist 4096. Ja

autoChunkingStrategyRequestParam

Die Standardstrategie. Diese Strategie verwendet derzeit ein max_chunk_size_tokens von 800 und chunk_overlap_tokens von 400.

Name Typ Beschreibung Erforderlich Vorgabe
type enum Immer auto.
Mögliche Werte: auto
Ja

staticChunkingStrategyRequestParam

Name Typ Beschreibung Erforderlich Vorgabe
Statisch staticChunkingStrategy Ja
type enum Immer static.
Mögliche Werte: static
Ja

chunkingStrategyRequestParam

Die Chunking-Strategie, die verwendet wird, um die Datei(en) zu chunken. Wenn nicht gesetzt, werde ich die Strategie auto verwenden.

Diese Komponente kann eine der folgenden sein:

createVectorStoreFileRequest

Name Typ Beschreibung Erforderlich Vorgabe
chunking_strategy chunkingStrategyRequestParam Die Chunking-Strategie, die verwendet wird, um die Datei(en) zu chunken. Wenn nicht gesetzt, werde ich die Strategie auto verwenden. No
Datei-ID string Eine Datei-ID, die der Vektorspeicher verwenden sollte. Nützlich für Werkzeuge wie file_search diese, die auf Dateien zugreifen können. Ja

listVectorStoreFilesResponse

Name Typ Beschreibung Erforderlich Vorgabe
data array Ja
first_id string Ja
has_more Boolescher Wert Ja
last_id string Ja
Objekt string Ja

deleteVectorStoreFileResponse

Name Typ Beschreibung Erforderlich Vorgabe
gelöscht Boolescher Wert Ja
id string Ja
Objekt string Ja

Objekt Enum: DeleteVectorStoreFileResponseObject

Wert Beschreibung
vector_store.file.deleted

vectorStoreFileBatchObject

Eine Charge von Dateien, die an einen Vektorspeicher angehängt sind.

Name Typ Beschreibung Erforderlich Vorgabe
erstellt_am Ganzzahl Der Unix-Zeitstempel (in Sekunden) für den Batch-Erstellung der Vektorspeicherdateien. Ja
file_counts Objekt Ja
└– abgebrochen Ganzzahl Die Anzahl der gelöschten Dateien. No
└– abgeschlossen Ganzzahl Die Anzahl der verarbeiteten Dateien. No
└– fehlgeschlagen Ganzzahl Die Anzahl der Dateien, die nicht verarbeitet wurden. No
└─ in Bearbeitung Ganzzahl Die Anzahl der aktuell bearbeiteten Dateien. No
└– Gesamtsumme Ganzzahl Die Gesamtzahl der Dateien. No
id string Der Identifikator, der in API-Endpunkten referenziert werden kann. Ja
Objekt string Der Objekttyp, der immer vector_store.file_batchist. Ja
Status string Der Status des Vektorspeicher-Dateien-Batches, der entweder in_progress, completed, cancelled oder failedsein kann. Ja
vector_store_id string Die ID des Vektorspeichers, an den die Datei angehängt ist. Ja

Objekt-Enum: VectorStoreFileBatchObjectType

Wert Beschreibung
vector_store.files_batch

Status Enum: VectorStoreFileBatchObjectStatus

Wert Beschreibung
in_progress
Abgeschlossen
cancelled
misslungen

createVectorStoreFileBatchRequest

Name Typ Beschreibung Erforderlich Vorgabe
chunking_strategy chunkingStrategyRequestParam Die Chunking-Strategie, die verwendet wird, um die Datei(en) zu chunken. Wenn nicht gesetzt, werde ich die Strategie auto verwenden. No
Datei-IDs array Eine Liste von Datei-IDs, die der Vektorspeicher verwenden sollte. Nützlich für Werkzeuge wie file_search diese, die auf Dateien zugreifen können. Ja

assistantStreamEvent

Repräsentiert ein Ereignis, das beim Streamen eines Runs ausgelöst wird.

Jedes Ereignis in einem servergesendeten Ereignisstrom besitzt eine event Eigenschaft und data :

event: thread.created
data: {"id": "thread_123", "object": "thread", ...}

Wir senden Ereignisse aus, wann immer ein neues Objekt erstellt wird, in einen neuen Zustand übergeht oder in Teilen (Deltas) gestreamt wird. Zum Beispiel senden wir aus, thread.run.created wenn ein neuer Run erstellt wird, thread.run.completed wenn ein Run abgeschlossen wird und so weiter. Wenn ein Assistent während eines Durchlaufs eine Nachricht erstellt, senden wir ein thread.message.created event, ein thread.message.in_progress Ereignis, viele thread.message.delta Ereignisse und schließlich ein Ereignis thread.message.completed .

Wir können im Laufe der Zeit zusätzliche Ereignisse hinzufügen, daher empfehlen wir, unbekannte Ereignisse in Ihrem Code elegant zu behandeln.

Diese Komponente kann eine der folgenden sein:

threadStreamEvent

Diese Komponente kann eine der folgenden sein:

thread.created

Tritt auf, wenn ein neuer Thread erstellt wird.

Name Typ Beschreibung Erforderlich Vorgabe
data threadObject Repräsentiert einen Thread, der Nachrichten enthält. Ja
Ereignis string Ja

Daten: threadObject

Ereignis-Enum: ThreadStreamEventEnum

Wert Beschreibung
thread.created Das Thread-erstellte Ereignis

runStreamEvent

Diese Komponente kann eine der folgenden sein:

thread.run.created

Tritt auf, wenn ein neuer Durchlauf erstellt wird.

Name Typ Beschreibung Erforderlich Vorgabe
data runObject Repräsentiert eine Ausführung, die auf einem Thread ausgeführt wird. Ja
Ereignis string Ja

Daten: runObject

Ereignis-Enum: RunStreamEventCreated

Wert Beschreibung
thread.run.created

thread.run.queued

Tritt auf, wenn ein Lauf in einen Status queued wechselt.

Name Typ Beschreibung Erforderlich Vorgabe
data runObject Repräsentiert eine Ausführung, die auf einem Thread ausgeführt wird. Ja
Ereignis string Ja

Daten: runObject

Ereignis-Enum: RunStreamEventQueued

Wert Beschreibung
thread.run.queued

thread.run.in_progress

Tritt auf, wenn ein Lauf in einen Status in_progress übergeht.

Name Typ Beschreibung Erforderlich Vorgabe
data runObject Repräsentiert eine Ausführung, die auf einem Thread ausgeführt wird. Ja
Ereignis string Ja

Daten: runObject

Ereignis-Enum: RunStreamEventInProgress

Wert Beschreibung
thread.run.in_progress

thread.run.requires_action

Tritt auf, wenn ein Lauf in einen Status requires_action wechselt.

Name Typ Beschreibung Erforderlich Vorgabe
data runObject Repräsentiert eine Ausführung, die auf einem Thread ausgeführt wird. Ja
Ereignis string Ja

Daten: runObject

Ereignis-Enum: RunStreamEventVerlangAktion

Wert Beschreibung
thread.run.requires_action

thread.run.completed

Tritt auf, wenn ein Durchlauf abgeschlossen ist.

Name Typ Beschreibung Erforderlich Vorgabe
data runObject Repräsentiert eine Ausführung, die auf einem Thread ausgeführt wird. Ja
Ereignis string Ja

Daten: runObject

Ereignis-Enum: RunStreamEventAbgeschlossen

Wert Beschreibung
thread.run.completed

thread.run.failed

Tritt auf, wenn ein Durchlauf fehlschlägt.

Name Typ Beschreibung Erforderlich Vorgabe
data runObject Repräsentiert eine Ausführung, die auf einem Thread ausgeführt wird. Ja
Ereignis string Ja

Daten: runObject

Ereignis-Enum: RunStreamEventFailed

Wert Beschreibung
thread.run.failed

thread.run.cancelling

Tritt auf, wenn ein Lauf in einen Status cancelling wechselt.

Name Typ Beschreibung Erforderlich Vorgabe
data runObject Repräsentiert eine Ausführung, die auf einem Thread ausgeführt wird. Ja
Ereignis string Ja

Daten: runObject

Event Enum: RunStreamEventCancelling

Wert Beschreibung
thread.run.cancelling

thread.run.cancelled

Tritt auf, wenn ein Lauf abgebrochen wird.

Name Typ Beschreibung Erforderlich Vorgabe
data runObject Repräsentiert eine Ausführung, die auf einem Thread ausgeführt wird. Ja
Ereignis string Ja

Daten: runObject

Veranstaltungsübersicht: RunStreamEventCancelled

Wert Beschreibung
thread.run.cancelled

thread.run.expired

Tritt auf, wenn ein Run abläuft.

Name Typ Beschreibung Erforderlich Vorgabe
data runObject Repräsentiert eine Ausführung, die auf einem Thread ausgeführt wird. Ja
Ereignis string Ja

Daten: runObject

Ereignis-Enum: RunStreamEventExpired

Wert Beschreibung
thread.run.expired

runStepStreamEvent

Diese Komponente kann eine der folgenden sein:

thread.run.step.created

Tritt auf, wenn ein Laufschritt erstellt wird.

Name Typ Beschreibung Erforderlich Vorgabe
data runStepObject Stellt einen Schritt in der Ausführung eines Durchlaufs dar.
Ja
Ereignis string Ja

Daten: runStepObject

Event Enum: RunStepStreamEventCreated

Wert Beschreibung
thread.run.step.created

thread.run.step.in_progress

Tritt auf, wenn ein Laufschritt in einen Zustand in_progress übergeht.

Name Typ Beschreibung Erforderlich Vorgabe
data runStepObject Stellt einen Schritt in der Ausführung eines Durchlaufs dar.
Ja
Ereignis string Ja

Daten: runStepObject

Ereignis-Enum: RunStepStreamEventInProgress

Wert Beschreibung
thread.run.step.in_progress

thread.run.step.delta

Tritt auf, wenn Teile eines Laufschritts gestreamt werden.

Name Typ Beschreibung Erforderlich Vorgabe
data runStepDeltaObject Repräsentiert ein Laufschritt-Delta, also alle geänderten Felder auf einem Laufschritt während des Streamings.
Ja
Ereignis string Ja

Daten: runStepDeltaObject

Event Enum: RunStepStreamEventDelta

Wert Beschreibung
thread.run.step.delta

thread.run.step.completed

Tritt auf, wenn ein Ausführungsschritt abgeschlossen ist.

Name Typ Beschreibung Erforderlich Vorgabe
data runStepObject Stellt einen Schritt in der Ausführung eines Durchlaufs dar.
Ja
Ereignis string Ja

Daten: runStepObject

Ereignis-Enum: RunStepStreamEventAbgeschlossen

Wert Beschreibung
thread.run.step.completed

thread.run.step.failed

Tritt auf, wenn ein Laufschritt fehlschlägt.

Name Typ Beschreibung Erforderlich Vorgabe
data runStepObject Stellt einen Schritt in der Ausführung eines Durchlaufs dar.
Ja
Ereignis string Ja

Daten: runStepObject

Ereignis-Enum: RunStepStreamEventFailed

Wert Beschreibung
thread.run.step.failed

thread.run.step.cancelled

Tritt auf, wenn ein Laufschritt abgebrochen wird.

Name Typ Beschreibung Erforderlich Vorgabe
data runStepObject Stellt einen Schritt in der Ausführung eines Durchlaufs dar.
Ja
Ereignis string Ja

Daten: runStepObject

Event Enum: RunStepStreamEventCancelled

Wert Beschreibung
thread.run.step.cancelled

thread.run.step.expired

Tritt auf, wenn ein Laufschritt abläuft.

Name Typ Beschreibung Erforderlich Vorgabe
data runStepObject Stellt einen Schritt in der Ausführung eines Durchlaufs dar.
Ja
Ereignis string Ja

Daten: runStepObject

Ereignis-Enum: RunStepStreamEventExpired

Wert Beschreibung
thread.run.step.expired

messageStreamEvent

Diese Komponente kann eine der folgenden sein:

thread.message.created

Tritt auf, wenn eine Nachricht erstellt wird.

Name Typ Beschreibung Erforderlich Vorgabe
data messageObject Repräsentiert eine Nachricht innerhalb eines Threads. Ja
Ereignis string Ja

Daten: messageObject

Ereignis-Enum: MessageStreamEventCreated

Wert Beschreibung
thread.message.created

thread.message.in_progress

Tritt auf, wenn eine Nachricht in einen Zustand in_progress wechselt.

Name Typ Beschreibung Erforderlich Vorgabe
data messageObject Repräsentiert eine Nachricht innerhalb eines Threads. Ja
Ereignis string Ja

Daten: messageObject

Ereignis-Enum: MessageStreamEventInProgress

Wert Beschreibung
thread.message.in_progress

thread.message.delta

Tritt auf, wenn Teile einer Nachricht gestreamt werden.

Name Typ Beschreibung Erforderlich Vorgabe
data messageDeltaObject Repräsentiert ein Nachrichten-Delta, also alle veränderten Felder einer Nachricht während des Streamings.
Ja
Ereignis string Ja

Daten: messageDeltaObject

Ereignis-Enum: MessageStreamEventDelta

Wert Beschreibung
thread.message.delta

thread.message.completed

Tritt auf, wenn eine Nachricht abgeschlossen ist.

Name Typ Beschreibung Erforderlich Vorgabe
data messageObject Repräsentiert eine Nachricht innerhalb eines Threads. Ja
Ereignis string Ja

Daten: messageObject

Ereignis-Enum: MessageStreamEventCompleted

Wert Beschreibung
thread.message.completed

thread.message.incomplete

Tritt auf, wenn eine Nachricht endet, bevor sie abgeschlossen ist.

Name Typ Beschreibung Erforderlich Vorgabe
data messageObject Repräsentiert eine Nachricht innerhalb eines Threads. Ja
Ereignis string Ja

Daten: messageObject

Ereignis-Enum: MessageStreamEventIncomplete

Wert Beschreibung
thread.message.incomplete

Anmerkung

Diese Komponente kann eine der folgenden sein:

Klicken Sie auf

Eine Klickaktion.

Name Typ Beschreibung Erforderlich Vorgabe
button enum Zeigt an, welche Maustaste während des Klicks gedrückt wurde. Einer von , , , , left, oder right. wheelbackforward

Mögliche Werte: left, right, wheel, back, forward
Ja
type enum Spezifiziert den Ereignistyp. Für eine Klickaktion ist diese Eigenschaft immer auf clickgesetzt.

Mögliche Werte: click
Ja
x Ganzzahl Die X-Koordinate, an der der Klick stattfand.
Ja
Y Ganzzahl Die y-Koordinate, an der der Klick stattfand.
Ja

CodeInterpreterFileOutput

Die Ausgabe eines Code-Interpreter-Tool-Aufrufs, der eine Datei ist.

Name Typ Beschreibung Erforderlich Vorgabe
files array Ja
type enum Der Typ der Code-Interpreter-Datei, die ausgegeben wird. Immer files.

Mögliche Werte: files
Ja

CodeInterpreterTextOutput

Die Ausgabe eines Code-Interpreter-Tool-Aufrufs, der Text ist.

Name Typ Beschreibung Erforderlich Vorgabe
logs string Die Protokolle des Code-Interpreter-Tool-Aufrufs.
Ja
type enum Der Typ der Code-Interpreter-Textausgabe. Immer logs.

Mögliche Werte: logs
Ja

CodeInterpreterTool

Ein Tool, das Code ausführt.

Name Typ Beschreibung Erforderlich Vorgabe
Datei-IDs array Die IDs der Dateien, auf denen der Code ausgeführt werden soll.
Ja
type enum Der Typ des Code-Interpreter-Tools. Immer code_interpreter.

Mögliche Werte: code_interpreter
Ja

CodeInterpreterToolCall

Ein Toolaufruf, um Code auszuführen.

Name Typ Beschreibung Erforderlich Vorgabe
code string Der Code zum Laufen.
Ja
id string Die eindeutige ID des Code-Interpreter-Tool-Aufrufs.
Ja
results array Die Ergebnisse des Code-Interpreter-Tool-Aufrufs.
Ja
Status enum Der Status des Code-Interpreter-Tool-Aufrufs.

Mögliche Werte: in_progress, interpreting, completed
Ja
type enum Der Typ des Code-Interpreter-Tool-Aufrufs. Immer code_interpreter_call.

Mögliche Werte: code_interpreter_call
Ja

CodeInterpreterToolOutput

Diese Komponente kann eine der folgenden sein:

ComparisonFilter

Ein Filter, der verwendet wird, um einen bestimmten Attributschlüssel mit einem bestimmten Wert zu vergleichen, indem er eine definierte Vergleichsoperation verwendet.

Name Typ Beschreibung Erforderlich Vorgabe
Schlüssel string Der Schlüssel ist, den Wert zu vergleichen. Ja
type enum Spezifiziert den Vergleichsoperator: eq, ne, , gtgte, lt, . lte
- eq: gleich
- ne: nicht gleich
- gt: größer als
- gte: größer als oder gleich
- lt: weniger als
- lte: weniger als oder gleich

Mögliche Werte: eq, ne, , gtgte, lt,lte
Ja
value String oder Number oder Boolean Der zu vergleichende Wert mit dem Attributschlüssel; unterstützt Zeichenketten-, Zahlen- oder Boolean-Typen. Ja

CompoundFilter

Kombinieren Sie mehrere Filter mit and oder or.

Name Typ Beschreibung Erforderlich Vorgabe
Filter array Ein Filter-Array zum Kombinieren. Gegenstände können ComparisonFilter sein oder CompoundFilter. Ja
type enum Art der Operation: and oder or.
Mögliche Werte: and, or
Ja

ComputerAction

Diese Komponente kann eine der folgenden sein:

ComputerScreenshotImage

Ein Computer-Screenshot-Bild, das mit dem Computerwerkzeug verwendet wird.

Name Typ Beschreibung Erforderlich Vorgabe
Datei-ID string Die Identifikatorin einer hochgeladenen Datei, die den Screenshot enthält. No
image_url string Die URL des Screenshots. No
type enum Spezifiziert den Ereignistyp. Für einen Computerscreenshot ist diese Eigenschaft immer auf computer_screenshotgesetzt.

Mögliche Werte: computer_screenshot
Ja

ComputerTool

Ein Werkzeug, das einen virtuellen Computer steuert.

Name Typ Beschreibung Erforderlich Vorgabe
Anzeigehöhe number Die Höhe des Computerbildschirms.
Ja
Bildschirmbreite number Die Breite des Computerbildschirms.
Ja
environment enum Die Art von Computerumgebung, die gesteuert werden soll.

Mögliche Werte: mac, windows, ubuntu, browser
Ja
type enum Die Art des Computerwerkzeugs. Immer computer_use_preview.

Mögliche Werte: computer-use-preview
Ja

ComputerToolCall

Ein Werkzeugaufruf an ein Computerwerkzeug.

Name Typ Beschreibung Erforderlich Vorgabe
action ComputerAction Ja
call_id string Ein Identifikator, der beim Antworten auf den Werkzeugaufruf mit Ausgabe verwendet wird.
Ja
id string Die eindeutige ID des Computeranrufs. Ja
pending_safety_checks array Die ausstehenden Sicherheitskontrollen für den Computeranruf.
Ja
Status enum Der Status des Gegenstands. Einer von in_progress, completed, oder incomplete. Wird angezeigt, wenn Items über die API zurückgegeben werden.

Mögliche Werte: in_progress, completed, incomplete
Ja
type enum Die Art des Computeranrufs. Immer computer_call.
Mögliche Werte: computer_call
Ja

ComputerToolCallOutput

Die Ausgabe eines Computerwerkzeuganrufs.

Name Typ Beschreibung Erforderlich Vorgabe
acknowledged_safety_checks array Die Sicherheitsprüfungen, die von der API gemeldet wurden und vom Entwickler bestätigt wurden.
No
call_id string Die ID des Computeraufrufs, der die Ausgabe erzeugte.
Ja
id string Die ID des Computerwerkzeug-Aufrufs gibt aus.
No
Ausgabe ComputerScreenshotImage Ein Computer-Screenshot-Bild, das mit dem Computerwerkzeug verwendet wird.
Ja
Status enum Der Status der Nachrichteneingabe. Einer von in_progress, completed, oder incomplete. Gefüllt, wenn Eingabeeinträge über die API zurückgegeben werden.

Mögliche Werte: in_progress, completed, incomplete
No
type enum Der Typ des Computerwerkzeugs ruft die Ausgabe. Immer computer_call_output.

Mögliche Werte: computer_call_output
Ja

ComputerToolCallOutputResource

Name Typ Beschreibung Erforderlich Vorgabe
acknowledged_safety_checks array Die Sicherheitsprüfungen, die von der API gemeldet wurden und vom Entwickler bestätigt wurden.
No
call_id string Die ID des Computeraufrufs, der die Ausgabe erzeugte.
Ja
id string Die eindeutige ID des Computer-Aufrufwerkzeugs.
Ja
Ausgabe ComputerScreenshotImage Ein Computer-Screenshot-Bild, das mit dem Computerwerkzeug verwendet wird.
Ja
Status enum Der Status der Nachrichteneingabe. Einer von in_progress, completed, oder incomplete. Gefüllt, wenn Eingabeeinträge über die API zurückgegeben werden.

Mögliche Werte: in_progress, completed, incomplete
No
type enum Der Typ des Computerwerkzeugs ruft die Ausgabe. Immer computer_call_output.

Mögliche Werte: computer_call_output
Ja

ComputerToolCallSafetyCheck

Eine bevorstehende Sicherheitsüberprüfung für den Computeranruf.

Name Typ Beschreibung Erforderlich Vorgabe
code string Die Art der bevorstehenden Sicherheitsüberprüfung. Ja
id string Der Ausweis der ausstehenden Sicherheitskontrolle. Ja
Nachricht string Details zur ausstehenden Sicherheitsprüfung. Ja

Content

Multimodale Eingabe- und Ausgabeinhalte.

Diese Komponente kann eine der folgenden sein:

Coordinate

Ein x/y-Koordinatenpaar, z. B. { x: 100, y: 200 }.

Name Typ Beschreibung Erforderlich Vorgabe
x Ganzzahl Die x-Koordinate.
Ja
Y Ganzzahl Die y-Koordinate.
Ja

CreateModelResponseProperties

Name Typ Beschreibung Erforderlich Vorgabe
metadata Metadata Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern und Objekte über die API oder das Dashboard abzufragen.

Tasten sind Zeichenketten mit einer maximalen Länge von 64 Zeichen. Werte sind Zeichenketten mit einer maximalen Länge von 512 Zeichen.
No
Modell string Modell, das zur Erzeugung der Antworten verwendet wird. No
Temperatur number Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen.
Wir empfehlen im Allgemeinen, dies zu ändern oder top_p , aber nicht beides.
No 1
top_p number Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden.

Wir empfehlen im Allgemeinen, dies zu ändern oder temperature , aber nicht beides.
No 1
user string Eine eindeutige Identifikator, die Ihren Endnutzer repräsentiert und OpenAI helfen kann, Missbrauch zu überwachen und zu erkennen. .
No

createResponse

Name Typ Beschreibung Erforderlich Vorgabe
include array {"$ref": "#/components/schemas/includable/description"} No
input Saite oder Array Text-, Bild- oder Dateieingaben für das Modell, die zur Erzeugung einer Antwort verwendet werden. Ja
Anweisungen string Fügt eine System- (oder Entwickler-) Nachricht als erstes Element im Kontext des Modells ein.

Wenn man zusammen mit previous_response_idverwendet, werden die Anweisungen aus einer vorherigen Antwort nicht auf die nächste Antwort übernommen. Dadurch ist es einfach, System- (oder Entwickler-) Nachrichten in neuen Antworten auszutauschen.
No
max_output_tokens Ganzzahl Eine obere Schranke für die Anzahl der Tokens, die für eine Antwort generiert werden können, einschließlich sichtbarer Ausgabetoken und Reasoning-Tokens.
No
Parallele Werkzeugaufrufe Boolescher Wert Ob das Modell Werkzeugaufrufe parallel ausführen soll.
No Richtig
previous_response_id string Die eindeutige ID der vorherigen Antwort auf das Modell. Nutzen Sie dies, um Gespräche mit mehreren Runden zu erstellen. No
reasoning Reasoning Konfigurationsoptionen für Schlussfolgermodelle. No
store Boolescher Wert Ob die generierte Modellantwort für eine spätere Abruf über die API gespeichert werden soll.
No Richtig
stream Boolescher Wert Wenn auf true gesetzt, werden die Antwortdaten des Modells an den Client gestreamt, während sie mithilfe von Server-gesendeten Ereignissen generiert werden. No Falsch
Text Objekt Konfigurationsoptionen für eine Textantwort des Modells. Es können Klartext oder strukturierte JSON-Daten sein. Erfahren Sie mehr:
- Texteingaben und -ausgaben
- Strukturierte Ausgaben
No
└─ Format TextResponseFormatConfiguration Ein Objekt, das das Format angibt, das das Modell ausgeben muss.

Die Konfiguration { "type": "json_schema" } aktiviert strukturierte Ausgaben, die sicherstellen, dass das Modell mit dem bereitgestellten JSON-Schema übereinstimmt. Das Standardformat ist { "type": "text" } ohne zusätzliche Optionen.

Nicht empfohlen für GPT-4o und neuere Modelle:

Einstellung aktiviert den { "type": "json_object" } älteren JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültiges JSON ist. Die Verwendung json_schema ist bevorzugt für Modelle, die sie unterstützen.
No
tool_choice ToolChoiceOptions oder ToolChoiceTypes oder ToolChoiceFunction Wie das Modell auswählen sollte, welches Tool (oder welche Werkzeuge) es bei der Generierung einer Antwort verwendet. Sehen Sie sich den Parameter tools an, um zu sehen, welche Werkzeuge das Modell aufrufen kann.
No
tools array Ein Array von Werkzeugen, die das Modell aufrufen kann, während es eine Antwort erzeugt. Du kannst angeben, welches Werkzeug du verwenden sollst, indem du den Parameter tool_choice einlegst.

Die zwei Kategorien von Werkzeugen, die Sie dem Modell bereitstellen können, sind:

- Eingebaute Werkzeuge
No
truncation enum Die Abschneidungsstrategie, die für die Modellantwort verwendet werden soll.
- auto: Wenn der Kontext dieser Antwort und der vorherigen die Größe des Kontextfensters des Modells übersteigt, wird das Modell die
Antwort, um ins Kontextfenster zu passen, indem man Eingabepunkte mitten im Gespräch platziert.
- disabled (Standard): Wenn eine Modellantwort die Kontextfenstergröße eines Modells überschreitet, schlägt die Anfrage mit einem Fehler von 400 fehl.

Mögliche Werte: auto, disabled
No

DoubleClick

Eine Doppelklick-Aktion.

Name Typ Beschreibung Erforderlich Vorgabe
type enum Spezifiziert den Ereignistyp. Für eine Doppelklickaktion ist diese Eigenschaft immer auf double_clickgesetzt.

Mögliche Werte: double_click
Ja
x Ganzzahl Die x-Koordinate, an der der Doppelklick stattfand.
Ja
Y Ganzzahl Die y-Koordinate, an der der Doppelklick stattfand.
Ja

Ziehen

Eine Drag-Action.

Name Typ Beschreibung Erforderlich Vorgabe
path array Ein Koordinatenarray, das den Weg der Dragaktion darstellt. Koordinaten erscheinen als ein Array von Objekten, z. B.[{ x: 100, y: 200 }, { x: 200, y: 300 }] Ja
type enum Spezifiziert den Ereignistyp. Für eine Drag-Aktion ist diese Eigenschaft immer auf draggesetzt.

Mögliche Werte: drag
Ja

EasyInputMessage

Eine Nachrichteneingabe an das Modell mit einer Rolle, die eine Instruktion angibt, die der Hierarchie folgt. Anweisungen, die mit der oder developer Rolle system gegeben werden, haben Vorrang vor den Anweisungen der jeweiligen user Rolle. Nachrichten mit der Rolle assistant werden angenommen, dass sie vom Modell in früheren Interaktionen generiert wurden.

Name Typ Beschreibung Erforderlich Vorgabe
Inhalt String oder InputMessageContentList Text-, Bild- oder Audioeingaben für das Modell, die zur Erzeugung einer Antwort verwendet werden.
Kann auch Antworten früherer Assistenten enthalten.
Ja
Rolle enum Die Rolle der Nachrichteneingabe. Einer von user, assistant, , systemoder developer.

Mögliche Werte: user, assistant, system, developer
Ja
type enum Der Typ der Nachrichteneingabe. Immer message.

Mögliche Werte: message
No

FileCitation

Ein Zitat für eine Akte.

Name Typ Beschreibung Erforderlich Vorgabe
Datei-ID string Die ID der Akte.
Ja
index Ganzzahl Der Index der Datei in der Liste der Dateien.
Ja
type enum Der Typ der Aktenbelegung. Immer file_citation.

Mögliche Werte: file_citation
Ja

FilePath

Ein Pfad zu einer Datei.

Name Typ Beschreibung Erforderlich Vorgabe
Datei-ID string Die ID der Akte.
Ja
index Ganzzahl Der Index der Datei in der Liste der Dateien.
Ja
type enum Der Typ des Dateipfads. Immer file_path.

Mögliche Werte: file_path
Ja

FileSearchRanker

Der Ranker für die Dateisuche. Falls nicht angegeben, werde ich den auto Ranker verwenden.

Eigentum Wert
Beschreibung Der Ranker für die Dateisuche. Falls nicht angegeben, werde ich den auto Ranker verwenden.
Typ string
Werte auto
default_2024_08_21

FileSearchTool

Ein Tool, das relevante Inhalte aus hochgeladenen Dateien sucht.

Name Typ Beschreibung Erforderlich Vorgabe
Filter ComparisonFilter oder CompoundFilter Ein Filter, der basierend auf Dateiattributen angewendet wird. No
max_anzahl_ergebnisse Ganzzahl Die maximale Anzahl an Ergebnissen, die du ergeben kannst. Diese Zahl sollte zwischen 1 und 50 liegen.
No
Ranglistenoptionen Objekt Rangfolgeoptionen für die Suche. No
└– Ranker enum Der Ranker für die Dateisuche.
Mögliche Werte: auto, default-2024-11-15
No
└─ Punktschwelle number Die Punktschwelle für die Dateisuche, eine Zahl zwischen 0 und 1.
Zahlen näher bei 1 versuchen, nur die relevantesten Ergebnisse zurückzugeben, können aber weniger Ergebnisse liefern.
No 0
type enum Der Typ des Dateisuchtools. Immer file_search.

Mögliche Werte: file_search
Ja
vector_store_ids array Die IDs des Vektors, die durchsucht werden sollen, speichern.
Ja

FileSearchToolCall

Die Ergebnisse eines Dateisuchwerkzeugs aufrufen.

Name Typ Beschreibung Erforderlich Vorgabe
id string Die eindeutige ID des Dateisuchwerkzeugs aufruft.
Ja
Abfragen array Die Abfragen wurden verwendet, um nach Dateien zu suchen.
Ja
results array Die Ergebnisse des Dateisuchwerkzeugs rufen auf.
No
Status enum Der Status des Dateisuchwerkzeugaufrufs. Einer von in_progress, searching, incomplete oder failed,

Mögliche Werte: in_progress, searching, completed, incomplete, failed
Ja
type enum Der Typ des Dateisuch-Tool-Aufrufs. Immer file_search_call.

Mögliche Werte: file_search_call
Ja

FunctionTool

Definiert eine Funktion in deinem eigenen Code, den das Modell aufrufen kann.

Name Typ Beschreibung Erforderlich Vorgabe
Beschreibung string Eine Beschreibung der Funktion. Wird vom Modell verwendet, um zu bestimmen, ob die Funktion aufgerufen werden soll oder nicht.
No
Name string Der Name der Funktion, die aufgerufen werden soll.
Ja
parameters Objekt Ein JSON-Schema-Objekt, das die Parameter der Funktion beschreibt.
Ja
strict Boolescher Wert Ob eine strikte Parametervalidierung durchgesetzt werden soll. Standard.true
Ja
type enum Der Typ des Funktionswerkzeugs. Immer function.

Mögliche Werte: function
Ja

FunctionToolCall

Ein Werkzeugaufruf, um eine Funktion auszuführen.

Name Typ Beschreibung Erforderlich Vorgabe
Argumente string Eine JSON-Zeichenkette der Argumente, die an die Funktion übergeben werden sollen.
Ja
call_id string Die eindeutige ID des vom Modell generierten Funktionswerkzeugaufrufs.
Ja
id string Die eindeutige ID des Aufrufs des Funktionswerkzeugs.
Ja
Name string Der Name der zu ausführenden Funktion.
Ja
Status enum Der Status des Gegenstands. Einer von in_progress, completed, oder incomplete. Wird angezeigt, wenn Items über die API zurückgegeben werden.

Mögliche Werte: in_progress, completed, incomplete
No
type enum Der Typ des Funktionswerkzeugaufrufs. Immer function_call.

Mögliche Werte: function_call
Ja

FunctionToolCallOutput

Die Ausgabe eines Funktionswerkzeugaufrufs.

Name Typ Beschreibung Erforderlich Vorgabe
call_id string Die eindeutige ID des vom Modell generierten Funktionswerkzeugaufrufs.
Ja
id string Die eindeutige ID des Aufrufs des Funktionswerkzeugs. Wird ausgefüllt, wenn dieses Element über die API zurückgegeben wird.
No
Ausgabe string Ein JSON-String der Ausgabe des Funktionswerkzeugaufrufs.
Ja
Status enum Der Status des Gegenstands. Einer von in_progress, completed, oder incomplete. Wird angezeigt, wenn Items über die API zurückgegeben werden.

Mögliche Werte: in_progress, completed, incomplete
No
type enum Der Typ des Funktionswerkzeugs ruft die Ausgabe auf. Immer function_call_output.

Mögliche Werte: function_call_output
Ja

FunctionToolCallOutputResource

Name Typ Beschreibung Erforderlich Vorgabe
call_id string Die eindeutige ID des vom Modell generierten Funktionswerkzeugaufrufs.
Ja
id string Die eindeutige ID des Funktionsaufruf-Tool-Outputs.
Ja
Ausgabe string Ein JSON-String der Ausgabe des Funktionswerkzeugaufrufs.
Ja
Status enum Der Status des Gegenstands. Einer von in_progress, completed, oder incomplete. Wird angezeigt, wenn Items über die API zurückgegeben werden.

Mögliche Werte: in_progress, completed, incomplete
No
type enum Der Typ des Funktionswerkzeugs ruft die Ausgabe auf. Immer function_call_output.

Mögliche Werte: function_call_output
Ja

includable

Geben Sie zusätzliche Ausgabedaten an, die in die Modellantwort aufgenommen werden sollen. Derzeit unterstützte Werte sind:

  • file_search_call.results: Fügen Sie die Suchergebnisse des Dateisuchwerkzeugaufrufs ein.
  • message.input_image.image_url: Fügen Sie Bild-URLs aus der Eingabenachricht hinzu.
  • computer_call_output.output.image_url: Bild-URLs aus der Ausgabe des Computeraufrufs einfügen.
Eigentum Wert
Beschreibung Geben Sie zusätzliche Ausgabedaten an, die in die Modellantwort aufgenommen werden sollen. Derzeit unterstützte Werte sind:
- file_search_call.results: Fügen Sie die Suchergebnisse des Dateisuchwerkzeugaufrufs ein.
- message.input_image.image_url: Fügen Sie Bild-URLs aus der Eingabenachricht hinzu.
- computer_call_output.output.image_url: Bild-URLs aus der Ausgabe des Computeraufrufs einfügen.
Typ string
Werte file_search_call.results
message.input_image.image_url
computer_call_output.output.image_url

InputAudio

Ein Audioeingang zum Modell.

Name Typ Beschreibung Erforderlich Vorgabe
data string Base64-kodierte Audiodaten.
Ja
Format enum Das Format der Audiodaten. Derzeit unterstützte Formate sind mp3 und wav.

Mögliche Werte: mp3, wav
Ja
type enum Der Typ des Eingabeelements. Immer input_audio.

Mögliche Werte: input_audio
Ja

InputContent

Diese Komponente kann eine der folgenden sein:

InputFile

Eine Dateieingabe für das Modell.

Name Typ Beschreibung Erforderlich Vorgabe
file_data string Der Inhalt der Datei, die an das Modell gesendet werden soll.
No
Datei-ID string Die ID der Datei, die an das Modell gesendet werden soll.
No
filename string Der Name der Datei, die an das Modell gesendet werden soll.
No
type enum Der Typ des Eingabeelements. Immer input_file.

Mögliche Werte: input_file
Ja

InputImage

Eine Bildeingabe für das Modell.

Name Typ Beschreibung Erforderlich Vorgabe
detail enum Das Detailniveau des Bildes, das an das Modell gesendet werden soll. Einer von high, low, oder auto. Standardmäßig gilt auto.

Mögliche Werte: high, low, auto
Ja
Datei-ID string Die ID der Datei, die an das Modell gesendet werden soll.
No
image_url string Die URL des Bildes, das an das Modell gesendet werden soll. Eine vollständig qualifizierte URL oder base64-kodiertes Bild in einer Daten-URL.
No
type enum Der Typ des Eingabeelements. Immer input_image.

Mögliche Werte: input_image
Ja

InputItem

Diese Komponente kann eine der folgenden sein:

Eingabenachricht

Eine Nachrichteneingabe an das Modell mit einer Rolle, die eine Instruktion angibt, die der Hierarchie folgt. Anweisungen, die mit der oder developer Rolle system gegeben werden, haben Vorrang vor den Anweisungen der jeweiligen user Rolle.

Name Typ Beschreibung Erforderlich Vorgabe
Inhalt InputMessageContentList Eine Liste von einem oder mehreren Eingabeelementen für das Modell, die unterschiedliche Inhalte enthalten
types.
Ja
Rolle enum Die Rolle der Nachrichteneingabe. Einer von user, system, oder developer.

Mögliche Werte: user, system, developer
Ja
Status enum Der Status des Artikels. Einer von in_progress, completed, oder incomplete. Wird angezeigt, wenn Items über die API zurückgegeben werden.

Mögliche Werte: in_progress, completed, incomplete
No
type enum Der Typ der Nachrichteneingabe. Immer auf gestellt message.

Mögliche Werte: message
No

InputMessageContentList

Eine Liste eines oder mehrerer Eingabeelemente für das Modell, die verschiedene Inhaltstypen enthalten.

Für diese Komponente sind keine Eigenschaften definiert.

InputMessageResource

Name Typ Beschreibung Erforderlich Vorgabe
Inhalt InputMessageContentList Eine Liste von einem oder mehreren Eingabeelementen für das Modell, die unterschiedliche Inhalte enthalten
types.
Ja
id string Die eindeutige ID der Nachrichteneingabe.
Ja
Rolle enum Die Rolle der Nachrichteneingabe. Einer von user, system, oder developer.

Mögliche Werte: user, system, developer
Ja
Status enum Der Status des Artikels. Einer von in_progress, completed, oder incomplete. Wird angezeigt, wenn Items über die API zurückgegeben werden.

Mögliche Werte: in_progress, completed, incomplete
No
type enum Der Typ der Nachrichteneingabe. Immer auf gestellt message.

Mögliche Werte: message
No

InputText

Eine Texteingabe für das Modell.

Name Typ Beschreibung Erforderlich Vorgabe
Text string Die Texteingabe für das Modell.
Ja
type enum Der Typ des Eingabeelements. Immer input_text.

Mögliche Werte: input_text
Ja

Element

Ein Inhaltselement wird verwendet, um eine Antwort zu erzeugen.

Diese Komponente kann eine der folgenden sein:

ItemReference

Eine interne Kennung für ein Element zum Referenzieren.

Name Typ Beschreibung Erforderlich Vorgabe
id string Die ID des Artikels, auf den man sich beziehen kann.
Ja
type enum Die Art des Artikels, auf den man sich beziehen sollte. Immer item_reference.

Mögliche Werte: item_reference
Ja

ItemResource

Ein Inhaltselement wird verwendet, um eine Antwort zu erzeugen.

Diese Komponente kann eine der folgenden sein:

KeyPress

Eine Sammlung von Tastendrücken, die das Modell ausführen möchte.

Name Typ Beschreibung Erforderlich Vorgabe
keys array Die Kombination der Tasten, die das Modell anfordert, gedrückt zu werden. Dies ist ein Array von Strings, von denen jeder einen Schlüssel darstellt.
Ja
type enum Spezifiziert den Ereignistyp. Für eine Tastendruckaktion ist diese Eigenschaft immer auf keypressgesetzt.

Mögliche Werte: keypress
Ja

Metadaten

Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern und Objekte über die API oder das Dashboard abzufragen.

Tasten sind Zeichenketten mit einer maximalen Länge von 64 Zeichen. Werte sind Zeichenketten mit einer maximalen Länge von 512 Zeichen.

Für diese Komponente sind keine Eigenschaften definiert.

ModelResponseProperties

Name Typ Beschreibung Erforderlich Vorgabe
metadata Metadata Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern und Objekte über die API oder das Dashboard abzufragen.

Tasten sind Zeichenketten mit einer maximalen Länge von 64 Zeichen. Werte sind Zeichenketten mit einer maximalen Länge von 512 Zeichen.
No
Modell string Modell, das zur Erzeugung der Antworten verwendet wird. No
Temperatur number Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen.
Wir empfehlen im Allgemeinen, dies zu ändern oder top_p , aber nicht beides.
No 1
top_p number Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden.

Wir empfehlen im Allgemeinen, dies zu ändern oder temperature , aber nicht beides.
No 1
user string Eine eindeutige Identifikator, die Ihren Endnutzer repräsentiert und OpenAI helfen kann, Missbrauch zu überwachen und zu erkennen. .
No

Verschieben

Eine Mausbewegung.

Name Typ Beschreibung Erforderlich Vorgabe
type enum Spezifiziert den Ereignistyp. Für eine Bewegungsaktion ist diese Eigenschaft immer auf movegesetzt.

Mögliche Werte: move
Ja
x Ganzzahl Die x-Koordinate, zu der man wechseln soll.
Ja
Y Ganzzahl Die y-Koordinate, zu der man wechseln soll.
Ja

OutputAudio

Ein Audioausgang vom Modell.

Name Typ Beschreibung Erforderlich Vorgabe
data string Base64-kodierte Audiodaten aus dem Modell.
Ja
Abschrift string Das Transkript der Audiodaten aus dem Modell.
Ja
type enum Die Art des Ausgangsaudios. Immer output_audio.

Mögliche Werte: output_audio
Ja

OutputContent

Diese Komponente kann eine der folgenden sein:

OutputItem

Name Typ Beschreibung Erforderlich Vorgabe
action ComputerAction Ja
Argumente string Eine JSON-Zeichenkette der Argumente, die an die Funktion übergeben werden sollen.
Ja
call_id string Ein Identifikator, der beim Antworten auf den Werkzeugaufruf mit Ausgabe verwendet wird.
Ja
Inhalt array Rationalisieren des Textinhalts.
Ja
id string Der eindeutige Identifikator des Argumentationsins.
Ja
Name string Der Name der zu ausführenden Funktion.
Ja
pending_safety_checks array Die ausstehenden Sicherheitskontrollen für den Computeranruf.
Ja
Abfragen array Die Abfragen wurden verwendet, um nach Dateien zu suchen.
Ja
results array Die Ergebnisse des Dateisuchwerkzeugs rufen auf.
No
Rolle enum Die Rolle der Ausgabenachricht. Immer assistant.

Mögliche Werte: assistant
Ja
Status enum Der Status des Gegenstands. Einer von in_progress, completed, oder incomplete. Wird angezeigt, wenn Items über die API zurückgegeben werden.

Mögliche Werte: in_progress, completed, incomplete
Ja
type enum Die Art des Objekts. Immer reasoning.

Mögliche Werte: reasoning
Ja

OutputMessage

Eine Ausgabemeldung vom Modell.

Name Typ Beschreibung Erforderlich Vorgabe
Inhalt array Der Inhalt der Ausgabebotschaft.
Ja
id string Die eindeutige ID der Ausgabenachricht.
Ja
Rolle enum Die Rolle der Ausgabenachricht. Immer assistant.

Mögliche Werte: assistant
Ja
Status enum Der Status der Nachrichteneingabe. Einer von in_progress, completed, oder incomplete. Gefüllt, wenn Eingabeeinträge über die API zurückgegeben werden.

Mögliche Werte: in_progress, completed, incomplete
Ja
type enum Der Typ der Ausgabenachricht. Immer message.

Mögliche Werte: message
Ja

OutputText

Eine Textausgabe vom Modell.

Name Typ Beschreibung Erforderlich Vorgabe
annotations array Die Annotationen der Textausgabe.
Ja
Text string Die Textausgabe vom Modell.
Ja
type enum Der Typ des Ausgabetextes. Immer output_text.

Mögliche Werte: output_text
Ja

RealtimeSessionCreateRequest

Echtzeit-Konfiguration von Sitzungsobjekten.

Name Typ Beschreibung Erforderlich Vorgabe
input_audio_format enum Das Format des Eingabeaudios. Optionen sind pcm16, g711_ulaw, oder g711_alaw.
Für pcm16muss das Eingangsaudio 16-Bit-PCM mit einer Abtastrate von 24 kHz, Einkanal-(Mono) und Little-Endian-Byte-Ordnung sein.

Mögliche Werte: pcm16, g711_ulaw, g711_alaw
No
input_audio_noise_reduction Objekt Konfiguration zur Rauschreduktion des Eingangs-Audios. Dieser kann auf null ausgeschaltet eingestellt werden.
Rauschunterdrückung filtert Audio, der dem Eingangs-Audiopuffer hinzugefügt wird, bevor er an VAD und das Modell gesendet wird.
Das Filtern des Audios kann die Genauigkeit von VAD und Kurvenerkennung verbessern (Fehlalarme reduzieren) und die Leistung modellieren, indem die Wahrnehmung des Eingabetons verbessert wird.
No
└– Typ enum Art der Lärmunterdrückung. near_field ist für nah sprechende Mikrofone wie Kopfhörer, far_field ist für Fernfeldmikrofone wie Laptop- oder Konferenzraummikrofone.

Mögliche Werte: near_field, far_field
No
input_audio_transcription Objekt Die Konfiguration für die Eingangs-Audiotranskription ist standardmäßig auf aus eingestellt und kann so null eingestellt werden, dass sie sich nach Einschalten ausschaltet. Eingabe-Audiotranskription ist nicht native im Modell, da das Modell Audio direkt konsumiert. Die Transkription läuft asynchron über das Transkriptions-Endpunkt und sollte als Leitfaden für die Eingabe-Audioinhalte behandelt werden, statt als genau das, was das Modell gehört hat. Der Kunde kann optional die Sprache und den Prompt für die Transkription einstellen; diese bieten dem Transkriptionsdienst zusätzliche Orientierung.
No
└– Sprache string Die Sprache des eingegebenen Audios. Die Bereitstellung der Eingabesprache im ISO-639-1 (z. B. en) Format verbessert die Genauigkeit und Latenz.
No
└─ Modell string Das Modell für die Transkription, aktuelle Optionen sind gpt-4o-transcribe, gpt-4o-mini-transcribe, , gpt-4o-mini-transcribe-2025-12-15und whisper-1.
No
└– Eingabeaufforderung string Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen.
Für whisper-1, ist der Prompt eine Liste von Schlüsselwörtern.
Für gpt-4o-transcribe Modelle ist die Aufforderung eine Freitextzeichenkette, zum Beispiel "erwarten Sie Wörter, die mit Technologie zu tun haben".
No
Anweisungen string Die Standard-Systeminstruktionen (d. h. Systemnachricht) wurden vorangestellt, um Modellaufrufe zu erstellen. Dieses Feld ermöglicht es dem Client, das Modell anhand der gewünschten Antworten zu steuern. Das Modell kann zum Inhalt und Format der Antwort angewiesen werden (z. B. "sehr prägnant sein", "freundlich handeln", "hier sind Beispiele für gute Antworten") und zum Audioverhalten (z. B. "schnell sprechen", "Emotion in deine Stimme einbringen", "häufig lachen"). Die Anweisungen werden nicht garantiert vom Modell befolgt, aber sie geben dem Modell Hinweise auf das gewünschte Verhalten.

Beachten Sie, dass der Server Standardbefehle setzt, die verwendet werden, wenn dieses Feld nicht gesetzt ist und zu Beginn der Sitzung im session.created Event sichtbar sind.
No
max_response_output_tokens Ganzzahl oder String Maximale Anzahl von Ausgabetoken für eine einzelne Assistentenantwort, einschließlich Werkzeugaufrufe. Geben Sie eine ganze Zahl zwischen 1 und 4096 an, um die Ausgabetoken zu begrenzen oder inf für die maximal verfügbaren Token für ein bestimmtes Modell. Standardmäßig gilt inf.
No
modalities Die Menge der Modalitäten, mit denen das Modell antworten kann. Um Audio zu deaktivieren, setze dies auf ["text"].
No
Modell string Der Name der für diese Sitzung verwendeten Einsatz.
No
output_audio_format enum Das Format der Ausgabe des Audios. Optionen sind pcm16, g711_ulaw, oder g711_alaw.
Für pcm16wird das Ausgangsaudio mit einer Frequenz von 24 kHz abgetastet.

Mögliche Werte: pcm16, g711_ulaw, g711_alaw
No
Temperatur number Stichprobentemperatur für das Modell, begrenzt auf [0,6, 1,2]. Für Audiomodelle wird eine Temperatur von 0,8 für die beste Leistung sehr empfohlen.
No 0.8
tool_choice string Wie das Modell Werkzeuge auswählt. Optionen sind auto, none, , requiredoder geben Sie eine Funktion an.
No auto
tools array Werkzeuge (Funktionen), die dem Modell zur Verfügung stehen. No
turn_detection Objekt Konfiguration für Zugerkennung, entweder Server-VAD oder semantisches VAD. Dies kann auf null deaktiviert eingestellt werden, wobei der Client die Modellantwort manuell auslösen muss.
Server-VAD bedeutet, dass das Modell den Beginn und das Ende der Sprache basierend auf der Lautstärke erkennt und am Ende der Benutzersprache antwortet.
Semantisches VAD ist fortschrittlicher und verwendet ein Dreherkennungsmodell (in Verbindung mit VAD), um semantisch zu schätzen, ob der Benutzer mit dem Sprechen fertig ist, und setzt dann dynamisch eine Auszeit basierend auf dieser Wahrscheinlichkeit. Wenn zum Beispiel der User-Audio mit uhhmabklingt, wird das Modell eine geringe Wahrscheinlichkeit für das Ende der Zuge erzielen und länger warten, bis der Benutzer weiterspricht. Das kann für natürlichere Gespräche nützlich sein, kann aber eine höhere Latenz haben.
No
└– create_response Boolescher Wert Ob automatisch eine Antwort generiert werden soll, wenn ein VAD-Stopp-Event auftritt.
No Richtig
└– Eifer enum Wird nur für den semantic_vad Modus verwendet. Die Bereitschaft des Modells zu reagieren. low Er wartet länger, bis der Nutzer weiterspricht, antwortet high schneller. auto ist der Standard und äquivalent zu medium.

Mögliche Werte: low, medium, high, auto
No
└– interrupt_response Boolescher Wert Ob man eine laufende Antwort automatisch unterbrechen soll, die zur Standardkonversation (d. h. conversation von auto) führt, wenn ein VAD-Startereignis auftritt.
No Richtig
└– prefix_padding_ms Ganzzahl Wird nur für den server_vad Modus verwendet. Menge an Audio, die vor der Erkennung der Sprache (in Millisekunden) durch das VAD enthalten sein sollte. Standardmäßig liegt es auf 300 ms.
No
└– Dauer_der_Stille_in_ms Ganzzahl Wird nur für den server_vad Modus verwendet. Dauer der Stille zur Erkennung des Sprachstopps (in Millisekunden). Standardmäßig 500 ms. Bei kürzeren Werten reagiert das Modell schneller, kann aber bei kurzen Pausen des Nutzers eingreifen.
No
└– Schwellenwert number Wird nur für den server_vad Modus verwendet. Aktivierungsschwelle für VAD (0,0 bis 1,0) liegt standardmäßig bei 0,5. Ein höherer Schwellenwert erfordert lauteren Ton, um das Modell zu aktivieren, und kann daher in lauten Umgebungen besser abschneiden.
No
└– Typ enum Art der Abzugserkennung.

Mögliche Werte: server_vad, semantic_vad
No
Stimme VoiceIdsShared No

RealtimeSessionCreateResponse

Eine neue Echtzeit-Session-Konfiguration mit einem flüchtigen Schlüssel. Die Standard-TTL für Tasten beträgt eine Minute.

Name Typ Beschreibung Erforderlich Vorgabe
client_secret Objekt Ephemeraler Schlüssel, der von der API zurückgegeben wird. Ja
└– abläuft_am Ganzzahl Zeitstempel für den Ablauf des Tokens. Derzeit laufen alle Token nach einer Minute ab.
No
└– Wert string Ephemeraler Schlüssel, der in Client-Umgebungen zur Authentifizierung von Verbindungen zur Echtzeit-API verwendet werden kann. Verwenden Sie dies in clientseitigen Umgebungen anstelle eines Standard-API-Tokens, das nur serverseitig verwendet werden sollte.
No
input_audio_format string Das Format des Eingabeaudios. Optionen sind pcm16, g711_ulaw, oder g711_alaw.
No
input_audio_transcription Objekt Die Konfiguration für die Eingangs-Audiotranskription ist standardmäßig auf aus eingestellt und kann so null eingestellt werden, dass sie sich nach Einschalten ausschaltet. Eingabe-Audiotranskription ist nicht native im Modell, da das Modell Audio direkt konsumiert. Die Transkription läuft asynchron über Whisper und sollte als grobe Anleitung betrachtet werden, statt als die vom Modell verstandene Darstellung.
No
└─ Modell string Das für die Transkription whisper-1 verwendete Modell ist das einzige derzeit unterstützte Modell.
No
Anweisungen string Die Standard-Systeminstruktionen (d. h. Systemnachricht) wurden vorangestellt, um Modellaufrufe zu erstellen. Dieses Feld ermöglicht es dem Client, das Modell anhand der gewünschten Antworten zu steuern. Das Modell kann in Bezug auf Antwortinhalte und -format (z. B. "sehr knapp sein", "freundlich handeln", "hier sind Beispiele guter Antworten") und auf Audioverhalten (z. B. "schnell sprechen", "Emotion in deine Stimme einbringen", "häufig lachen"). Die Anweisungen werden nicht garantiert vom Modell befolgt, aber sie geben dem Modell Hinweise auf das gewünschte Verhalten.
Beachten Sie, dass der Server Standardbefehle setzt, die verwendet werden, wenn dieses Feld nicht gesetzt ist und zu Beginn der Sitzung im session.created Event sichtbar sind.
No
max_response_output_tokens Ganzzahl oder String Maximale Anzahl von Ausgabetoken für eine einzelne Assistentenantwort, einschließlich Werkzeugaufrufe. Geben Sie eine ganze Zahl zwischen 1 und 4096 an, um die Ausgabetoken zu begrenzen oder inf für die maximal verfügbaren Token für ein bestimmtes Modell. Standardmäßig gilt inf.
No
modalities Die Menge der Modalitäten, mit denen das Modell antworten kann. Um Audio zu deaktivieren, setze dies auf ["text"].
No
output_audio_format string Das Format der Ausgabe des Audios. Optionen sind pcm16, g711_ulaw, oder g711_alaw.
No
Temperatur number Stichprobentemperatur für das Modell, begrenzt auf [0,6, 1,2]. Standardmäßig auf 0,8 eingestellt.
No
tool_choice string Wie das Modell Werkzeuge auswählt. Optionen sind auto, none, , requiredoder geben Sie eine Funktion an.
No
tools array Werkzeuge (Funktionen), die dem Modell zur Verfügung stehen. No
turn_detection Objekt Konfiguration für Abbiegungserkennung. Kann auf Schalten eingestellt null werden. Server-VAD bedeutet, dass das Modell den Beginn und das Ende der Sprache basierend auf der Lautstärke erkennt und am Ende der Benutzersprache antwortet.
No
└– prefix_padding_ms Ganzzahl Menge an Audio, die vor der Erkennung der Sprache (in Millisekunden) durch das VAD enthalten sein sollte. Standardmäßig liegt es auf 300 ms.
No
└– Dauer_der_Stille_in_ms Ganzzahl Dauer der Stille zur Erkennung des Sprachstopps (in Millisekunden). Standardmäßig 500 ms. Bei kürzeren Werten reagiert das Modell schneller, kann aber bei kurzen Pausen des Nutzers eingreifen.
No
└– Schwellenwert number Aktivierungsschwelle für VAD (0,0 bis 1,0) liegt standardmäßig bei 0,5. Ein höherer Schwellenwert erfordert lauteren Ton, um das Modell zu aktivieren, und kann daher in lauten Umgebungen besser abschneiden.
No
└– Typ string Die Art der Abzugserkennung wird derzeit nur server_vad unterstützt.
No
Stimme VoiceIdsShared No

RealtimeTranscriptionSessionCreateRequest

Echtzeit-Konfiguration von Transkriptionssitzungsobjekten.

Name Typ Beschreibung Erforderlich Vorgabe
include array Die Sammlung von Elementen, die in die Transkription aufgenommen werden sollten. Derzeit verfügbare Artikel sind:
- item.input_audio_transcription.logprobs
No
input_audio_format enum Das Format des Eingabeaudios. Optionen sind pcm16, g711_ulaw, oder g711_alaw.
Für pcm16muss das Eingangsaudio 16-Bit-PCM mit einer Abtastrate von 24 kHz, Einkanal-(Mono) und Little-Endian-Byte-Ordnung sein.

Mögliche Werte: pcm16, g711_ulaw, g711_alaw
No
input_audio_noise_reduction Objekt Konfiguration zur Rauschreduktion des Eingangs-Audios. Dieser kann auf null ausgeschaltet eingestellt werden.
Rauschunterdrückung filtert Audio, der dem Eingangs-Audiopuffer hinzugefügt wird, bevor er an VAD und das Modell gesendet wird.
Das Filtern des Audios kann die Genauigkeit von VAD und Kurvenerkennung verbessern (Fehlalarme reduzieren) und die Leistung modellieren, indem die Wahrnehmung des Eingabetons verbessert wird.
No
└– Typ enum Art der Lärmunterdrückung. near_field ist für nah sprechende Mikrofone wie Kopfhörer, far_field ist für Fernfeldmikrofone wie Laptop- oder Konferenzraummikrofone.

Mögliche Werte: near_field, far_field
No
input_audio_transcription Objekt Konfiguration für Eingabe-Audio-Transkription. Der Kunde kann optional die Sprache und den Prompt für die Transkription einstellen; diese bieten dem Transkriptionsdienst zusätzliche Orientierung.
No
└– Sprache string Die Sprache des eingegebenen Audios. Die Bereitstellung der Eingabesprache im ISO-639-1 (z. B. en) Format verbessert die Genauigkeit und Latenz.
No
└─ Modell enum Das Modell für die Transkription, aktuelle Optionen sind gpt-4o-transcribe, gpt-4o-transcribe-diarize, , gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15und whisper-1.

Mögliche Werte: gpt-4o-transcribe, gpt-4o-transcribe-diarize, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15, whisper-1
No
└– Eingabeaufforderung string Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen.
Für whisper-1, ist der Prompt eine Liste von Schlüsselwörtern.
Für gpt-4o-transcribe Modelle ist die Aufforderung eine Freitextzeichenkette, zum Beispiel "erwarten Sie Wörter, die mit Technologie zu tun haben".
No
modalities Die Menge der Modalitäten, mit denen das Modell antworten kann. Um Audio zu deaktivieren, setze dies auf ["text"].
No
turn_detection Objekt Konfiguration für Zugerkennung, entweder Server-VAD oder semantisches VAD. Dies kann auf null deaktiviert eingestellt werden, wobei der Client die Modellantwort manuell auslösen muss.
Server-VAD bedeutet, dass das Modell den Beginn und das Ende der Sprache basierend auf der Lautstärke erkennt und am Ende der Benutzersprache antwortet.
Semantisches VAD ist fortschrittlicher und verwendet ein Dreherkennungsmodell (in Verbindung mit VAD), um semantisch zu schätzen, ob der Benutzer mit dem Sprechen fertig ist, und setzt dann dynamisch eine Auszeit basierend auf dieser Wahrscheinlichkeit. Wenn zum Beispiel der User-Audio mit uhhmabklingt, wird das Modell eine geringe Wahrscheinlichkeit für das Ende der Zuge erzielen und länger warten, bis der Benutzer weiterspricht. Das kann für natürlichere Gespräche nützlich sein, kann aber eine höhere Latenz haben.
No
└– create_response Boolescher Wert Ob automatisch eine Antwort generiert werden soll, wenn ein VAD-Stopp-Event auftritt. Für Transkriptionssitzungen nicht verfügbar.
No Richtig
└– Eifer enum Wird nur für den semantic_vad Modus verwendet. Die Bereitschaft des Modells zu reagieren. low Er wartet länger, bis der Nutzer weiterspricht, antwortet high schneller. auto ist der Standard und äquivalent zu medium.

Mögliche Werte: low, medium, high, auto
No
└– interrupt_response Boolescher Wert Ob man eine laufende Antwort automatisch unterbrechen soll, die zur Standardkonversation (d. h. conversation von auto) führt, wenn ein VAD-Startereignis auftritt. Für Transkriptionssitzungen nicht verfügbar.
No Richtig
└– prefix_padding_ms Ganzzahl Wird nur für den server_vad Modus verwendet. Menge an Audio, die vor der Erkennung der Sprache (in Millisekunden) durch das VAD enthalten sein sollte. Standardmäßig liegt es auf 300 ms.
No
└– Dauer_der_Stille_in_ms Ganzzahl Wird nur für den server_vad Modus verwendet. Dauer der Stille zur Erkennung des Sprachstopps (in Millisekunden). Standardmäßig 500 ms. Bei kürzeren Werten reagiert das Modell schneller, kann aber bei kurzen Pausen des Nutzers eingreifen.
No
└– Schwellenwert number Wird nur für den server_vad Modus verwendet. Aktivierungsschwelle für VAD (0,0 bis 1,0) liegt standardmäßig bei 0,5. Ein höherer Schwellenwert erfordert lauteren Ton, um das Modell zu aktivieren, und kann daher in lauten Umgebungen besser abschneiden.
No
└– Typ enum Art der Abzugserkennung.

Mögliche Werte: server_vad, semantic_vad
No

RealtimeTranscriptionSessionCreateResponse

Eine neue Echtzeit-Transkriptionssession-Konfiguration.

Wenn eine Sitzung auf dem Server über die REST-API erstellt wird, enthält das Sitzungsobjekt auch einen ephemeren Schlüssel. Die Standard-TTL für Tasten beträgt eine Minute. Diese Eigenschaft ist nicht vorhanden, wenn eine Sitzung über die WebSocket-API aktualisiert wird.

Name Typ Beschreibung Erforderlich Vorgabe
client_secret Objekt Ephemeraler Schlüssel, der von der API zurückgegeben wird. Nur vorhanden, wenn die Sitzung auf dem Server über die REST-API erstellt wird.
Ja
└– abläuft_am Ganzzahl Zeitstempel für den Ablauf des Tokens. Derzeit laufen alle Token nach einer Minute ab.
No
└– Wert string Ephemeraler Schlüssel, der in Client-Umgebungen zur Authentifizierung von Verbindungen zur Echtzeit-API verwendet werden kann. Verwenden Sie dies in clientseitigen Umgebungen anstelle eines Standard-API-Tokens, das nur serverseitig verwendet werden sollte.
No
input_audio_format string Das Format des Eingabeaudios. Optionen sind pcm16, g711_ulaw, oder g711_alaw.
No
input_audio_transcription Objekt Konfiguration des Transkriptionsmodells.
No
└– Sprache string Die Sprache des eingegebenen Audios. Die Bereitstellung der Eingabesprache im ISO-639-1 (z. B. en) Format verbessert die Genauigkeit und Latenz.
No
└─ Modell enum Das Modell für die Transkription. Kann , gpt-4o-transcribe, gpt-4o-mini-transcribe, oder gpt-4o-mini-transcribe-2025-12-15seinwhisper-1.

Mögliche Werte: gpt-4o-transcribe, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15, whisper-1
No
└– Eingabeaufforderung string Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen. Der Prompt sollte mit der Audiosprache übereinstimmen.
No
modalities Die Menge der Modalitäten, mit denen das Modell antworten kann. Um Audio zu deaktivieren, setze dies auf ["text"].
No
turn_detection Objekt Konfiguration für Abbiegungserkennung. Kann auf Schalten eingestellt null werden. Server-VAD bedeutet, dass das Modell den Beginn und das Ende der Sprache basierend auf der Lautstärke erkennt und am Ende der Benutzersprache antwortet.
No
└– prefix_padding_ms Ganzzahl Menge an Audio, die vor der Erkennung der Sprache (in Millisekunden) durch das VAD enthalten sein sollte. Standardmäßig liegt es auf 300 ms.
No
└– Dauer_der_Stille_in_ms Ganzzahl Dauer der Stille zur Erkennung des Sprachstopps (in Millisekunden). Standardmäßig 500 ms. Bei kürzeren Werten reagiert das Modell schneller, kann aber bei kurzen Pausen des Nutzers eingreifen.
No
└– Schwellenwert number Aktivierungsschwelle für VAD (0,0 bis 1,0) liegt standardmäßig bei 0,5. Ein höherer Schwellenwert erfordert lauteren Ton, um das Modell zu aktivieren, und kann daher in lauten Umgebungen besser abschneiden.
No
└– Typ string Die Art der Abzugserkennung wird derzeit nur server_vad unterstützt.
No

Argumentation

Konfigurationsoptionen für Schlussfolgermodelle.

Name Typ Beschreibung Erforderlich Vorgabe
effort ReasoningEffort Begrenzt den Aufwand beim Schließen bei Denkmustern.
Derzeit unterstützte Werte sind low, medium, und high. Eine Reduzierung des Schlussarbeitsaufwands kann zu schnelleren Antworten und weniger Token beim Schließen in einer Antwort führen.
Ja medium
summary enum Eine Zusammenfassung der vom Modell durchgeführten Argumentation. Dies kann nützlich sein, um das Debuggen zu debuggen und den Schlussfolgerungsprozess des Modells zu verstehen.
Einer von concise oder detailed.

Mögliche Werte: concise, detailed
No

ReasoningItem

Eine Beschreibung der Denkkette, die ein Denkmodell bei der Erzeugung einer Antwort verwendet.

Name Typ Beschreibung Erforderlich Vorgabe
Inhalt array Rationalisieren des Textinhalts.
Ja
id string Der eindeutige Identifikator des Argumentationsins.
Ja
Status enum Der Status des Gegenstands. Einer von in_progress, completed, oder incomplete. Wird angezeigt, wenn Items über die API zurückgegeben werden.

Mögliche Werte: in_progress, completed, incomplete
No
type enum Die Art des Objekts. Immer reasoning.

Mögliche Werte: reasoning
Ja

Refusal

Eine Ablehnung des Models.

Name Typ Beschreibung Erforderlich Vorgabe
Weigerung string Die Erklärung zur Ablehnung aus dem Modell.
Ja
type enum Die Art der Ablehnung. Immer refusal.

Mögliche Werte: refusal
Ja

response

Name Typ Beschreibung Erforderlich Vorgabe
erstellt_am number Unix-Zeitstempel (in Sekunden) des Zeitpunktes, an dem diese Antwort erstellt wurde.
Ja
Fehler ResponseError Ein Fehlerobjekt wurde zurückgegeben, wenn das Modell keine Antwort generieren konnte.
Ja
id string Eindeutige Kennung für diese Antwort.
Ja
incomplete_details Objekt Details dazu, warum die Antwort unvollständig ist.
Ja
└– Grund enum Der Grund, warum die Antwort unvollständig ist.
Mögliche Werte: max_output_tokens, content_filter
No
Anweisungen string Fügt eine System- (oder Entwickler-) Nachricht als erstes Element im Kontext des Modells ein.

Wenn man zusammen mit previous_response_idverwendet, werden die Anweisungen aus einer vorherigen Antwort nicht auf die nächste Antwort übernommen. Dadurch ist es einfach, System- (oder Entwickler-) Nachrichten in neuen Antworten auszutauschen.
Ja
max_output_tokens Ganzzahl Eine obere Obergrenze für die Anzahl der Tokens, die für eine Antwort generiert werden können, einschließlich sichtbarer Ausgabetoken und des Gesprächszustands.
No
metadata Metadata Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern und Objekte über die API oder das Dashboard abzufragen.

Tasten sind Zeichenketten mit einer maximalen Länge von 64 Zeichen. Werte sind Zeichenketten mit einer maximalen Länge von 512 Zeichen.
Ja
Modell string Modell, das zur Erzeugung der Antworten verwendet wird. Ja
Objekt enum Der Objekttyp dieser Ressource – immer auf gesetzt response.

Mögliche Werte: response
Ja
Ausgabe array Ein Array von Inhaltselementen, die vom Modell generiert werden.

- Die Länge und Reihenfolge der Elemente im output Array hängt von der Antwort des Modells ab.
- Anstatt auf das erste Element im output Array zuzugreifen und anzunehmen, dass es sich um eine assistant Nachricht mit dem vom Modell generierten Inhalt handelt, könntest du die output_text Eigenschaft verwenden, wo es in SDKs unterstützt wird.
Ja
output_text string SDK-only Convenience-Eigenschaft, die die aggregierten Textausgaben aller output_text Elemente im Array output enthält, falls welche vorhanden sind.
Unterstützt in den Python- und JavaScript-SDKs.
No
Parallele Werkzeugaufrufe Boolescher Wert Ob das Modell Werkzeugaufrufe parallel ausführen soll.
Ja Richtig
previous_response_id string Die eindeutige ID der vorherigen Antwort auf das Modell. Nutzen Sie dies, um Gespräche mit mehreren Runden zu erstellen. No
reasoning Reasoning Konfigurationsoptionen für Schlussfolgermodelle.
No
Status enum Der Status der Reaktionsgenerierung. Einer von completed, failed, , in_progressoder incomplete.

Mögliche Werte: completed, failed, in_progress, incomplete
No
Temperatur number Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen.
Wir empfehlen im Allgemeinen, dies zu ändern oder top_p , aber nicht beides.
Ja 1
Text Objekt Konfigurationsoptionen für eine Textantwort des Modells. Es können Klartext oder strukturierte JSON-Daten sein. Erfahren Sie mehr:
- Texteingaben und -ausgaben
- Strukturierte Ausgaben
No
└─ Format TextResponseFormatConfiguration Ein Objekt, das das Format angibt, das das Modell ausgeben muss.

Die Konfiguration { "type": "json_schema" } aktiviert strukturierte Ausgaben, die sicherstellen, dass das Modell mit dem bereitgestellten JSON-Schema übereinstimmt. Das Standardformat ist { "type": "text" } ohne zusätzliche Optionen.

Nicht empfohlen für GPT-4o und neuere Modelle:

Einstellung aktiviert den { "type": "json_object" } älteren JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültiges JSON ist. Die Verwendung json_schema ist bevorzugt für Modelle, die sie unterstützen.
No
tool_choice ToolChoiceOptions oder ToolChoiceTypes oder ToolChoiceFunction Wie das Modell auswählen sollte, welches Tool (oder welche Werkzeuge) es bei der Generierung einer Antwort verwendet. Sehen Sie sich den Parameter tools an, um zu sehen, welche Werkzeuge das Modell aufrufen kann.
Ja
tools array Ein Array von Werkzeugen, die das Modell aufrufen kann, während es eine Antwort erzeugt. Du kannst angeben, welches Werkzeug du verwenden sollst, indem du den Parameter tool_choice einlegst.

Die zwei Kategorien von Werkzeugen, die Sie dem Modell bereitstellen können, sind:

- Eingebaute Werkzeuge
Ja
top_p number Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden.

Wir empfehlen im Allgemeinen, dies zu ändern oder temperature , aber nicht beides.
Ja 1
truncation enum Die Abschneidungsstrategie, die für die Modellantwort verwendet werden soll.
- auto: Wenn der Kontext dieser und der vorherigen Antwort die Größe des Kontextfensters des Modells übersteigt, wird das Modell die Antwort kürzen, um zum Kontextfenster zu passen, indem es Eingabepunkte mitten im Gespräch platziert.
- disabled (Standard): Wenn eine Modellantwort die Kontextfenstergröße eines Modells überschreitet, schlägt die Anfrage mit einem Fehler von 400 fehl.

Mögliche Werte: auto, disabled
No
Nutzung ResponseUsage Repräsentiert Details zur Tokennutzung, einschließlich Eingabetoken, Ausgabetoken, einer Aufschlüsselung der Ausgabetoken und der insgesamt verwendeten Tokens.
No
user string Eine eindeutige Identifikator, die Ihren Endnutzer repräsentiert und OpenAI helfen kann, Missbrauch zu überwachen und zu erkennen. .
No

ResponseAudioDeltaEvent

Ausgesendet, wenn eine teilweise Audioreaktion vorhanden ist.

Name Typ Beschreibung Erforderlich Vorgabe
delta string Ein Teil von Base64-codierten Antwort-Audiobytes.
Ja
type enum Die Art der Veranstaltung. Immer response.audio.delta.

Mögliche Werte: response.audio.delta
Ja

ResponseAudioDoneEvent

Ausgesendet, wenn die Audioantwort abgeschlossen ist.

Name Typ Beschreibung Erforderlich Vorgabe
type enum Die Art der Veranstaltung. Immer response.audio.done.

Mögliche Werte: response.audio.done
Ja

ResponseAudioTranscriptDeltaEvent

Es wird ausgesendet, wenn ein Teilabschrift des Audios vorhanden ist.

Name Typ Beschreibung Erforderlich Vorgabe
delta string Das teilweise Transkript der Audioantwort.
Ja
type enum Die Art der Veranstaltung. Immer response.audio.transcript.delta.

Mögliche Werte: response.audio.transcript.delta
Ja

ResponseAudioTranscriptDoneEvent

Gesendet, wenn das vollständige Audio-Transkript fertiggestellt ist.

Name Typ Beschreibung Erforderlich Vorgabe
type enum Die Art der Veranstaltung. Immer response.audio.transcript.done.

Mögliche Werte: response.audio.transcript.done
Ja

ResponseCodeInterpreterCallCodeDeltaEvent

Es wird ausgesendet, wenn ein teilweiser Codeschnipsel vom Code-Interpreter hinzugefügt wird.

Name Typ Beschreibung Erforderlich Vorgabe
delta string Der teilweise Codeschnipsel, der vom Code-Interpreter hinzugefügt wurde.
Ja
output_index Ganzzahl Der Index des Ausgabeelements, das der Code-Interpreter aufruft, befindet sich in Bearbeitung.
Ja
type enum Die Art der Veranstaltung. Immer response.code_interpreter_call.code.delta.

Mögliche Werte: response.code_interpreter_call.code.delta
Ja

ResponseCodeInterpreterCallCodeDoneEvent

Gesendet, wenn die Code-Snippet-Ausgabe vom Code-Interpreter finalisiert wird.

Name Typ Beschreibung Erforderlich Vorgabe
code string Das letzte Codeschnipsel, das vom Code-Interpreter ausgegeben wird.
Ja
output_index Ganzzahl Der Index des Ausgabeelements, das der Code-Interpreter aufruft, befindet sich in Bearbeitung.
Ja
type enum Die Art der Veranstaltung. Immer response.code_interpreter_call.code.done.

Mögliche Werte: response.code_interpreter_call.code.done
Ja

ResponseCodeInterpreterCallCompletedEvent

Gesendet, wenn der Code-Interpreter-Aufruf abgeschlossen ist.

Name Typ Beschreibung Erforderlich Vorgabe
code_interpreter_call CodeInterpreterToolCall Ein Toolaufruf, um Code auszuführen.
Ja
output_index Ganzzahl Der Index des Ausgabeelements, das der Code-Interpreter aufruft, befindet sich in Bearbeitung.
Ja
type enum Die Art der Veranstaltung. Immer response.code_interpreter_call.completed.

Mögliche Werte: response.code_interpreter_call.completed
Ja

ResponseCodeInterpreterCallInProgressEvent

Gesendet, wenn ein Code-Interpreter-Aufruf läuft.

Name Typ Beschreibung Erforderlich Vorgabe
code_interpreter_call CodeInterpreterToolCall Ein Toolaufruf, um Code auszuführen.
Ja
output_index Ganzzahl Der Index des Ausgabeelements, das der Code-Interpreter aufruft, befindet sich in Bearbeitung.
Ja
type enum Die Art der Veranstaltung. Immer response.code_interpreter_call.in_progress.

Mögliche Werte: response.code_interpreter_call.in_progress
Ja

ResponseCodeInterpreterCallInterpretingEvent

Es wird ausgesendet, wenn der Code-Interpreter aktiv den Codeausschnitt interpretiert.

Name Typ Beschreibung Erforderlich Vorgabe
code_interpreter_call CodeInterpreterToolCall Ein Toolaufruf, um Code auszuführen.
Ja
output_index Ganzzahl Der Index des Ausgabeelements, das der Code-Interpreter aufruft, befindet sich in Bearbeitung.
Ja
type enum Die Art der Veranstaltung. Immer response.code_interpreter_call.interpreting.

Mögliche Werte: response.code_interpreter_call.interpreting
Ja

ResponseCompletedEvent

Emittiert, wenn die Modellantwort abgeschlossen ist.

Name Typ Beschreibung Erforderlich Vorgabe
response response Ja
type enum Die Art der Veranstaltung. Immer response.completed.

Mögliche Werte: response.completed
Ja

ResponseContentPartAddedEvent

Emittiert, wenn ein neuer Inhaltsteil hinzugefügt wird.

Name Typ Beschreibung Erforderlich Vorgabe
content_index Ganzzahl Der Index des Inhalts, der hinzugefügt wurde.
Ja
item_id string Die ID des Ausgabeelements, zu dem der Inhaltsteil hinzugefügt wurde.
Ja
output_index Ganzzahl Der Index des Ausgabeelements, zu dem der Inhaltsteil hinzugefügt wurde.
Ja
part OutputContent Ja
type enum Die Art der Veranstaltung. Immer response.content_part.added.

Mögliche Werte: response.content_part.added
Ja

ResponseContentPartDoneEvent

Emittiert, wenn ein Inhaltsteil fertig ist.

Name Typ Beschreibung Erforderlich Vorgabe
content_index Ganzzahl Der Index des Inhalts, der erledigt wird.
Ja
item_id string Die ID des Ausgabeelements, zu dem der Inhaltsteil hinzugefügt wurde.
Ja
output_index Ganzzahl Der Index des Ausgabeelements, zu dem der Inhaltsteil hinzugefügt wurde.
Ja
part OutputContent Ja
type enum Die Art der Veranstaltung. Immer response.content_part.done.

Mögliche Werte: response.content_part.done
Ja

ResponseCreatedEvent

Ein Ereignis, das ausgelöst wird, wenn eine Antwort erstellt wird.

Name Typ Beschreibung Erforderlich Vorgabe
response response Ja
type enum Die Art der Veranstaltung. Immer response.created.

Mögliche Werte: response.created
Ja

ResponseError

Ein Fehlerobjekt wurde zurückgegeben, wenn das Modell keine Antwort generieren konnte.

Name Typ Beschreibung Erforderlich Vorgabe
code ResponseErrorCode Der Fehlercode für die Antwort.
Ja
Nachricht string Eine für Menschen lesbare Beschreibung des Fehlers.
Ja

ResponseErrorCode

Der Fehlercode für die Antwort.

Eigentum Wert
Beschreibung Der Fehlercode für die Antwort.
Typ string
Werte server_error
rate_limit_exceeded
invalid_prompt
vector_store_timeout
invalid_image
invalid_image_format
invalid_base64_image
invalid_image_url
image_too_large
image_too_small
image_parse_error
image_content_policy_violation
invalid_image_mode
image_file_too_large
unsupported_image_media_type
empty_image_file
failed_to_download_image
image_file_not_found

ResponseErrorEvent

Es wird ausgesendet, wenn ein Fehler auftritt.

Name Typ Beschreibung Erforderlich Vorgabe
code string Der Fehlercode.
Ja
Nachricht string Die Fehlermeldung.
Ja
param string Der Fehlerparameter.
Ja
type enum Die Art der Veranstaltung. Immer error.

Mögliche Werte: error
Ja

ResponseFailedEvent

Ein Ereignis, das ausgelöst wird, wenn eine Antwort fehlschlägt.

Name Typ Beschreibung Erforderlich Vorgabe
response response Ja
type enum Die Art der Veranstaltung. Immer response.failed.

Mögliche Werte: response.failed
Ja

ResponseFileSearchCallCompletedEvent

Gesendet, wenn ein Dateisuchaufruf abgeschlossen ist (Ergebnisse gefunden).

Name Typ Beschreibung Erforderlich Vorgabe
item_id string Die ID des Ausgabeelements, das der Dateisuchaufruf aufruft, wird initiiert.
Ja
output_index Ganzzahl Der Index des Ausgabeelements, den der Dateisuchaufruf aufruft, wird initiiert.
Ja
type enum Die Art der Veranstaltung. Immer response.file_search_call.completed.

Mögliche Werte: response.file_search_call.completed
Ja

ResponseFileSearchCallInProgressEvent

Gesendet, wenn ein Dateisuchaufruf eingeleitet wird.

Name Typ Beschreibung Erforderlich Vorgabe
item_id string Die ID des Ausgabeelements, das der Dateisuchaufruf aufruft, wird initiiert.
Ja
output_index Ganzzahl Der Index des Ausgabeelements, den der Dateisuchaufruf aufruft, wird initiiert.
Ja
type enum Die Art der Veranstaltung. Immer response.file_search_call.in_progress.

Mögliche Werte: response.file_search_call.in_progress
Ja

ResponseFileSearchCallSearchingEvent

Gesendet, wenn eine Dateisuche gerade gesucht wird.

Name Typ Beschreibung Erforderlich Vorgabe
item_id string Die ID des Ausgabeelements, das der Dateisuchaufruf aufruft, wird initiiert.
Ja
output_index Ganzzahl Der Index des Ausgabeelements, das die Dateisuche aufruft.
Ja
type enum Die Art der Veranstaltung. Immer response.file_search_call.searching.

Mögliche Werte: response.file_search_call.searching
Ja

ResponseFunctionCallArgumentsDeltaEvent

Emittiert, wenn es eine partielle Funktionsaufruf-Delta gibt.

Name Typ Beschreibung Erforderlich Vorgabe
delta string Die Funktionsaufruf-Argumente delta, die hinzugefügt wird.
Ja
item_id string Die ID des Ausgabeelements, zu dem die Funktionsaufruf-Argumente deltan, wird hinzugefügt.
Ja
output_index Ganzzahl Der Index des Ausgabeelements, zu dem die Funktionsaufruf-Argumente delta hinzugefügt werden.
Ja
type enum Die Art der Veranstaltung. Immer response.function_call_arguments.delta.

Mögliche Werte: response.function_call_arguments.delta
Ja

ResponseFunctionCallArgumentsDoneEvent

Emittiert, wenn Funktionsaufruf-Argumente finalisiert werden.

Name Typ Beschreibung Erforderlich Vorgabe
Argumente string Die Funktionsaufruf-Argumente. Ja
item_id string Der Ausweis des Gegenstands. Ja
output_index Ganzzahl Der Index des Ausgangselements. Ja
type enum
Mögliche Werte: response.function_call_arguments.done
Ja

ResponseInProgressEvent

Ausgestrahlt, wenn die Antwort läuft.

Name Typ Beschreibung Erforderlich Vorgabe
response response Ja
type enum Die Art der Veranstaltung. Immer response.in_progress.

Mögliche Werte: response.in_progress
Ja

ResponseIncompleteEvent

Ein Ereignis, das ausgelöst wird, wenn eine Antwort als unvollständig endet.

Name Typ Beschreibung Erforderlich Vorgabe
response response Ja
type enum Die Art der Veranstaltung. Immer response.incomplete.

Mögliche Werte: response.incomplete
Ja

responseItemList

Eine Liste von Response-Punkten.

Name Typ Beschreibung Erforderlich Vorgabe
data array Eine Liste der Elemente, die zur Erzeugung dieser Antwort verwendet wurden. Ja
first_id string Die ID des ersten Punkts auf der Liste. Ja
has_more Boolescher Wert Ob es noch mehr Gegenstände gibt. Ja
last_id string Die ID des letzten Punkts auf der Liste. Ja
Objekt enum Die Art des zurückgegebenen Objekts muss sein list.
Mögliche Werte: list
Ja

ResponseModalities

Ausgabetypen, die das Modell generieren soll. Die meisten Modelle sind in der Lage, Text zu generieren, was standardmäßig ist:

["text"]

Das gpt-4o-audio-preview Modell kann auch zur Audioerzeugung verwendet werden. Um zu verlangen, dass dieses Modell sowohl Text- als auch Audioantworten erzeugt, können Sie verwenden:

["text", "audio"]

Für diese Komponente sind keine Eigenschaften definiert.

ResponseModalitiesTextOnly

Ausgabetypen, die das Modell generieren soll. Die meisten Modelle sind in der Lage, Text zu generieren, was standardmäßig ist:

["text"]

Diese API wird bald weitere Ausgabemodalitäten unterstützen, einschließlich Audio und Bilder.

Für diese Komponente sind keine Eigenschaften definiert.

ResponseOutputItemAddedEvent

Emittiert, wenn ein neues Ausgangselement hinzugefügt wird.

Name Typ Beschreibung Erforderlich Vorgabe
item OutputItem Ja
output_index Ganzzahl Der Index des hinzugefügten Output-Elements.
Ja
type enum Die Art der Veranstaltung. Immer response.output_item.added.

Mögliche Werte: response.output_item.added
Ja

ResponseOutputItemDoneEvent

Emittiert, wenn ein Ausgabepunkt als erledigt markiert wird.

Name Typ Beschreibung Erforderlich Vorgabe
item OutputItem Ja
output_index Ganzzahl Der Index des als erledigten Ausgabepunkt markierten.
Ja
type enum Die Art der Veranstaltung. Immer response.output_item.done.

Mögliche Werte: response.output_item.done
Ja

ResponseProperties

Name Typ Beschreibung Erforderlich Vorgabe
Anweisungen string Fügt eine System- (oder Entwickler-) Nachricht als erstes Element im Kontext des Modells ein.

Wenn man zusammen mit previous_response_idverwendet, werden die Anweisungen aus einer vorherigen Antwort nicht auf die nächste Antwort übernommen. Dadurch ist es einfach, System- (oder Entwickler-) Nachrichten in neuen Antworten auszutauschen.
No
max_output_tokens Ganzzahl Eine obere Obergrenze für die Anzahl der Tokens, die für eine Antwort generiert werden können, einschließlich sichtbarer Ausgabetoken und des Gesprächszustands.
No
previous_response_id string Die eindeutige ID der vorherigen Antwort auf das Modell. Nutzen Sie dies, um Gespräche mit mehreren Runden zu erstellen. No
reasoning Reasoning Konfigurationsoptionen für Schlussfolgermodelle.
No
Text Objekt Konfigurationsoptionen für eine Textantwort des Modells. Es können Klartext oder strukturierte JSON-Daten sein. Erfahren Sie mehr:
- Texteingaben und -ausgaben
- Strukturierte Ausgaben
No
└─ Format TextResponseFormatConfiguration Ein Objekt, das das Format angibt, das das Modell ausgeben muss.

Die Konfiguration { "type": "json_schema" } aktiviert strukturierte Ausgaben, die sicherstellen, dass das Modell mit dem bereitgestellten JSON-Schema übereinstimmt. Das Standardformat ist { "type": "text" } ohne zusätzliche Optionen.

Nicht empfohlen für GPT-4o und neuere Modelle:

Einstellung aktiviert den { "type": "json_object" } älteren JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültiges JSON ist. Die Verwendung json_schema ist bevorzugt für Modelle, die sie unterstützen.
No
tool_choice ToolChoiceOptions oder ToolChoiceTypes oder ToolChoiceFunction Wie das Modell auswählen sollte, welches Tool (oder welche Werkzeuge) es bei der Generierung einer Antwort verwendet. Sehen Sie sich den Parameter tools an, um zu sehen, welche Werkzeuge das Modell aufrufen kann.
No
tools array Ein Array von Werkzeugen, die das Modell aufrufen kann, während es eine Antwort erzeugt. Du kannst angeben, welches Werkzeug du verwenden sollst, indem du den Parameter tool_choice einlegst.

Die zwei Kategorien von Werkzeugen, die Sie dem Modell bereitstellen können, sind:

- Eingebaute Werkzeuge
No
truncation enum Die Abschneidungsstrategie, die für die Modellantwort verwendet werden soll.
- auto: Wenn der Kontext dieser und der vorherigen Antwort die Größe des Kontextfensters des Modells übersteigt, wird das Modell die Antwort kürzen, um zum Kontextfenster zu passen, indem es Eingabepunkte mitten im Gespräch platziert.
- disabled (Standard): Wenn eine Modellantwort die Kontextfenstergröße eines Modells überschreitet, schlägt die Anfrage mit einem Fehler von 400 fehl.

Mögliche Werte: auto, disabled
No

ResponseRefusalDeltaEvent

Gesendet, wenn eine teilweise Ablehnung vorliegt.

Name Typ Beschreibung Erforderlich Vorgabe
content_index Ganzzahl Der Index des Inhaltsteils, zu dem der Ablehnungstext hinzugefügt wird.
Ja
delta string Der Ablehnungstext, der hinzugefügt wird.
Ja
item_id string Die ID des Ausgabeelements, zu dem der Ablehnungstext hinzugefügt wird.
Ja
output_index Ganzzahl Der Index des Ausgabeelements, zu dem der Ablehnungstext hinzugefügt wird.
Ja
type enum Die Art der Veranstaltung. Immer response.refusal.delta.

Mögliche Werte: response.refusal.delta
Ja

ResponseRefusalDoneEvent

Gesendet, wenn der Ablehnungstext finalisiert ist.

Name Typ Beschreibung Erforderlich Vorgabe
content_index Ganzzahl Der Index des Inhalts teilt, dass der Ablehnungstext finalisiert ist.
Ja
item_id string Die ID des Ausgabeelements, in dem der Ablehnungstext steht, wird finalisiert.
Ja
output_index Ganzzahl Der Index des Ausgabeelements, dass der Ablehnungstext abgeschlossen ist.
Ja
Weigerung string Die Ablehnungsnachricht, die finalisiert ist.
Ja
type enum Die Art der Veranstaltung. Immer response.refusal.done.

Mögliche Werte: response.refusal.done
Ja

responseStreamEvent

Name Typ Beschreibung Erforderlich Vorgabe
Anmerkung Annotation Ja
annotation_index Ganzzahl Der Index der hinzugefügten Anmerkung.
Ja
Argumente string Die Funktionsaufruf-Argumente. Ja
code string Der Fehlercode.
Ja
code_interpreter_call CodeInterpreterToolCall Ein Toolaufruf, um Code auszuführen.
Ja
content_index Ganzzahl Der Index des Inhalts teilt, dass der Textinhalt finalisiert ist.
Ja
delta string Das Textdelta, das hinzugefügt wurde.
Ja
item OutputItem Der Ausgabepunkt, der als erledigt markiert wurde.
Ja
item_id string Die ID des Ausgabeelements, in dem der Textinhalt festgelegt ist, ist finalisiert.
Ja
Nachricht string Die Fehlermeldung.
Ja
output_index Ganzzahl Der Index des Ausgabeelements, in dem der Textinhalt festgelegt ist, wird finalisiert.
Ja
param string Der Fehlerparameter.
Ja
part OutputContent Der Inhaltsteil, der erledigt ist.
Ja
Weigerung string Die Ablehnungsnachricht, die finalisiert ist.
Ja
response response Die Antwort, die unvollständig war.
Ja
Text string Der Textinhalt, der finalisiert ist.
Ja
type enum Die Art der Veranstaltung. Immer response.output_text.done.

Mögliche Werte: response.output_text.done
Ja

ResponseTextAnnotationDeltaEvent

Emittiert, wenn eine Textannotation hinzugefügt wird.

Name Typ Beschreibung Erforderlich Vorgabe
Anmerkung Annotation Ja
annotation_index Ganzzahl Der Index der hinzugefügten Anmerkung.
Ja
content_index Ganzzahl Der Index des Inhaltsteils, zu dem die Textannotation hinzugefügt wurde.
Ja
item_id string Die ID des Ausgabeelements, zu dem die Textannotation hinzugefügt wurde.
Ja
output_index Ganzzahl Der Index des Ausgabeelements, zu dem die Textannotation hinzugefügt wurde.
Ja
type enum Die Art der Veranstaltung. Immer response.output_text.annotation.added.

Mögliche Werte: response.output_text.annotation.added
Ja

ResponseTextDeltaEvent

Es wird ausgesendet, wenn ein zusätzliches Text-Delta vorhanden ist.

Name Typ Beschreibung Erforderlich Vorgabe
content_index Ganzzahl Der Index des Inhalts, zu dem das Textdelta hinzugefügt wurde.
Ja
delta string Das Textdelta, das hinzugefügt wurde.
Ja
item_id string Die ID des Ausgabeelements, zu dem das Textdelta hinzugefügt wurde.
Ja
output_index Ganzzahl Der Index des Ausgabeelements, zu dem das Textdelta hinzugefügt wurde.
Ja
type enum Die Art der Veranstaltung. Immer response.output_text.delta.

Mögliche Werte: response.output_text.delta
Ja

ResponseTextDoneEvent

Gesendet, wenn der Textinhalt finalisiert ist.

Name Typ Beschreibung Erforderlich Vorgabe
content_index Ganzzahl Der Index des Inhalts teilt, dass der Textinhalt finalisiert ist.
Ja
item_id string Die ID des Ausgabeelements, in dem der Textinhalt festgelegt ist, ist finalisiert.
Ja
output_index Ganzzahl Der Index des Ausgabeelements, in dem der Textinhalt festgelegt ist, wird finalisiert.
Ja
Text string Der Textinhalt, der finalisiert ist.
Ja
type enum Die Art der Veranstaltung. Immer response.output_text.done.

Mögliche Werte: response.output_text.done
Ja

ResponseUsage

Repräsentiert Details zur Tokennutzung, einschließlich Eingabetoken, Ausgabetoken, einer Aufschlüsselung der Ausgabetoken und der insgesamt verwendeten Tokens.

Name Typ Beschreibung Erforderlich Vorgabe
input_tokens Ganzzahl Die Anzahl der Eingabetoken. Ja
output_tokens Ganzzahl Die Anzahl der Ausgabetoken. Ja
output_tokens_details Objekt Eine detaillierte Aufschlüsselung der Ausgabetoken. Ja
└– reasoning_tokens Ganzzahl Die Anzahl der Vernunft-Tokens. No
Gesamtanzahl Tokens Ganzzahl Die Gesamtzahl der verwendeten Token. Ja

Screenshot

Eine Screenshot-Aktion.

Name Typ Beschreibung Erforderlich Vorgabe
type enum Spezifiziert den Ereignistyp. Für eine Screenshot-Aktion wird diese Eigenschaft immer auf screenshotgesetzt.

Mögliche Werte: screenshot
Ja

Scroll

Eine Scroll-Aktion.

Name Typ Beschreibung Erforderlich Vorgabe
scroll_x Ganzzahl Die horizontale Scrolldistanz.
Ja
scroll_y Ganzzahl Die vertikale Scrolldistanz.
Ja
type enum Spezifiziert den Ereignistyp. Für eine Scrollaktion ist diese Eigenschaft immer auf scrollgesetzt.

Mögliche Werte: scroll
Ja
x Ganzzahl Die x-Koordinate, an der die Schriftrolle stattfand.
Ja
Y Ganzzahl Die y-Koordinate, an der die Schriftrolle stattfand.
Ja

StopConfiguration

Bis zu 4 Sequenzen, bei denen die API aufhört, weitere Token zu generieren. Der zurückgegebene Text enthält die Stoppfolge nicht.

Diese Komponente kann eine der folgenden sein:

TextResponseFormatConfiguration

Ein Objekt, das das Format angibt, das das Modell ausgeben muss.

Die Konfiguration { "type": "json_schema" } aktiviert strukturierte Ausgaben, die sicherstellen, dass das Modell mit Ihrem bereitgestellten JSON-Schema übereinstimmt.

Das Standardformat ist { "type": "text" } ohne zusätzliche Optionen.

Nicht empfohlen für GPT-4o und neuere Modelle:

Einstellung aktiviert den { "type": "json_object" } älteren JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültiges JSON ist. Die Verwendung json_schema ist bevorzugt für Modelle, die sie unterstützen.

Diese Komponente kann eine der folgenden sein:

TextResponseFormatJsonSchema

JSON-Schema-Antwortformat. Wird verwendet, um strukturierte JSON-Antworten zu generieren. Erfahren Sie mehr über strukturierte Ausgaben.

Name Typ Beschreibung Erforderlich Vorgabe
Beschreibung string Eine Beschreibung, wofür das Antwortformat dient, verwendet vom Modell zur Bestimmung der Antwort im Format.
No
Name string Der Name des Antwortformats. Muss a-z, A-Z, 0-9 sein oder Unterstriche und Striche enthalten, mit einer maximalen Länge von 64.
No
schema ResponseFormatJsonSchemaSchema Das Schema für das Antwortformat, beschrieben als JSON-Schema-Objekt. Ja
strict Boolescher Wert Ob strikte Schema-Compliance bei der Erzeugung der Ausgabe aktiviert werden soll.
Setzt es auf wahr, folgt das Modell immer dem exakt im Feld schema definierten Schema. Nur eine Teilmenge des JSON-Schemas wird unterstützt, wenn strict .true
No Falsch
type enum Die Art des zu definierenden Antwortformats. Immer json_schema.
Mögliche Werte: json_schema
Ja

Werkzeug

Diese Komponente kann eine der folgenden sein:

ToolChoiceFunction

Verwenden Sie diese Option, um das Modell zu zwingen, eine bestimmte Funktion aufzurufen.

Name Typ Beschreibung Erforderlich Vorgabe
Name string Der Name der Funktion, die aufgerufen werden soll. Ja
type enum Für Funktionsaufrufe ist der Typ immer function.
Mögliche Werte: function
Ja

ToolChoiceOptions

Kontrolliert, welches (falls vorhandenes) Werkzeug vom Modell aufgerufen wird.

none Das bedeutet, dass das Modell kein Tool aufruft, sondern stattdessen eine Nachricht generiert.

auto das bedeutet, dass das Modell zwischen der Generierung einer Nachricht oder dem Aufrufen eines oder mehrerer Werkzeuge wählen kann.

required das bedeutet, dass das Modell ein oder mehrere Werkzeuge aufrufen muss.

Eigentum Wert
Beschreibung Kontrolliert, welches (falls vorhandenes) Werkzeug vom Modell aufgerufen wird.

none Das bedeutet, dass das Modell kein Tool aufruft, sondern stattdessen eine Nachricht generiert.

auto das bedeutet, dass das Modell zwischen der Generierung einer Nachricht oder dem Aufrufen eines oder mehrerer Werkzeuge wählen kann.

required das bedeutet, dass das Modell ein oder mehrere Werkzeuge aufrufen muss.
Typ string
Werte none
auto
required

ToolChoiceTypes

Zeigt an, dass das Modell ein eingebautes Tool verwenden sollte, um eine Antwort zu generieren.

Name Typ Beschreibung Erforderlich Vorgabe
type enum Welche Art von gehostetem Tool das Modell verwenden sollte. Erlaubte Werte sind:
- file_search
- computer_use_preview

Mögliche Werte: file_search, computer_use_preview
Ja

Typ

Eine Aktion, um Text einzutippen.

Name Typ Beschreibung Erforderlich Vorgabe
Text string Der Text zum Tippen.
Ja
type enum Spezifiziert den Ereignistyp. Für eine Typaktion ist diese Eigenschaft immer auf typegesetzt.

Mögliche Werte: type
Ja

UpdateVectorStoreFileAttributesRequest

Name Typ Beschreibung Erforderlich Vorgabe
attributes VectorStoreFileAttributes Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern und Objekte über die API oder das Dashboard abzufragen. Tasten sind Zeichenketten mit einer maximalen Länge von 64 Zeichen. Werte sind Zeichenketten mit einer maximalen Länge von 512 Zeichen, Booleans oder Zahlen.
Ja

UrlCitation

Ein Zitat für eine Webressource, die zur Erstellung einer Modellantwort verwendet wird.

Name Typ Beschreibung Erforderlich Vorgabe
end_index Ganzzahl Der Index des letzten Zeichens der URL-Zitation in der Nachricht.
Ja
start_index Ganzzahl Der Index des ersten Zeichens der URL-Zitation in der Nachricht.
Ja
title string Der Titel der Webressource.
Ja
type enum Der Typ der URL-Zitate. Immer url_citation.

Mögliche Werte: url_citation
Ja
url string Die URL der Webressource.
Ja

VectorStoreFileAttributes

Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern und Objekte über die API oder das Dashboard abzufragen. Tasten sind Zeichenketten mit einer maximalen Länge von 64 Zeichen. Werte sind Zeichenketten mit einer maximalen Länge von 512 Zeichen, Booleans oder Zahlen.

Für diese Komponente sind keine Eigenschaften definiert.

VectorStoreFileContentResponse

Repräsentiert den geparsten Inhalt einer Vektorspeicherdatei.

Name Typ Beschreibung Erforderlich Vorgabe
data array Den Inhalt der Datei analysiert. Ja
has_more Boolescher Wert Zeigt an, ob es weitere Inhaltsseiten zu holen gibt. Ja
next_page string Das Token für die nächste Seite, falls vorhanden. Ja
Objekt enum Der Objekttyp, der immer ist vector_store.file_content.page
Mögliche Werte: vector_store.file_content.page
Ja

VectorStoreSearchRequest

Name Typ Beschreibung Erforderlich Vorgabe
Filter ComparisonFilter oder CompoundFilter Ein Filter, der basierend auf Dateiattributen angewendet wird. No
max_anzahl_ergebnisse Ganzzahl Die maximale Anzahl an Ergebnissen, die du ergeben kannst. Diese Zahl sollte zwischen 1 und 50 liegen. No 10
Anfrage Saite oder Array Eine Abfragefolge für eine Suche Ja
Ranglistenoptionen Objekt Rangfolgeoptionen für die Suche. No
└– Ranker enum Mögliche Werte: auto, default-2024-11-15 No
└─ Punktschwelle number No 0
rewrite_query Boolescher Wert Ob die natürliche Sprachanfrage für die Vektorsuche umgeschrieben werden soll. No Falsch

VectorStoreSearchResultContentObject

Name Typ Beschreibung Erforderlich Vorgabe
Text string Der Textinhalt wurde von der Suche zurückgegeben. Ja
type enum Die Art des Inhalts.
Mögliche Werte: text
Ja

VectorStoreSearchResultItem

Name Typ Beschreibung Erforderlich Vorgabe
attributes VectorStoreFileAttributes Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern und Objekte über die API oder das Dashboard abzufragen. Tasten sind Zeichenketten mit einer maximalen Länge von 64 Zeichen. Werte sind Zeichenketten mit einer maximalen Länge von 512 Zeichen, Booleans oder Zahlen.
Ja
Inhalt array Inhaltsabschnitte aus der Datei. Ja
Datei-ID string Die ID der Vektorspeicherdatei. Ja
filename string Der Name der Vektorspeicherdatei. Ja
Punktzahl number Der Ähnlichkeitswert für das Ergebnis. Ja

VectorStoreSearchResultsPage

Name Typ Beschreibung Erforderlich Vorgabe
data array Die Liste der Suchergebnis-Elemente. Ja
has_more Boolescher Wert Zeigt an, ob es noch mehr Ergebnisse zu holen gibt. Ja
next_page string Das Token für die nächste Seite, falls vorhanden. Ja
Objekt enum Der Objekttyp, der immer ist vector_store.search_results.page
Mögliche Werte: vector_store.search_results.page
Ja
search_query array Ja

VoiceIdsShared

Für diese Komponente sind keine Eigenschaften definiert.

Wait

Eine Warteaktion.

Name Typ Beschreibung Erforderlich Vorgabe
type enum Spezifiziert den Ereignistyp. Für eine Warteaktion wird diese Eigenschaft immer auf waitgesetzt.

Mögliche Werte: wait
Ja

ReasoningEffort

Begrenzt den Aufwand beim Schließen bei Denkmustern. Derzeit unterstützte Werte sind low, medium, und high. Eine Reduzierung des Schlussarbeitsaufwands kann zu schnelleren Antworten und weniger Token beim Schließen in einer Antwort führen.

Eigentum Wert
Beschreibung Begrenzt den Aufwand beim Schließen bei Denkmustern.
Derzeit unterstützte Werte sind low, medium, und high. Eine Reduzierung des Schlussarbeitsaufwands kann zu schnelleren Antworten und weniger Token beim Schließen in einer Antwort führen.
Typ string
Vorgabe medium
Werte low
medium
high

errorEvent

Tritt auf, wenn ein Fehler auftritt. Das kann durch einen internen Serverfehler oder eine Auszeit passieren.

Name Typ Beschreibung Erforderlich Vorgabe
data error Ja
Ereignis string Ja

Event Enum: ErrorEventEnum

Wert Beschreibung
Fehler

doneEvent

Tritt auf, wenn ein Stream endet.

Name Typ Beschreibung Erforderlich Vorgabe
data string Ja
Ereignis string Ja

Event Enum: DoneEventEnum

Wert Beschreibung
Fertig

Data Enum: DoneEventDataEnum

Wert Beschreibung
[DONE]

Nächste Schritte

Lerne mehr über Modelle und Feinabstimmung mit der REST-API. Erfahren Sie mehr über die zugrundeliegenden Modelle, die Azure OpenAI antreiben.