Azure OpenAI in Microsoft Foundry Models REST API Vorschaureferenz

Dieser Artikel liefert Details zu den Inferenz-REST-API-Endpunkten für Azure OpenAI.

API-Spezifikationen

Die Verwaltung und Interaktion mit Azure OpenAI-Modellen und -Ressourcen ist auf drei Haupt-API-Oberflächen verteilt:

Steuerebene
Datenebene – Autoring
Datenebene – Schlussfolgerung

Jede API-Oberfläche/Spezifikation kapselt einen anderen Satz von Azure OpenAI-Funktionen. Jede API hat ihren eigenen einzigartigen Satz von Vorschau- und stabilen/allgemein verfügbaren (GA) API-Releases. Preview-Veröffentlichungen folgen derzeit meist einem monatlichen Rhythmus.

Important

Es gibt jetzt eine neue Vorschau-Inferenz-API. Erfahren Sie mehr in unserem API-Lebenszyklus-Leitfaden.

API	Neueste Vorschau-Veröffentlichung	Neueste GA-Veröffentlichung	Specifications	Beschreibung
Steuerungsebene	`2025-07-01-preview`	`2025-06-01`	Spezifikationsdateien	Die Control Plane API wird für Operationen wie Ressourcenerstellung, Modellbereitstellung und andere Aufgaben des höheren Ressourcenmanagements verwendet. Die Kontrollebene regelt außerdem, was mit Funktionen wie Azure Resource Manager, Bicep, Terraform und Azure CLI möglich ist.
Datenebene	`v1 preview`	`v1`	Spezifikationsdateien	Die Data Plane API steuert Inferenz- und Autorenoperationen.

Authentifizierung

Azure OpenAI bietet zwei Methoden zur Authentifizierung an. Du kannst entweder API-Schlüssel oder Microsoft Entra ID verwenden.

API-Schlüssel-Authentifizierung: Für diese Art der Authentifizierung müssen alle API-Anfragen den API-Schlüssel im api-key HTTP-Header enthalten. Der Quickstart bietet Anleitungen, wie man mit dieser Art der Authentifizierung Anrufe tätigt.
Microsoft Entra ID Authentifizierung: Sie können einen API-Aufruf mit einem Microsoft Entra-Token authentifizieren. Authentifizierungstoken sind in einer Anfrage als Header Authorization enthalten. Der bereitgestellte Token muss zum Beispiel von Bearervorangestellt werden, zum Beispiel Bearer YOUR_AUTH_TOKEN. Sie können unseren Anleitungsleitfaden zum Thema Authentifizierung mit Microsoft Entra ID lesen.

REST-API-Versionierung

Die Service-APIs werden mit dem Abfrageparameter api-version versioniert. Alle Versionen folgen der YYYY-MM-DD Datumsstruktur. Beispiel:

POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/chat/completions?api-version=2024-06-01

Inferenz der Datenebene

Der Rest des Artikels behandelt die 2025-04-01-preview Vorschauversion der Azure OpenAI Data Plane Inference Specification.

Wenn Sie nach Dokumentationen zur neuesten GA-API-Version suchen, lesen Sie die neueste GA-Datenebenen-Ableitungs-API.

Vervollständigungen – Erstellen

POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2025-04-01-preview

Erstellt eine Vervollständigung für den bereitgestellten Prompt, die Parameter und das gewählte Modell.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
Bereitstellungs-ID	path	Ja	string
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name	Typ	Beschreibung	Erforderlich	Vorgabe
best_of	Ganzzahl	Erzeugt `best_of` serverseitige Komplettierungen und gibt das "beste" zurück (das mit der höchsten Log-Wahrscheinlichkeit pro Token). Die Ergebnisse können nicht gestreamt werden. Verwendet mit `n`, `best_of` steuert er die Anzahl der Kandidatenabschlüsse und `n` gibt an, wie viele zurückzugeben sind. Ã¢ìâìâ€œ `best_of` muss größer als `n`sein. Hinweis: Da dieser Parameter viele Vervollständigungen erzeugt, kann er Ihre Token-Quote schnell verbrauchen. Verwenden Sie sorgfältig und stellen Sie sicher, dass Sie angemessene Einstellungen für `max_tokens` und `stop`haben.	No	1
Echo	Boolescher Wert	Echo den Prompt zusätzlich zum Abschluss	No	Falsch
frequency_penalty	number	Zahl zwischen -2,0 und 2,0. Positive Werte bestrafen neue Token basierend auf ihrer bisherigen Häufigkeit im Text, wodurch die Wahrscheinlichkeit des Modells verringert, dieselbe Zeile wortwörtlich zu wiederholen.	No	0
Logit-Bias	Objekt	Ändere die Wahrscheinlichkeit, dass bestimmte Token im Completion erscheinen. Akzeptiert ein JSON-Objekt, das Token (angegeben durch ihre Token-ID im GPT-Tokenizer) auf einen zugehörigen Bias-Wert von -100 bis 100 zuordnet. Mathematisch wird die Verzerrung zu den vom Modell vor der Stichprobe erzeugten Logits addiert. Der genaue Effekt variiert je nach Modell, aber Werte zwischen -1 und 1 sollten die Selektionswahrscheinlichkeit verringern oder erhöhen; Werte wie -100 oder 100 sollten zu einem Bann oder zur exklusiven Auswahl des entsprechenden Tokens führen. Zum Beispiel kannst du passen `{"50256": -100}` , um zu verhindern, dass das <\|endoftext\|> Token generiert wird.	No	Nichts
logprobs	Ganzzahl	Beziehen Sie die Log-Wahrscheinlichkeiten der `logprobs` wahrscheinlichsten Ausgabetoken sowie der ausgewählten Token ein. Zum Beispiel, wenn `logprobs` 5 ist, gibt die API eine Liste der 5 wahrscheinlichsten Token zurück. Die API gibt immer das `logprob` des abgetasteten Tokens zurück, sodass es bis zu viele `logprobs+1` Elemente in der Antwort geben kann. Der maximale Wert für `logprobs` ist 5.	No	Nichts
maximale_Anzahl_von_Tokens	Ganzzahl	Die maximale Anzahl der Token, die im Completion generiert werden können. Die Token-Anzahl deines Prompts plus `max_tokens` darf die Kontextlänge des Modells nicht überschreiten.	No	16
n	Ganzzahl	Wie viele Abschlüsse für jeden Prompt generiert werden sollen. Hinweis: Da dieser Parameter viele Vervollständigungen erzeugt, kann er Ihre Token-Quote schnell verbrauchen. Verwenden Sie sorgfältig und stellen Sie sicher, dass Sie angemessene Einstellungen für `max_tokens` und `stop`haben.	No	1
presence_penalty	number	Zahl zwischen -2,0 und 2,0. Positive Werte bestrafen neue Tokens basierend darauf, ob sie bisher im Text erscheinen, was die Wahrscheinlichkeit erhöht, dass das Modell über neue Themen spricht.	No	0
Eingabeaufforderung	Saite oder Array	Der Prompt zur Generierung von Komplettierungen, codiert als String, Array von Strings, Array von Token oder Array von Token-Arrays. Beachten Sie, dass <\|endoftext\|> der Dokumentseparator ist, den das Modell während des Trainings sieht, sodass das Modell bei fehlender Eingabeaufforderung als vom Anfang eines neuen Dokuments generiert.	Ja
seed	Ganzzahl	Wenn angegeben, bemüht sich unser System, deterministisch zu samplingen, sodass wiederholte Anfragen mit denselben `seed` Parametern dasselbe Ergebnis liefern. Determinismus ist nicht garantiert, und du solltest auf den Antwortparameter `system_fingerprint` zurückgreifen, um Änderungen im Backend zu überwachen.	No
Stopp	Saite oder Array	Bis zu vier Sequenzen, bei denen die API aufhört, weitere Token zu generieren. Der zurückgegebene Text enthält die Stoppsequenz nicht.	No
stream	Boolescher Wert	Ob ich den Teilfortschritt zurückstreamen soll. Wenn gesetzt, werden Token als rein datenbasierte, servergesendete Ereignisse gesendet, sobald sie verfügbar sind, wobei der Strom durch eine `data: [DONE]` Nachricht beendet wird. Beispiel Python Code.	No	Falsch
Suffix	string	Das Suffix, das nach dem Abschluss des eingefügten Textes kommt. Dieser Parameter wird nur für `gpt-3.5-turbo-instruct`unterstützt.	No	Nichts
Temperatur	number	Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen. Wir empfehlen im Allgemeinen, dies zu ändern oder `top_p` , aber nicht beides.	No	1
top_p	number	Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden. Wir empfehlen im Allgemeinen, dies zu ändern oder `temperature` , aber nicht beides.	No	1
user	string	Eine eindeutige Kennung, die Ihren Endnutzer repräsentiert und dabei helfen kann, Missbrauch zu überwachen und zu erkennen.	No

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	createCompletionResponse

Statuscode: Standard

Beschreibung: Dienst nicht verfügbar

Inhaltstyp	Typ	Beschreibung
application/json	errorResponse

Beispiele

Example

Erstellt eine Vervollständigung für den bereitgestellten Prompt, die Parameter und das gewählte Modell.

POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2025-04-01-preview

{
 "prompt": [
  "tell me a joke about mango"
 ],
 "max_tokens": 32,
 "temperature": 1.0,
 "n": 1
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "cmpl-7QmVI15qgYVllxK0FtxVGG6ywfzaq",
    "created": 1686617332,
    "choices": [
      {
        "text": "es\n\nWhat do you call a mango who's in charge?\n\nThe head mango.",
        "index": 0,
        "finish_reason": "stop",
        "logprobs": null
      }
    ],
    "usage": {
      "completion_tokens": 20,
      "prompt_tokens": 6,
      "total_tokens": 26
    }
  }
}

Einbettungen – Erstellen

POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2025-04-01-preview

Erhalten Sie eine Vektordarstellung eines gegebenen Inputs, die leicht von Machine-Learning-Modellen und Algorithmen verbraucht werden kann.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
Bereitstellungs-ID	path	Ja	string	Die Deployment-ID des Modells, das bereitgestellt wurde.
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name	Typ	Beschreibung	Erforderlich
Abmessungen	Ganzzahl	Die Anzahl der Dimensionen, die die resultierenden Ausgabe-Einbettungen haben sollten. Nur in `text-embedding-3` und neueren Modellen unterstützt.	No
encoding_format	string	Das Format, um die Einbettungen zurückzugeben. Es kann entweder `float` oder `base64`sein. Standardmäßig gilt `float`.	No
input	Saite oder Array	Geben Sie den Text ein, der eingebettet wird, kodiert als String oder Array von Tokens. Um mehrere Eingaben in einer einzigen Anfrage einzubetten, übergeben Sie ein Array von Strings oder ein Array von Token-Arrays. Die Eingabe darf die maximalen Eingabetoken des Modells (8.192 Token für `text-embedding-ada-002`), darf keine leere Zeichenkette sein, und jedes Array muss 2.048 Dimensionen oder weniger haben. Zusätzlich zum Grenzwert pro Eingabetoken erzwingen alle Einbettungsmodelle maximal 300.000 Token, die über alle Eingaben in einer einzigen Anforderung summiert wurden.	Ja
input_type	string	Eingabetyp der Einbettungssuche zur Verwendung	No
user	string	Eine eindeutige Identifikator, die Ihren Endnutzer repräsentiert und dabei helfen kann, Missbrauch zu überwachen und zu erkennen.	No

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	Objekt

Beispiele

Example

Geben Sie die Einbettungen für einen bestimmten Prompt zurück.

POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2025-04-01-preview

{
 "input": [
  "this is a test"
 ]
}

Antworten: Statuscode: 200

{
  "body": {
    "data": [
      {
        "index": 0,
        "embedding": [
          -0.012838088,
          -0.007421397,
          -0.017617522,
          -0.028278312,
          -0.018666342,
          0.01737855,
          -0.01821495,
          -0.006950092,
          -0.009937238,
          -0.038580645,
          0.010674067,
          0.02412286,
          -0.013647936,
          0.013189907,
          0.0021125758,
          0.012406612,
          0.020790534,
          0.00074595667,
          0.008397198,
          -0.00535031,
          0.008968075,
          0.014351576,
          -0.014086051,
          0.015055214,
          -0.022211088,
          -0.025198232,
          0.0065186154,
          -0.036350243,
          0.009180495,
          -0.009698266,
          0.009446018,
          -0.008463579,
          -0.0020113448
        ]
      }
    ],
    "usage": {
      "prompt_tokens": 4,
      "total_tokens": 4
    }
  }
}

Chat-Komplettierungen – Erstellen

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

Erstellt eine Vervollständigung der Chatnachricht

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
Bereitstellungs-ID	path	Ja	string
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Audio	Objekt	Parameter für den Audioausgang. Erforderlich, wenn die Audioausgabe mit `modalities: ["audio"]`angefordert wird.	No
└─ Format	enum	Spezifiziert das Ausgabe-Audioformat. Muss einer von `wav`, `mp3`, `flac`, , `opus`oder `pcm16`sein. Mögliche Werte: `wav`, `mp3`, `flac`, `opus`, `pcm16`	No
└– Stimme	enum	Spezifiziert den Sprachtyp. Unterstützte Stimmen sind `alloy`, `echo`, `fable`, , `onyx`, `nova`und `shimmer`. Mögliche Werte: `alloy`, `echo`, , `fableonyx`, `nova`,`shimmer`	No
data_sources	array	Die Konfigurationseinträge für Azure OpenAI-Chat-Erweiterungen, die sie verwenden. Diese zusätzliche Spezifikation ist nur mit Azure OpenAI kompatibel.	No
frequency_penalty	number	Zahl zwischen -2,0 und 2,0. Positive Werte bestrafen neue Token basierend auf ihrer bisherigen Häufigkeit im Text, wodurch die Wahrscheinlichkeit des Modells verringert, dieselbe Zeile wortwörtlich zu wiederholen.	No	0
function_call	string oder chatCompletionFunctionCallOption	Veraltet zugunsten von `tool_choice`. Kontrolliert, welche (falls vorhandene) Funktion vom Modell aufgerufen wird. `none` das bedeutet, dass das Modell keine Funktion aufruft, sondern stattdessen eine Nachricht generiert. `auto` das bedeutet, dass das Modell zwischen der Erzeugung einer Nachricht oder dem Aufruf einer Funktion wählen kann. Die Spezifizierung einer bestimmten Funktion über `{"name": "my_function"}` zwingt das Modell, diese Funktion aufzurufen. `none` ist der Standard, wenn keine Funktionen vorhanden sind. `auto` ist der Standard, wenn Funktionen vorhanden sind.	No
functions	array	Veraltet zugunsten von `tools`. Eine Liste von Funktionen, für die das Modell JSON-Eingaben generieren kann.	No
Logit-Bias	Objekt	Ändere die Wahrscheinlichkeit, dass bestimmte Token im Completion erscheinen. Akzeptiert ein JSON-Objekt, das Token (angegeben durch ihre Token-ID im Tokenizer) auf einen zugehörigen Bias-Wert von -100 bis 100 abbildet. Mathematisch wird die Verzerrung zu den vom Modell vor der Stichprobe erzeugten Logits addiert. Der genaue Effekt variiert je nach Modell, aber Werte zwischen -1 und 1 sollten die Selektionswahrscheinlichkeit verringern oder erhöhen; Werte wie -100 oder 100 sollten zu einem Bann oder zur exklusiven Auswahl des entsprechenden Tokens führen.	No	Nichts
logprobs	Boolescher Wert	Ob die Log-Wahrscheinlichkeiten der Ausgabetoken zurückgegeben werden sollen oder nicht. Wenn wahr, gibt die logaritarischen Wahrscheinlichkeiten jedes in der `contentmessage`von zurückgegebenen Ausgabetokens zurück.	No	Falsch
max_completion_tokens	Ganzzahl	Eine obere Schranke für die Anzahl der Tokens, die für einen Abschluss generiert werden können, einschließlich sichtbarer Ausgabetoken und Reasoning-Tokens.	No
maximale_Anzahl_von_Tokens	Ganzzahl	Die maximale Anzahl der Token, die im Chat-Abschluss generiert werden kann. Die Gesamtlänge der Eingabetoken und generierten Tokens ist durch die Kontextlänge des Modells begrenzt.	No
Nachrichten	array	Eine Liste der Nachrichten, die das bisherige Gespräch ausmachen. Beispiel Python Code.	Ja
metadata	Objekt	Vom Entwickler definierte Tags und Werte, die zum Filtern von Abschlüssen im gespeicherten Abschluss-Dashboard verwendet werden.	No
modalities	ChatCompletionModalities	Ausgabetypen, die das Modell für diese Anfrage generieren soll. Die meisten Modelle sind in der Lage, Text zu generieren, was standardmäßig ist: `["text"]` Das `gpt-4o-audio-preview` Modell kann auch zur Audioerzeugung verwendet werden. Um zu verlangen, dass dieses Modell sowohl Text- als auch Audioantworten erzeugt, können Sie verwenden: `["text", "audio"]`	No
n	Ganzzahl	Wie viele Chat-Abschlussoptionen soll für jede Eingabenachricht generiert werden? Du wirst basierend auf der Anzahl der generierten Token in allen Optionen berechnet. Achten Sie `n` darauf, `1` die Kosten zu minimieren.	No	1
Parallele Werkzeugaufrufe	ParallelToolCalls	Ob man während der Werkzeugnutzung parallele Funktionsaufrufe aktivieren soll.	No	Richtig
prediction	PredictionContent	Konfiguration für eine vorhergesagte Ausgabe, die die Reaktionszeiten erheblich verbessern kann, wenn große Teile der Modellantwort im Voraus bekannt sind. Dies tritt am häufigsten auf, wenn Sie eine Datei mit nur geringfügigen Änderungen an den meisten Inhalten neu generieren.	No
presence_penalty	number	Zahl zwischen -2,0 und 2,0. Positive Werte bestrafen neue Tokens basierend darauf, ob sie bisher im Text erscheinen, was die Wahrscheinlichkeit erhöht, dass das Modell über neue Themen spricht.	No	0
Denkanstrengung	enum	Nur O1-Modelle Begrenzt den Aufwand beim Schließen bei Denkmustern. Derzeit unterstützte Werte sind `low`, `medium`, und `high`. Eine Reduzierung des Schlussarbeitsaufwands kann zu schnelleren Antworten und weniger Token beim Schließen in einer Antwort führen. Mögliche Werte: `low`, `medium`, `high`	No
Antwortformat	ResponseFormatText oder ResponseFormatJsonObject oder ResponseFormatJsonSchema	Ein Objekt, das das Format angibt, das das Modell ausgeben muss. Kompatibel mit GPT-4o,GPT-4o Mini, GPT-4 Turbo und allen GPT-3.5 Turbo Modellen, die neuer als `gpt-3.5-turbo-1106`. Setzen Sie auf `{ "type": "json_schema", "json_schema": {...} }` aktiviert strukturierte Ausgaben, die garantieren, dass das Modell mit Ihrem bereitgestellten JSON-Schema übereinstimmt. Die Einstellung aktiviert den `{ "type": "json_object" }` JSON-Modus, der garantiert, dass die vom Modell erzeugte Nachricht gültig ist. Wichtig: Beim Einsatz des JSON-Modus müssen Sie das Modell auch anweisen, selbst JSON über eine System- oder Benutzernachricht zu erzeugen. Ohne dies kann das Modell einen endlosen Strom von Leerraum erzeugen, bis die Erzeugung das Token-Limit erreicht, was zu einer langanhaltenden und scheinbar "festgefahrenen" Anfrage führt. Beachten Sie auch, dass der Nachrichteninhalt teilweise abgeschnitten werden kann, wenn `finish_reason="length"`, was darauf hinweist, dass die Generation überschritten `max_tokens` wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.	No
seed	Ganzzahl	Diese Funktion befindet sich noch in der Beta. Wenn angegeben, bemüht sich unser System, deterministisch zu samplingen, sodass wiederholte Anfragen mit denselben `seed` Parametern dasselbe Ergebnis liefern. Determinismus ist nicht garantiert, und du solltest auf den Antwortparameter `system_fingerprint` zurückgreifen, um Änderungen im Backend zu überwachen.	No
Stopp	Saite oder Array	Bis zu 4 Sequenzen, bei denen die API aufhört, weitere Token zu generieren.	No
store	Boolescher Wert	Ob das Ergebnis dieser Chat-Abschlussanfrage für die Verwendung in unseren Modelldestillations- oder Bewertungsprodukten gespeichert werden soll oder nicht.	No
stream	Boolescher Wert	Wenn gesetzt, werden partielle Nachrichtendeltas gesendet, wie in ChatGPT. Token werden als rein datenbasierte, servergesendete Ereignisse gesendet, sobald sie verfügbar sind, wobei der Strom durch eine `data: [DONE]` Nachricht beendet wird. Beispiel Python Code.	No	Falsch
stream_options	chatCompletionStreamOptions	Optionen für Streaming-Antworten. Setzen Sie dies nur, wenn Sie `stream: true`setzen.	No	Nichts
Temperatur	number	Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen. Wir empfehlen im Allgemeinen, dies zu ändern oder `top_p` , aber nicht beides.	No	1
tool_choice	chatCompletionToolChoiceOption	Kontrolliert, welches (falls vorhandenes) Werkzeug vom Modell aufgerufen wird. `none` Das bedeutet, dass das Modell kein Tool aufruft, sondern stattdessen eine Nachricht generiert. `auto` das bedeutet, dass das Modell zwischen der Generierung einer Nachricht oder dem Aufrufen eines oder mehrerer Werkzeuge wählen kann. `required` das bedeutet, dass das Modell ein oder mehrere Werkzeuge aufrufen muss. Die Angabe eines bestimmten Werkzeugs über `{"type": "function", "function": {"name": "my_function"}}` zwingt das Modell, dieses Werkzeug aufzurufen. `none` ist der Standard, wenn keine Werkzeuge vorhanden sind. `auto` ist der Standard, wenn Werkzeuge vorhanden sind.	No
tools	array	Eine Liste der Werkzeuge, die das Modell aufrufen kann. Derzeit werden nur Funktionen als Werkzeug unterstützt. Nutzen Sie dies, um eine Liste von Funktionen bereitzustellen, für die das Modell JSON-Eingaben generieren kann. Maximal 128 Funktionen werden unterstützt.	No
top_logprobs	Ganzzahl	Eine ganze Zahl zwischen 0 und 20, die die Anzahl der wahrscheinlichsten Token angibt, die an jeder Tokenposition zurückgegeben werden sollen, jeweils mit einer zugehörigen Log-Wahrscheinlichkeit. `logprobs` muss auf `true` gesetzt werden, wenn dieser Parameter verwendet wird.	No
top_p	number	Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden. Wir empfehlen im Allgemeinen, dies zu ändern oder `temperature` , aber nicht beides.	No	1
user	string	Eine eindeutige Kennung, die Ihren Endnutzer repräsentiert und dabei helfen kann, Missbrauch zu überwachen und zu erkennen.	No
user_security_context	userSecurityContext	Der Benutzersicherheitskontext enthält mehrere Parameter, die die KI-Anwendung selbst und den Endnutzer beschreiben, der mit der KI-Anwendung interagiert. Diese Bereiche unterstützen Ihre Sicherheitsteams dabei, Sicherheitsvorfälle zu untersuchen und zu mindern, indem sie einen umfassenden Ansatz zum Schutz Ihrer KI-Anwendungen bieten. Erfahren Sie mehr zum Schutz von KI-Anwendungen mit Microsoft Defender for Cloud.	No

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	Objekt

Statuscode: Standard

Beschreibung: Dienst nicht verfügbar

Inhaltstyp	Typ	Beschreibung
application/json	errorResponse

Beispiele

Example

Erstellt eine Vervollständigung für den bereitgestellten Prompt, die Parameter und das gewählte Modell.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "system",
   "content": "you are a helpful assistant that talks like a pirate"
  },
  {
   "role": "user",
   "content": "can you tell me how to care for a parrot?"
  }
 ]
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Ahoy matey! So ye be wantin' to care for a fine squawkin' parrot, eh? Well, shiver me timbers, let ol' Cap'n Assistant share some wisdom with ye! Here be the steps to keepin' yer parrot happy 'n healthy:\n\n1. Secure a sturdy cage: Yer parrot be needin' a comfortable place to lay anchor! Be sure ye get a sturdy cage, at least double the size of the bird's wingspan, with enough space to spread their wings, yarrrr!\n\n2. Perches 'n toys: Aye, parrots need perches of different sizes, shapes, 'n textures to keep their feet healthy. Also, a few toys be helpin' to keep them entertained 'n their minds stimulated, arrrh!\n\n3. Proper grub: Feed yer feathered friend a balanced diet of high-quality pellets, fruits, 'n veggies to keep 'em strong 'n healthy. Give 'em fresh water every day, or ye\u00e2\u20ac\u2122ll have a scurvy bird on yer hands!\n\n4. Cleanliness: Swab their cage deck! Clean their cage on a regular basis: fresh water 'n food daily, the floor every couple of days, 'n a thorough scrubbing ev'ry few weeks, so the bird be livin' in a tidy haven, arrhh!\n\n5. Socialize 'n train: Parrots be a sociable lot, arrr! Exercise 'n interact with 'em daily to create a bond 'n maintain their mental 'n physical health. Train 'em with positive reinforcement, treat 'em kindly, yarrr!\n\n6. Proper rest: Yer parrot be needin' \u00e2\u20ac\u2122bout 10-12 hours o' sleep each night. Cover their cage 'n let them slumber in a dim, quiet quarter for a proper night's rest, ye scallywag!\n\n7. Keep a weather eye open for illness: Birds be hidin' their ailments, arrr! Be watchful for signs of sickness, such as lethargy, loss of appetite, puffin' up, or change in droppings, and make haste to a vet if need be.\n\n8. Provide fresh air 'n avoid toxins: Parrots be sensitive to draft and pollutants. Keep yer quarters well ventilated, but no drafts, arrr! Be mindful of toxins like Teflon fumes, candles, or air fresheners.\n\nSo there ye have it, me hearty! With proper care 'n commitment, yer parrot will be squawkin' \"Yo-ho-ho\" for many years to come! Good luck, sailor, and may the wind be at yer back!"
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Erstellt eine Vervollständigung basierend auf Azure Search-Daten und systemzugewiesener verwalteter Identität.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_search",
   "parameters": {
    "endpoint": "https://your-search-endpoint.search.windows.net/",
    "index_name": "{index name}",
    "authentication": {
     "type": "system_assigned_managed_identity"
    }
   }
  }
 ]
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Erstellt eine Vervollständigung basierend auf Azure Search Bildvektordaten.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_search",
   "parameters": {
    "endpoint": "https://your-search-endpoint.search.windows.net/",
    "index_name": "{index name}",
    "query_type": "vector",
    "fields_mapping": {
     "image_vector_fields": [
      "image_vector"
     ]
    },
    "authentication": {
     "type": "api_key",
     "key": "{api key}"
    }
   }
  }
 ]
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion."
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Erstellt eine Vervollständigung basierend auf Azure Search-Vektordaten, einer vorherigen Assistentennachricht und einer vom Benutzer zugewiesenen verwalteten Identität.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a cat?"
  },
  {
   "role": "assistant",
   "content": "Content of the completion [doc1].",
   "context": {
    "intent": "cat care"
   }
  },
  {
   "role": "user",
   "content": "how about dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_search",
   "parameters": {
    "endpoint": "https://your-search-endpoint.search.windows.net/",
    "authentication": {
     "type": "user_assigned_managed_identity",
     "managed_identity_resource_id": "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{resource-name}"
    },
    "index_name": "{index name}",
    "query_type": "vector",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "in_scope": true,
    "top_n_documents": 5,
    "strictness": 3,
    "role_information": "You are an AI assistant that helps people find information.",
    "fields_mapping": {
     "content_fields_separator": "\\n",
     "content_fields": [
      "content"
     ],
     "filepath_field": "filepath",
     "title_field": "title",
     "url_field": "url",
     "vector_fields": [
      "contentvector"
     ]
    }
   }
  }
 ]
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content 2.",
                "title": "Citation Title 2",
                "filepath": "contoso2.txt",
                "url": "https://contoso.blob.windows.net/container/contoso2.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Erstellt eine Vervollständigung für die bereitgestellte Azure Cosmos DB.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_cosmos_db",
   "parameters": {
    "authentication": {
     "type": "connection_string",
     "connection_string": "mongodb+srv://rawantest:{password}$@{cluster-name}.mongocluster.cosmos.azure.com/?tls=true&authMechanism=SCRAM-SHA-256&retrywrites=false&maxIdleTimeMS=120000"
    },
    "database_name": "vectordb",
    "container_name": "azuredocs",
    "index_name": "azuredocindex",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "fields_mapping": {
     "content_fields": [
      "content"
     ],
     "vector_fields": [
      "contentvector"
     ]
    }
   }
  }
 ]
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Erstellt eine Vervollständigung für die bereitgestellte Mongo-Datenbank.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "mongo_db",
   "parameters": {
    "authentication": {
     "type": "username_and_password",
     "username": "<username>",
     "password": "<password>"
    },
    "endpoint": "<endpoint_name>",
    "app_name": "<application name>",
    "database_name": "sampledb",
    "collection_name": "samplecollection",
    "index_name": "sampleindex",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "fields_mapping": {
     "content_fields": [
      "content"
     ],
     "vector_fields": [
      "contentvector"
     ]
    }
   }
  }
 ]
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Erstellt eine Vervollständigung für das bereitgestellte Elasticsearch.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "elasticsearch",
   "parameters": {
    "endpoint": "https://your-elasticsearch-endpoint.eastus.azurecontainer.io",
    "index_name": "{index name}",
    "authentication": {
     "type": "key_and_key_id",
     "key": "{key}",
     "key_id": "{key id}"
    }
   }
  }
 ]
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Erstellt eine Vervollständigung für die bereitgestellte Pineconon-Ressource.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "pinecone",
   "parameters": {
    "authentication": {
     "type": "api_key",
     "key": "{api key}"
    },
    "environment": "{environment name}",
    "index_name": "{index name}",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "fields_mapping": {
     "title_field": "title",
     "url_field": "url",
     "filepath_field": "filepath",
     "content_fields": [
      "content"
     ],
     "content_fields_separator": "\n"
    }
   }
  }
 ]
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Transkriptionen – Erstellen

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

Transkribiert Audio in die Eingabesprache.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
Bereitstellungs-ID	path	Ja	string
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Typ: mehrteilige Formulardaten (multipart/form-data)

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Modell	string	ID des zu verwendenden Modells. Die Optionen sind `gpt-4o-transcribe`, `gpt-4o-mini-transcribe`, `gpt-4o-mini-transcribe-2025-12-15`, , `whisper-1`und `gpt-4o-transcribe-diarize`.	Ja
Datei	string	Das Audiodatei-Objekt, das transkribiert werden soll.	Ja
language	string	Die Sprache des eingegebenen Audios. Die Bereitstellung der Eingabesprache im ISO-639-1-Format verbessert die Genauigkeit und Latenz.	No
Eingabeaufforderung	string	Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen. Der Prompt sollte mit der Audiosprache übereinstimmen.	No
Antwortformat	audioResponseFormat	Definiert das Format der Ausgabe.	No
Temperatur	number	Die Probentemperatur liegt zwischen 0 und 1. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen. Wenn auf 0 gesetzt, verwendet das Modell die logaritarische Wahrscheinlichkeit, um die Temperatur automatisch zu erhöhen, bis bestimmte Schwellenwerte erreicht sind.	No	0
timestamp_granularities[]	array	Die Zeitstempel-Granularitäten, die für diese Transkription gefüllt werden sollen. `response_format` muss so eingestellt `verbose_json` werden, dass Zeitstempel-Granularitäten verwendet werden. Entweder oder beide dieser Optionen werden unterstützt: `word`, oder `segment`. Hinweis: Es gibt keine zusätzliche Latenz für Segmentzeitstempel, aber das Erstellen von Wortzeitstempeln verursacht zusätzliche Latenz.	No	['segment']

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	Objekt
Textdatei/Klartext	string	Transkribierter Text im Ausgabeformat (wenn response_format einer von war `text`, `vtt` oder `srt`).

Beispiele

Example

Erhält transkribierten Text und zugehörige Metadaten aus bereitgestellten gesprochenen Audiodaten.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Example

Erhält transkribierten Text und zugehörige Metadaten aus bereitgestellten gesprochenen Audiodaten.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Antworten: Statuscode: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Übersetzungen – Erstellen

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

Transkribiert und übersetzt Eingabeaudio in englischen Text.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
Bereitstellungs-ID	path	Ja	string
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Typ: mehrteilige Formulardaten (multipart/form-data)

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Datei	string	Die Audiodatei zum Übersetzen.	Ja
Eingabeaufforderung	string	Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen. Der Prompt sollte auf Englisch sein.	No
Antwortformat	audioResponseFormat	Definiert das Format der Ausgabe.	No
Temperatur	number	Die Probentemperatur liegt zwischen 0 und 1. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen. Wenn auf 0 gesetzt, verwendet das Modell die logaritarische Wahrscheinlichkeit, um die Temperatur automatisch zu erhöhen, bis bestimmte Schwellenwerte erreicht sind.	No	0

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	Objekt
Textdatei/Klartext	string	Transkribierter Text im Ausgabeformat (wenn response_format eines von Text, VTT oder SRT war).

Beispiele

Example

Erhält englischsprachigen transkribierten Text und zugehörige Metadaten aus bereitgestellten gesprochenen Audiodaten.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Antworten: Statuscode: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Example

Erhält englischsprachigen transkribierten Text und zugehörige Metadaten aus bereitgestellten gesprochenen Audiodaten.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Antworten: Statuscode: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Rede – Erstellen

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview

Erzeugt Audio aus dem Eingabetext.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
Bereitstellungs-ID	path	Ja	string
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Typ: mehrteilige Formulardaten (multipart/form-data)

Name	Typ	Beschreibung	Erforderlich	Vorgabe
input	string	Der Text, um Audio zu synthetisieren. Die maximale Länge beträgt 4.096 Zeichen.	Ja
Antwortformat	enum	Das Format, um das Audio zu synthetisieren. Mögliche Werte: `mp3`, `opus`, , `aacflac`, `wav`,`pcm`	No
Geschwindigkeit	number	Die Geschwindigkeit des synthetisierten Audios. Wählen Sie einen Wert von bis `0.254.0`aus. `1.0` ist der Standard.	No	1.0
Stimme	enum	Die Stimme für Sprachsynthese. Mögliche Werte: `alloy`, `echo`, , `fableonyx`, `nova`,`shimmer`	Ja

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/octet-stream	string

Beispiele

Example

Synthetisiert Audio aus dem bereitgestellten Text.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview

{
 "input": "Hi! What are you going to make?",
 "voice": "fable",
 "response_format": "mp3"
}

Antworten: Statuscode: 200

{
  "body": "101010101"
}

Bildgenerierungen – Erstellen

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview

Erzeugt einen Batch von Bildern aus einer Textunterschrift bei der Bereitstellung eines gegebenen Bildgenerierungsmodells

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
Bereitstellungs-ID	path	Ja	string
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Hintergrund	imageBackground	Ermöglicht es, Transparenz für den Hintergrund der generierten Bilder einzustellen. Dieser Parameter wird nur für GPT-Image-1-Serienmodelle unterstützt.	No	auto
n	Ganzzahl	Die Anzahl der zu erzeugenden Bilder. Für dall-e-3 wird nur n=1 unterstützt.	No	1
Ausgabekomprimierung	Ganzzahl	Der Kompressionswert (0–100%) für die erzeugten Bilder. Dieser Parameter wird nur für GPT-Image-1-Serienmodelle mit dem JPEG-Ausgabeformat unterstützt.	No	100
Ausgabeformat	imagesOutputFormat	Das Dateiformat, in dem die generierten Bilder zurückgegeben werden. Wird nur für GPT-Image-1-Modelle unterstützt.	No	png
Eingabeaufforderung	string	Eine Textbeschreibung des gewünschten Bildes. Die maximale Länge beträgt 32.000 Zeichen für die GPT-Image-1-Serie und 4.000 Zeichen für Dall-e-3	Ja
unvollständige Bilder	Ganzzahl	Die Anzahl der zu generierenden Teilbilder. Dieser Parameter wird für Streaming-Antworten verwendet, die teilweise Bilder zurückgeben. Der Wert muss zwischen 0 und 3 liegen. Wenn auf 0 gesetzt, ist die Antwort ein einzelnes Bild, das in einem Streaming-Event gesendet wird. Beachten Sie, dass das endgültige Bild möglicherweise gesendet wird, bevor die volle Anzahl der Teilbilder erzeugt wurde, wenn das vollständige Bild schneller erzeugt wird.	0
stream	Boolescher Wert	Bearbeite das Bild im Streaming-Modus.	nein	`false`
Qualität	imageQuality	Die Qualität des erzeugten Bildes.	No	auto
Antwortformat	imagesResponseFormat	Das Format, in dem die generierten Bilder zurückgegeben werden. Dieser Parameter wird für `gpt-image-1`-Serien-Modelle nicht unterstützt, die immer base64-codierte Bilder zurückgeben. Mögliche Werte: `url`, `b64_json`.	No	url
size	imageSize	Die Größe der generierten Bilder.	No	auto
Stil	imageStyle	Der Stil der generierten Bilder. Nur für DALL-e-3 unterstützt.	No	vivid
user	string	Eine eindeutige Kennung, die Ihren Endnutzer repräsentiert und dabei helfen kann, Missbrauch zu überwachen und zu erkennen.	No

Antworten

Statuscode: 200

Beschreibung: Ok

Inhaltstyp	Typ	Beschreibung
application/json	generateImagesResponse

Statuscode: Standard

Beschreibung: Ein Fehler ist aufgetreten.

Inhaltstyp	Typ	Beschreibung
application/json	dalleErrorResponse

Beispiele

Example

Erstellt Bilder mit einem Prompt.

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview

{
 "prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
 "n": 1,
 "style": "natural",
 "quality": "standard"
}

Antworten: Statuscode: 200

{
  "body": {
    "created": 1698342300,
    "data": [
      {
        "revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
        "prompt_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          },
          "profanity": {
            "detected": false,
            "filtered": false
          },
          "custom_blocklists": {
            "filtered": false,
            "details": []
          }
        },
        "url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
        "content_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          }
        }
      }
    ]
  }
}

Bilderzeugungen – Bearbeiten

POST https://{endpoint}/openai/deployments/{deployment-id}/images/edits?api-version=2025-04-01-preview

Bearbeitet ein Bild aus einer Textunterschrift auf einer gegebenen GPT-Image-1-Modellbereitstellung

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
Bereitstellungs-ID	path	Ja	string
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Typ: mehrteilige Formulardaten (multipart/form-data)

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Bild	Saite oder Array	Die Bild(e) zum Bearbeiten. Muss eine unterstützte Bilddatei oder ein Array von Bildern sein. Jedes Bild sollte eine PNG- oder jpg-Datei mit weniger als 50 MB sein.	Ja
input_fidelity	string	Kontrollieren Sie, wie viel Aufwand das Modell aufwenden wird, um den Stil und die Merkmale, insbesondere Gesichtszüge, der Eingabebilder anzupassen. Dieser Parameter wird nur für GPT-Image-1-Serienmodelle unterstützt. Supports `high` und `low`.	nein	`low`.
mask	string	Ein zusätzliches Bild, dessen vollständig transparente Flächen (z. B. bei null Alpha) anzeigen, wo das Bild bearbeitet werden soll. Wenn mehrere Bilder bereitgestellt werden, wird die Maske auf das erste Bild angewendet. Es muss eine gültige PNG-Datei sein, weniger als 4 MB, und die gleichen Abmessungen wie das Bild haben.	No
n	Ganzzahl	Die Anzahl der zu erzeugenden Bilder. Muss zwischen 1 und 10 liegen.	No	1
Eingabeaufforderung	string	Eine Textbeschreibung des gewünschten Bildes. Die maximale Länge beträgt 32.000 Zeichen.	Ja
Qualität	imageQuality	Die Qualität des erzeugten Bildes.	No	auto
unvollständige Bilder	Die Anzahl der zu generierenden Teilbilder. Dieser Parameter wird für Streaming-Antworten verwendet, die teilweise Bilder zurückgeben. Der Wert muss zwischen 0 und 3 liegen. Wenn auf 0 gesetzt, ist die Antwort ein einzelnes Bild, das in einem Streaming-Event gesendet wird. Beachten Sie, dass das endgültige Bild möglicherweise gesendet wird, bevor die volle Anzahl der Teilbilder erzeugt wurde, wenn das vollständige Bild schneller erzeugt wird.
stream	Boolescher Wert	Bearbeite das Bild im Streaming-Modus.	nein	`false`
Antwortformat	imagesResponseFormat	Das Format, in dem die generierten Bilder zurückgegeben werden.	No	url
size	imageSize	Die Größe der generierten Bilder.	No	auto
user	string	Eine eindeutige Kennung, die Ihren Endnutzer repräsentiert und dabei helfen kann, Missbrauch zu überwachen und zu erkennen.	No

Antworten

Statuscode: 200

Beschreibung: Ok

Inhaltstyp	Typ	Beschreibung
application/json	generateImagesResponse

Statuscode: Standard

Beschreibung: Ein Fehler ist aufgetreten.

Inhaltstyp	Typ	Beschreibung
application/json	dalleErrorResponse

Liste – Assistenten

Note

Die Assistants API ist eingestellt und wird am 26. August 2026 eingestellt. Nutzen Sie den allgemein verfügbaren Service Microsoft Foundry Agents. Folgen Sie dem Migrationsleitfaden, um Ihre Arbeitslasten zu aktualisieren. Erfahren Sie mehr.

GET https://{endpoint}/openai/assistants?api-version=2025-04-01-preview

Gibt eine Liste der Assistenten zurück.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
Begrenzung	Anfrage	No	Ganzzahl	Eine Begrenzung der Anzahl der zurückzugebenden Objekte. Das Limit kann zwischen 1 und 100 liegen, und der Standard liegt bei 20.
order	Anfrage	No	string Mögliche Werte: `asc`, `desc`	Sortiere die Reihenfolge nach dem `created_at` Zeitstempel der Objekte. `asc` für aufsteigende und `desc` absteigende Ordnung.
Nach	Anfrage	No	string	Ein Cursor für die Paginierung. `after` ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, die mit obj_foo enden, kann Ihr nachfolgender Aufruf after=obj_foo enthalten, um die nächste Seite der Liste abzurufen.
before	Anfrage	No	string	Ein Cursor für die Paginierung. `before` ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, beginnend mit obj_foo, kann Ihr nachfolgender Aufruf before=obj_foo enthalten, um die vorherige Seite der Liste abzurufen.
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	listAssistantsResponse

Beispiele

Example

Gibt eine Liste der Assistenten zurück.

GET https://{endpoint}/openai/assistants?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "asst_abc123",
        "object": "assistant",
        "created_at": 1707257477,
        "name": "Stock Analyst",
        "description": null,
        "model": "gpt-4-1106-preview",
        "instructions": "You are a financial analyst that analyzes stock market prices and other financial data present on user uploaded files or by calling external APIs.",
        "tools": [
          {
            "type": "code_interpreter"
          }
        ],
        "tool_resources": {},
        "metadata": {},
        "top_p": 1.0,
        "temperature": 1.0,
        "response_format": "auto"
      },
      {
        "id": "asst_abc456",
        "object": "assistant",
        "created_at": 1698982718,
        "name": "My Assistant",
        "description": null,
        "model": "gpt-4-turbo",
        "instructions": "You are a helpful assistant designed to make me better at coding!",
        "tools": [],
        "tool_resources": {},
        "metadata": {},
        "top_p": 1.0,
        "temperature": 1.0,
        "response_format": "auto"
      },
      {
        "id": "asst_abc789",
        "object": "assistant",
        "created_at": 1698982643,
        "name": null,
        "description": null,
        "model": "gpt-4-turbo",
        "instructions": null,
        "tools": [],
        "tool_resources": {},
        "metadata": {},
        "top_p": 1.0,
        "temperature": 1.0,
        "response_format": "auto"
      }
    ],
    "first_id": "asst_abc123",
    "last_id": "asst_abc789",
    "has_more": false
  }
}

Erstellen – Assistent

POST https://{endpoint}/openai/assistants?api-version=2025-04-01-preview

Erstelle einen Assistenten mit einem Modell und Anleitungen.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Beschreibung	string	Die Beschreibung des Assistenten. Die maximale Länge beträgt 512 Zeichen.	No
Anweisungen	string	Die Systemanweisungen, die der Assistent verwendet. Die maximale Länge beträgt 256.000 Zeichen.	No
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	No
Modell	string		Ja
Name	string	Der Name des Assistenten. Die maximale Länge beträgt 256 Zeichen.	No
Antwortformat	assistantsApiResponseFormatOption	Spezifiziert das Format, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit `gpt-3.5-turbo-1106`. Einstellung aktiviert `{ "type": "json_schema", "json_schema": {...} }` strukturierte Ausgaben, die sicherstellen, dass das Modell mit deinem bereitgestellten JSON-Schema übereinstimmt. Erfahren Sie mehr im Leitfaden für strukturierte Ausgaben. Einstellung aktiviert den `{ "type": "json_object" }` JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültig ist. Wichtig: Beim Einsatz des JSON-Modus müssen Sie das Modell auch anweisen, selbst JSON über eine System- oder Benutzernachricht zu erzeugen. Ohne dies kann das Modell einen endlosen Strom von Leerraum erzeugen, bis die Erzeugung das Token-Limit erreicht, was zu einer langanhaltenden und scheinbar "festgefahrenen" Anfrage führt. Beachten Sie auch, dass der Nachrichteninhalt teilweise abgeschnitten werden kann, wenn `finish_reason="length"`, was darauf hinweist, dass die Generation überschritten `max_tokens` wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.	No
Temperatur	number	Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen.	No	1
tool_resources	Objekt	Eine Sammlung von Ressourcen, die von den Werkzeugen des Assistenten genutzt werden. Die Ressourcen sind spezifisch für die Art des Werkzeugs. Zum Beispiel benötigt das `code_interpreter` Tool eine Liste von Datei-IDs, während das `file_search` Tool eine Liste von Vektorspeicher-IDs benötigt.	No
└– code_interpreter	Objekt		No
└– file_ids	array	Eine Liste der Datei-IDs, die dem `code_interpreter` Tool zur Verfügung gestellt wurden. Es können maximal 20 Dateien mit dem Tool verknüpft sein.	No	[]
└– Dateisuche	Objekt		No
└– vector_store_ids	array	Der Vektorspeicher ist mit diesem Assistenten verbunden. Maximal 1 Vektorspeicher kann an den Assistenten angeschlossen sein.	No
└– Vektorspeicher	array	Ein Helfer, um mit file_ids einen Vektorspeicher zu erstellen und ihn an diesen Assistenten anzuhängen. Maximal 1 Vektorspeicher kann an den Assistenten angeschlossen sein.	No
tools	array	Eine Liste der auf dem Assistenten aktivierten Tools. Es können maximal 128 Werkzeuge pro Assistent sein. Werkzeuge können von den Typen `code_interpreter`, `retrieval`, oder `function`sein.	No	[]
top_p	number	Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden. Wir empfehlen im Allgemeinen, diese oder die Temperatur zu verändern, aber nicht beides.	No	1

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	assistantObject

Beispiele

Example

Erstelle einen Assistenten mit einem Modell und Anleitungen.

POST https://{endpoint}/openai/assistants?api-version=2025-04-01-preview

{
 "name": "Math Tutor",
 "instructions": "When a customer asks about a specific math problem, use Python to evaluate their query.",
 "tools": [
  {
   "type": "code_interpreter"
  }
 ],
 "model": "gpt-4-1106-preview"
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "asst_4nsG2qgNzimRPE7MazXTXbU7",
    "object": "assistant",
    "created_at": 1707295707,
    "name": "Math Tutor",
    "description": null,
    "model": "gpt-4-1106-preview",
    "instructions": "When a customer asks about a specific math problem, use Python to evaluate their query.",
    "tools": [
      {
        "type": "code_interpreter"
      }
    ],
    "metadata": {},
    "top_p": 1.0,
    "temperature": 1.0,
    "response_format": "auto"
  }
}

Hole - Assistent

GET https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

Holt einen Assistenten.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
assistant_id	path	Ja	string	Die ID des Assistenten zu holen.
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	assistantObject

Beispiele

Example

Holt einen Assistenten.

GET https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "asst_abc123",
    "object": "assistant",
    "created_at": 1699009709,
    "name": "HR Helper",
    "description": null,
    "model": "gpt-4-turbo",
    "instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies.",
    "tools": [
      {
        "type": "file_search"
      }
    ],
    "metadata": {},
    "top_p": 1.0,
    "temperature": 1.0,
    "response_format": "auto"
  }
}

Modify – Assistent

POST https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

Verändert einen Assistenten.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
assistant_id	path	Ja	string	Die ID des Assistenten zum Anpassen.
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Beschreibung	string	Die Beschreibung des Assistenten. Die maximale Länge beträgt 512 Zeichen.	No
Anweisungen	string	Die Systemanweisungen, die der Assistent verwendet. Die maximale Länge beträgt 32.768 Zeichen.	No
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	No
Modell	string		No
Name	string	Der Name des Assistenten. Die maximale Länge beträgt 256 Zeichen.	No
Antwortformat	assistantsApiResponseFormatOption	Spezifiziert das Format, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit `gpt-3.5-turbo-1106`. Einstellung aktiviert `{ "type": "json_schema", "json_schema": {...} }` strukturierte Ausgaben, die sicherstellen, dass das Modell mit deinem bereitgestellten JSON-Schema übereinstimmt. Erfahren Sie mehr im Leitfaden für strukturierte Ausgaben. Einstellung aktiviert den `{ "type": "json_object" }` JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültig ist. Wichtig: Beim Einsatz des JSON-Modus müssen Sie das Modell auch anweisen, selbst JSON über eine System- oder Benutzernachricht zu erzeugen. Ohne dies kann das Modell einen endlosen Strom von Leerraum erzeugen, bis die Erzeugung das Token-Limit erreicht, was zu einer langanhaltenden und scheinbar "festgefahrenen" Anfrage führt. Beachten Sie auch, dass der Nachrichteninhalt teilweise abgeschnitten werden kann, wenn `finish_reason="length"`, was darauf hinweist, dass die Generation überschritten `max_tokens` wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.	No
Temperatur	number	Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen.	No	1
tool_resources	Objekt	Eine Sammlung von Ressourcen, die von den Werkzeugen des Assistenten genutzt werden. Die Ressourcen sind spezifisch für die Art des Werkzeugs. Zum Beispiel benötigt das `code_interpreter` Tool eine Liste von Datei-IDs, während das `file_search` Tool eine Liste von Vektorspeicher-IDs benötigt.	No
└– code_interpreter	Objekt		No
└– file_ids	array	Überschreibt die Liste der Datei-IDs, die dem `code_interpreter` Tool zur Verfügung stehen. Es können maximal 20 Dateien mit dem Tool verknüpft sein.	No	[]
└– Dateisuche	Objekt		No
└– vector_store_ids	array	Überschreibt den Vektorspeicher, der diesem Assistenten zugeordnet ist. Maximal 1 Vektorspeicher kann an den Assistenten angeschlossen sein.	No
tools	array	Eine Liste der auf dem Assistenten aktivierten Tools. Es können maximal 128 Werkzeuge pro Assistent sein. Werkzeuge können von den Typen `code_interpreter`, `retrieval`, oder `function`sein.	No	[]
top_p	number	Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden. Wir empfehlen im Allgemeinen, diese oder die Temperatur zu verändern, aber nicht beides.	No	1

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	assistantObject

Beispiele

Example

Verändert einen Assistenten.

POST https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

{
 "instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies. Always response with info from either of the files.",
 "tools": [
  {
   "type": "file_search"
  }
 ],
 "model": "gpt-4-turbo"
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "asst_123",
    "object": "assistant",
    "created_at": 1699009709,
    "name": "HR Helper",
    "description": null,
    "model": "gpt-4-turbo",
    "instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies. Always response with info from either of the files.",
    "tools": [
      {
        "type": "file_search"
      }
    ],
    "tool_resources": {
      "file_search": {
        "vector_store_ids": []
      }
    },
    "metadata": {},
    "top_p": 1.0,
    "temperature": 1.0,
    "response_format": "auto"
  }
}

Löschen – Assistent

DELETE https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

Löschen Sie einen Assistenten.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
assistant_id	path	Ja	string	Die ID des Assistenten zum Löschen.
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	deleteAssistantResponse

Beispiele

Example

Löscht einen Assistenten.

DELETE https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "asst_4nsG2qgNzimRPE7MazXTXbU7",
    "object": "assistant.deleted",
    "deleted": true
  }
}

Erstellen - Thread

Note

POST https://{endpoint}/openai/threads?api-version=2025-04-01-preview

Erstelle einen Thread.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Nachrichten	array	Eine Liste von Nachrichten, mit denen man den Thread beginnen kann.	No
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	No
tool_resources	Objekt	Eine Sammlung von Ressourcen, die den Werkzeugen des Assistenten in diesem Thread zur Verfügung gestellt werden. Die Ressourcen sind spezifisch für die Art des Werkzeugs. Zum Beispiel benötigt das `code_interpreter` Tool eine Liste von Datei-IDs, während das `file_search` Tool eine Liste von Vektorspeicher-IDs benötigt.	No
└– code_interpreter	Objekt		No
└– file_ids	array	Eine Liste der Datei-IDs, die dem `code_interpreter` Tool zur Verfügung gestellt wurden. Es können maximal 20 Dateien mit dem Tool verknüpft sein.	No	[]
└– Dateisuche	Objekt		No
└– vector_store_ids	array	Der Vektorspeicher, der an diesen Thread angeschlossen ist. Maximal 1 Vektorspeicher kann an den Thread angeschlossen sein.	No
└– Vektorspeicher	array	Ein Helfer, um mit file_ids einen Vektorspeicher zu erstellen und an diesen Thread anzuhängen. Maximal 1 Vektorspeicher kann an den Thread angeschlossen sein.	No

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	threadObject

Beispiele

Example

Erstellt einen Thread.

POST https://{endpoint}/openai/threads?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "object": "thread",
    "created_at": 1707297136,
    "metadata": {}
  }
}

Get - Thread

GET https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

Ruft einen Faden ab.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id	path	Ja	string	Die ID des abzurufenden Threads.
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	threadObject

Beispiele

Example

Ruft einen Faden ab.

GET https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "object": "thread",
    "created_at": 1707297136,
    "metadata": {},
    "tool_resources": {
      "code_interpreter": {
        "file_ids": []
      }
    }
  }
}

Modify – Thread

POST https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

Verändert einen Thread.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id	path	Ja	string	Die ID des Threads zum Anpassen. Nur die kann `metadata` modifiziert werden.
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name	Typ	Beschreibung	Erforderlich	Vorgabe
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	No
tool_resources	Objekt	Eine Sammlung von Ressourcen, die den Werkzeugen des Assistenten in diesem Thread zur Verfügung gestellt werden. Die Ressourcen sind spezifisch für die Art des Werkzeugs. Zum Beispiel benötigt das `code_interpreter` Tool eine Liste von Datei-IDs, während das `file_search` Tool eine Liste von Vektorspeicher-IDs benötigt.	No
└– code_interpreter	Objekt		No
└– file_ids	array	Eine Liste der Datei-IDs, die dem `code_interpreter` Tool zur Verfügung gestellt wurden. Es können maximal 20 Dateien mit dem Tool verknüpft sein.	No	[]
└– Dateisuche	Objekt		No
└– vector_store_ids	array	Der Vektorspeicher, der an diesen Thread angeschlossen ist. Maximal 1 Vektorspeicher kann an den Thread angeschlossen sein.	No

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	threadObject

Beispiele

Example

Verändert einen Thread.

POST https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

{
 "metadata": {
  "modified": "true",
  "user": "abc123"
 }
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "object": "thread",
    "created_at": 1707297136,
    "metadata": {
      "modified": "true",
      "user": "abc123"
    },
    "tool_resources": {}
  }
}

Löschen – Thread

DELETE https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

Lösche einen Thread.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id	path	Ja	string	Die ID des Threads, den gelöscht werden soll.
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	deleteThreadResponse

Beispiele

Example

Löscht einen Thread.

DELETE https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "object": "thread.deleted",
    "deleted": true
  }
}

Liste – Nachrichten

Note

GET https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview

Gibt eine Liste von Nachrichten für einen gegebenen Thread zurück.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id	path	Ja	string	Die ID der Threads, zu denen die Nachrichten gehören.
Begrenzung	Anfrage	No	Ganzzahl	Eine Begrenzung der Anzahl der zurückzugebenden Objekte. Das Limit kann zwischen 1 und 100 liegen, und der Standard liegt bei 20.
order	Anfrage	No	string Mögliche Werte: `asc`, `desc`	Sortiere die Reihenfolge nach dem `created_at` Zeitstempel der Objekte. `asc` für aufsteigende und `desc` absteigende Ordnung.
Nach	Anfrage	No	string	Ein Cursor für die Paginierung. `after` ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, die mit obj_foo enden, kann Ihr nachfolgender Aufruf after=obj_foo enthalten, um die nächste Seite der Liste abzurufen.
before	Anfrage	No	string	Ein Cursor für die Paginierung. `before` ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, beginnend mit obj_foo, kann Ihr nachfolgender Aufruf before=obj_foo enthalten, um die vorherige Seite der Liste abzurufen.
run_id	Anfrage	No	string	Filtere Nachrichten nach der Run-ID, die sie generiert hat.
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	listMessagesResponse

Beispiele

Example

Nachrichten auflisten

GET https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "msg_abc123",
        "object": "thread.message",
        "created_at": 1699016383,
        "assistant_id": null,
        "thread_id": "thread_abc123",
        "run_id": null,
        "role": "user",
        "content": [
          {
            "type": "text",
            "text": {
              "value": "How does AI work? Explain it in simple terms.",
              "annotations": []
            }
          }
        ],
        "attachments": [],
        "metadata": {}
      },
      {
        "id": "msg_abc456",
        "object": "thread.message",
        "created_at": 1699016383,
        "assistant_id": null,
        "thread_id": "thread_abc123",
        "run_id": null,
        "role": "user",
        "content": [
          {
            "type": "text",
            "text": {
              "value": "Hello, what is AI?",
              "annotations": []
            }
          }
        ],
        "attachments": [],
        "metadata": {}
      }
    ],
    "first_id": "msg_abc123",
    "last_id": "msg_abc456",
    "has_more": false
  }
}

Erstellen – Nachricht

POST https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview

Erstellen Sie eine Botschaft.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id	path	Ja	string	Die ID der Threads, für die eine Nachricht erstellt werden soll.
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name	Typ	Beschreibung	Erforderlich
Anhänge	array	Eine Liste der an die Nachricht angehängten Dateien und die Werkzeuge, zu denen sie hinzugefügt werden sollten.	No
Inhalt	string	Der Inhalt der Nachricht.	Ja
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	No
Rolle	string	Die Rolle der Entität, die die Botschaft erschafft. Erlaubte Werte umfassen: - `user`: Zeigt an, dass die Nachricht von einem tatsächlichen Benutzer gesendet wurde und in den meisten Fällen zur Darstellung von benutzergenerierten Nachrichten verwendet werden sollte. - `assistant`: Zeigt an, dass die Nachricht vom Assistenten generiert wurde. Verwenden Sie diesen Wert, um Nachrichten vom Assistenten in das Gespräch einzufügen.	Ja

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	messageObject

Beispiele

Example

Erstellen Sie eine Botschaft.

POST https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview

{
 "role": "user",
 "content": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces."
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "msg_as3XIk1tpVP3hdHjWBGg3uG4",
    "object": "thread.message",
    "created_at": 1707298421,
    "assistant_id": null,
    "thread_id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "run_id": null,
    "role": "user",
    "content": [
      {
        "type": "text",
        "text": {
          "value": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces.",
          "annotations": []
        }
      }
    ],
    "attachments": [],
    "metadata": {}
  }
}

Erhalten - Nachricht

GET https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview

Holen Sie eine Nachricht ab.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id	path	Ja	string	Die ID der Threads, zu denen diese Nachricht gehört.
message_id	path	Ja	string	Die ID der abzurufenden Nachricht.
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	messageObject

Beispiele

Example

Holen Sie eine Nachricht ab.

GET https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "msg_as3XIk1tpVP3hdHjWBGg3uG4",
    "object": "thread.message",
    "created_at": 1707298421,
    "thread_id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "role": "user",
    "content": [
      {
        "type": "text",
        "text": {
          "value": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces.",
          "annotations": []
        }
      }
    ],
    "file_ids": [],
    "assistant_id": null,
    "run_id": null,
    "metadata": {}
  }
}

Ändern – Nachricht

POST https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview

Verändert eine Nachricht.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id	path	Ja	string	Die ID des Threads, zu dem diese Nachricht gehört.
message_id	path	Ja	string	Die ID der Nachricht, die geändert werden soll.
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name	Typ	Beschreibung	Erforderlich	Vorgabe
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	No

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	messageObject

Beispiele

Example

Ändere eine Nachricht.

POST https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview

{
 "metadata": {
  "modified": "true",
  "user": "abc123"
 }
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "msg_abc123",
    "object": "thread.message",
    "created_at": 1699017614,
    "assistant_id": null,
    "thread_id": "thread_abc123",
    "run_id": null,
    "role": "user",
    "content": [
      {
        "type": "text",
        "text": {
          "value": "How does AI work? Explain it in simple terms.",
          "annotations": []
        }
      }
    ],
    "file_ids": [],
    "metadata": {
      "modified": "true",
      "user": "abc123"
    }
  }
}

Erstellen – Thread erstellen und ausführen

Note

POST https://{endpoint}/openai/threads/runs?api-version=2025-04-01-preview

Erstelle einen Thread und führe ihn in einer Anfrage aus.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name	Typ	Beschreibung	Erforderlich	Vorgabe
assistant_id	string	Die ID des Assistenten, um diesen Durchgang auszuführen.	Ja
Anweisungen	string	Überschreiben Sie die Standard-Systemnachricht des Assistenten. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern.	No
max_completion_tokens	Ganzzahl	Die maximale Anzahl der Vervollständigungstoken, die im Verlauf des Durchlaufs verwendet werden dürfen. Der Lauf bemüht sich, nur die angegebene Anzahl der Abschlussmarker über mehrere Runden zu verwenden. Übersteigt der Run die angegebene Anzahl der Completion Tokens, endet der Run mit dem Status `incomplete`. Siehe `incomplete_details` für weitere Informationen.	No
max_prompt_tokens	Ganzzahl	Die maximale Anzahl der Prompt-Token, die im Verlauf des Laufs verwendet werden können. Der Lauf bemüht sich, nur die angegebene Anzahl der Prompt-Token über mehrere Runden zu verwenden. Übersteigt der Lauf die angegebene Anzahl der Prompt-Tokens, endet der Lauf mit dem Status `incomplete`. Siehe `incomplete_details` für weitere Informationen.	No
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	No
Modell	string	Die ID der Modelle, die für diesen Durchlauf verwendet werden sollen. Wenn hier ein Wert angegeben wird, überschreibt er das mit dem Assistenten verbundene Modell. Falls nicht, wird das mit dem Assistenten verbundene Modell verwendet.	No
Parallele Werkzeugaufrufe	ParallelToolCalls	Ob man während der Werkzeugnutzung parallele Funktionsaufrufe aktivieren soll.	No	Richtig
Antwortformat	assistantsApiResponseFormatOption	Spezifiziert das Format, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit `gpt-3.5-turbo-1106`. Einstellung aktiviert `{ "type": "json_schema", "json_schema": {...} }` strukturierte Ausgaben, die sicherstellen, dass das Modell mit deinem bereitgestellten JSON-Schema übereinstimmt. Erfahren Sie mehr im Leitfaden für strukturierte Ausgaben. Einstellung aktiviert den `{ "type": "json_object" }` JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültig ist. Wichtig: Beim Einsatz des JSON-Modus müssen Sie das Modell auch anweisen, selbst JSON über eine System- oder Benutzernachricht zu erzeugen. Ohne dies kann das Modell einen endlosen Strom von Leerraum erzeugen, bis die Erzeugung das Token-Limit erreicht, was zu einer langanhaltenden und scheinbar "festgefahrenen" Anfrage führt. Beachten Sie auch, dass der Nachrichteninhalt teilweise abgeschnitten werden kann, wenn `finish_reason="length"`, was darauf hinweist, dass die Generation überschritten `max_tokens` wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.	No
stream	Boolescher Wert	Wenn `true`, gibt einen Strom von Ereignissen zurück, die während des Runs als servergesendete Ereignisse auftreten, und endet, wenn der Run mit einer `data: [DONE]` Nachricht in einen Terminalzustand eintritt.	No
stream_options	chatCompletionStreamOptions	Optionen für Streaming-Antworten. Setzen Sie dies nur, wenn Sie `stream: true`setzen.	No	Nichts
Temperatur	number	Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen.	No	1
thread	createThreadRequest		No
tool_choice	assistantsApiToolChoiceOption	Kontrolliert, welches (falls vorhandenes) Werkzeug vom Modell aufgerufen wird. `none` Das bedeutet, dass das Modell keine Werkzeuge aufruft, sondern stattdessen eine Nachricht generiert. `auto` ist der Standardwert und bedeutet, dass das Modell zwischen der Generierung einer Nachricht oder dem Aufrufen eines Werkzeugs wählen kann. Ein bestimmtes Werkzeug zu spezifizieren oder `{"type": "file_search"}{"type": "function", "function": {"name": "my_function"}}` das Modell zu zwingen, dieses Tool aufzurufen.	No
tool_resources	Objekt	Eine Sammlung von Ressourcen, die von den Werkzeugen des Assistenten genutzt werden. Die Ressourcen sind spezifisch für die Art des Werkzeugs. Zum Beispiel benötigt das `code_interpreter` Tool eine Liste von Datei-IDs, während das `file_search` Tool eine Liste von Vektorspeicher-IDs benötigt.	No
└– code_interpreter	Objekt		No
└– file_ids	array	Eine Liste der Datei-IDs, die dem `code_interpreter` Tool zur Verfügung gestellt wurden. Es können maximal 20 Dateien mit dem Tool verknüpft sein.	No	[]
└– Dateisuche	Objekt		No
└– vector_store_ids	array	Die ID des Vektorspeichers, der mit diesem Assistenten verbunden ist. Maximal 1 Vektorspeicher kann an den Assistenten angeschlossen sein.	No
tools	array	Überschreiben Sie die Werkzeuge, die der Assistent für diesen Durchlauf verwenden kann. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern.	No
top_p	number	Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden. Wir empfehlen im Allgemeinen, diese oder die Temperatur zu verändern, aber nicht beides.	No	1
truncation_strategy	truncationObject	Steuerungen, wie ein Thread vor dem Durchlauf abgeschnitten wird. Nutze dies, um das anfängliche Kontextfenster des Laufs zu steuern.	No

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	runObject

Beispiele

Example

Erstelle einen Thread und führe ihn in einer Anfrage aus.

POST https://{endpoint}/openai/threads/runs?api-version=2025-04-01-preview

{
 "assistant_id": "asst_abc123",
 "thread": {
  "messages": [
   {
    "role": "user",
    "content": "Explain deep learning to a 5 year old."
   }
  ]
 }
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "run_abc123",
    "object": "thread.run",
    "created_at": 1699076792,
    "assistant_id": "asst_abc123",
    "thread_id": "thread_abc123",
    "status": "queued",
    "started_at": null,
    "expires_at": 1699077392,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": null,
    "required_action": null,
    "last_error": null,
    "model": "gpt-4-turbo",
    "instructions": "You are a helpful assistant.",
    "tools": [],
    "tool_resources": {},
    "metadata": {},
    "temperature": 1.0,
    "top_p": 1.0,
    "max_completion_tokens": null,
    "max_prompt_tokens": null,
    "truncation_strategy": {
      "type": "auto",
      "last_messages": null
    },
    "incomplete_details": null,
    "usage": null,
    "response_format": "auto",
    "tool_choice": "auto"
  }
}

Liste - Runs

GET https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview

Gibt eine Liste von Läufen zurück, die zu einem Thread gehören.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id	path	Ja	string	Die ID des Threads, zu dem der Lauf gehört.
Begrenzung	Anfrage	No	Ganzzahl	Eine Begrenzung der Anzahl der zurückzugebenden Objekte. Das Limit kann zwischen 1 und 100 liegen, und der Standard liegt bei 20.
order	Anfrage	No	string Mögliche Werte: `asc`, `desc`	Sortiere die Reihenfolge nach dem `created_at` Zeitstempel der Objekte. `asc` für aufsteigende und `desc` absteigende Ordnung.
Nach	Anfrage	No	string	Ein Cursor für die Paginierung. `after` ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, die mit obj_foo enden, kann Ihr nachfolgender Aufruf after=obj_foo enthalten, um die nächste Seite der Liste abzurufen.
before	Anfrage	No	string	Ein Cursor für die Paginierung. `before` ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, beginnend mit obj_foo, kann Ihr nachfolgender Aufruf before=obj_foo enthalten, um die vorherige Seite der Liste abzurufen.
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	listRunsResponse

Beispiele

Example

Gibt eine Liste von Läufen zurück, die zu einem Thread gehören.

GET https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "run_abc123",
        "object": "thread.run",
        "created_at": 1699075072,
        "assistant_id": "asst_abc123",
        "thread_id": "thread_abc123",
        "status": "completed",
        "started_at": 1699075072,
        "expires_at": null,
        "cancelled_at": null,
        "failed_at": null,
        "completed_at": 1699075073,
        "last_error": null,
        "model": "gpt-4-turbo",
        "instructions": null,
        "incomplete_details": null,
        "tools": [
          {
            "type": "code_interpreter"
          }
        ],
        "tool_resources": {
          "code_interpreter": {
            "file_ids": [
              "file-abc123",
              "file-abc456"
            ]
          }
        },
        "metadata": {},
        "usage": {
          "prompt_tokens": 123,
          "completion_tokens": 456,
          "total_tokens": 579
        },
        "temperature": 1.0,
        "top_p": 1.0,
        "max_prompt_tokens": 1000,
        "max_completion_tokens": 1000,
        "truncation_strategy": {
          "type": "auto",
          "last_messages": null
        },
        "response_format": "auto",
        "tool_choice": "auto"
      },
      {
        "id": "run_abc456",
        "object": "thread.run",
        "created_at": 1699063290,
        "assistant_id": "asst_abc123",
        "thread_id": "thread_abc123",
        "status": "completed",
        "started_at": 1699063290,
        "expires_at": null,
        "cancelled_at": null,
        "failed_at": null,
        "completed_at": 1699063291,
        "last_error": null,
        "model": "gpt-4-turbo",
        "instructions": null,
        "incomplete_details": null,
        "tools": [
          {
            "type": "code_interpreter"
          }
        ],
        "tool_resources": {
          "code_interpreter": {
            "file_ids": [
              "file-abc123",
              "file-abc456"
            ]
          }
        },
        "metadata": {},
        "usage": {
          "prompt_tokens": 123,
          "completion_tokens": 456,
          "total_tokens": 579
        },
        "temperature": 1.0,
        "top_p": 1.0,
        "max_prompt_tokens": 1000,
        "max_completion_tokens": 1000,
        "truncation_strategy": {
          "type": "auto",
          "last_messages": null
        },
        "response_format": "auto",
        "tool_choice": "auto"
      }
    ],
    "first_id": "run_abc123",
    "last_id": "run_abc456",
    "has_more": false
  }
}

Erstellen – Ausführen

POST https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview

Erstelle einen Durchlauf.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id	path	Ja	string	Die ID des Threads, der ausgeführt werden soll.
include[]	Anfrage	No	array	Eine Liste zusätzlicher Felder, die in die Antwort aufgenommen werden sollten. Derzeit ist `step_details.tool_calls[].file_search.results[].content` der einzige unterstützte Wert, den Inhalt der Dateisuchergebnisse abzurufen.
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name	Typ	Beschreibung	Erforderlich	Vorgabe
additional_instructions	string	Fügen Sie am Ende der Anweisungen für den Durchlauf zusätzliche Anweisungen hinzu. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern, ohne andere Anweisungen zu überschreiben.	No
additional_messages	array	Fügt dem Thread vor dem Erstellen des Runs zusätzliche Nachrichten hinzu.	No
assistant_id	string	Die ID des Assistenten, um diesen Durchgang auszuführen.	Ja
Anweisungen	string	Überschreiben Sie die Standard-Systemnachricht des Assistenten. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern.	No
max_completion_tokens	Ganzzahl	Die maximale Anzahl der Vervollständigungstoken, die im Verlauf des Durchlaufs verwendet werden dürfen. Der Lauf bemüht sich, nur die angegebene Anzahl der Abschlussmarker über mehrere Runden zu verwenden. Übersteigt der Run die angegebene Anzahl der Completion Tokens, endet der Run mit dem Status `incomplete`. Siehe `incomplete_details` für weitere Informationen.	No
max_prompt_tokens	Ganzzahl	Die maximale Anzahl der Prompt-Token, die im Verlauf des Laufs verwendet werden können. Der Lauf bemüht sich, nur die angegebene Anzahl der Prompt-Token über mehrere Runden zu verwenden. Übersteigt der Lauf die angegebene Anzahl der Prompt-Tokens, endet der Lauf mit dem Status `incomplete`. Siehe `incomplete_details` für weitere Informationen.	No
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	No
Modell	string	Die ID des Modells, das für diesen Durchlauf verwendet werden soll. Wenn hier ein Wert angegeben wird, überschreibt er das mit dem Assistenten verbundene Modell. Falls nicht, wird das mit dem Assistenten verbundene Modell verwendet.	No
Parallele Werkzeugaufrufe	ParallelToolCalls	Ob man während der Werkzeugnutzung parallele Funktionsaufrufe aktivieren soll.	No	Richtig
Antwortformat	assistantsApiResponseFormatOption	Spezifiziert das Format, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit `gpt-3.5-turbo-1106`. Einstellung aktiviert `{ "type": "json_schema", "json_schema": {...} }` strukturierte Ausgaben, die sicherstellen, dass das Modell mit deinem bereitgestellten JSON-Schema übereinstimmt. Erfahren Sie mehr im Leitfaden für strukturierte Ausgaben. Einstellung aktiviert den `{ "type": "json_object" }` JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültig ist. Wichtig: Beim Einsatz des JSON-Modus müssen Sie das Modell auch anweisen, selbst JSON über eine System- oder Benutzernachricht zu erzeugen. Ohne dies kann das Modell einen endlosen Strom von Leerraum erzeugen, bis die Erzeugung das Token-Limit erreicht, was zu einer langanhaltenden und scheinbar "festgefahrenen" Anfrage führt. Beachten Sie auch, dass der Nachrichteninhalt teilweise abgeschnitten werden kann, wenn `finish_reason="length"`, was darauf hinweist, dass die Generation überschritten `max_tokens` wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.	No
stream	Boolescher Wert	Wenn `true`, gibt einen Strom von Ereignissen zurück, die während des Runs als servergesendete Ereignisse auftreten, und endet, wenn der Run mit einer `data: [DONE]` Nachricht in einen Terminalzustand eintritt.	No
Temperatur	number	Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen.	No	1
tool_choice	assistantsApiToolChoiceOption	Kontrolliert, welches (falls vorhandenes) Werkzeug vom Modell aufgerufen wird. `none` Das bedeutet, dass das Modell keine Werkzeuge aufruft, sondern stattdessen eine Nachricht generiert. `auto` ist der Standardwert und bedeutet, dass das Modell zwischen der Generierung einer Nachricht oder dem Aufrufen eines Werkzeugs wählen kann. Ein bestimmtes Werkzeug zu spezifizieren oder `{"type": "file_search"}{"type": "function", "function": {"name": "my_function"}}` das Modell zu zwingen, dieses Tool aufzurufen.	No
tools	array	Überschreiben Sie die Werkzeuge, die der Assistent für diesen Durchlauf verwenden kann. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern.	No
top_p	number	Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden. Wir empfehlen im Allgemeinen, diese oder die Temperatur zu verändern, aber nicht beides.	No	1
truncation_strategy	truncationObject	Steuerungen, wie ein Thread vor dem Durchlauf abgeschnitten wird. Nutze dies, um das anfängliche Kontextfenster des Laufs zu steuern.	No

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	runObject

Beispiele

Example

Erstelle einen Durchlauf.

POST https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview

{
 "assistant_id": "asst_abc123"
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "run_abc123",
    "object": "thread.run",
    "created_at": 1699063290,
    "assistant_id": "asst_abc123",
    "thread_id": "thread_abc123",
    "status": "queued",
    "started_at": 1699063290,
    "expires_at": null,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": 1699063291,
    "last_error": null,
    "model": "gpt-4-turbo",
    "instructions": null,
    "incomplete_details": null,
    "tools": [
      {
        "type": "code_interpreter"
      }
    ],
    "metadata": {},
    "usage": null,
    "temperature": 1.0,
    "top_p": 1.0,
    "max_prompt_tokens": 1000,
    "max_completion_tokens": 1000,
    "truncation_strategy": {
      "type": "auto",
      "last_messages": null
    },
    "response_format": "auto",
    "tool_choice": "auto"
  }
}

Lauf – Lauf

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview

Holt einen Lauf ab.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id	path	Ja	string	Die ID der durchgeführten Threads.
run_id	path	Ja	string	Die ID des Laufs zum Abholen.
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	runObject

Beispiele

Example

Macht einen Lauf.

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "run_HsO8tYM4K5AAMAHgK0J3om8Q",
    "object": "thread.run",
    "created_at": 1707303196,
    "assistant_id": "asst_JtTwHk28cIocgFXZPCBxhOzl",
    "thread_id": "thread_eRNwflE3ncDYak1np6MdMHJh",
    "status": "completed",
    "started_at": 1707303197,
    "expires_at": null,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": 1707303201,
    "last_error": null,
    "model": "gpt-4-1106-preview",
    "instructions": "You are an AI model that empowers every person and every organization on the planet to achieve more.",
    "tools": [],
    "file_ids": [],
    "metadata": {}
  }
}

Modifizieren – Ausführen

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview

Verändert einen Durchlauf.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id	path	Ja	string	Die ID der durchgeführten Threads.
run_id	path	Ja	string	Die ID des Laufs, der geändert werden soll.
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name	Typ	Beschreibung	Erforderlich	Vorgabe
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	No

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	runObject

Beispiele

Example

Verändert einen Durchlauf.

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview

{
 "metadata": {
  "user_id": "user_abc123"
 }
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "run_abc123",
    "object": "thread.run",
    "created_at": 1699075072,
    "assistant_id": "asst_abc123",
    "thread_id": "thread_abc123",
    "status": "completed",
    "started_at": 1699075072,
    "expires_at": null,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": 1699075073,
    "last_error": null,
    "model": "gpt-4-turbo",
    "instructions": null,
    "incomplete_details": null,
    "tools": [
      {
        "type": "code_interpreter"
      }
    ],
    "tool_resources": {
      "code_interpreter": {
        "file_ids": [
          "file-abc123",
          "file-abc456"
        ]
      }
    },
    "metadata": {
      "user_id": "user_abc123"
    },
    "usage": {
      "prompt_tokens": 123,
      "completion_tokens": 456,
      "total_tokens": 579
    },
    "temperature": 1.0,
    "top_p": 1.0,
    "max_prompt_tokens": 1000,
    "max_completion_tokens": 1000,
    "truncation_strategy": {
      "type": "auto",
      "last_messages": null
    },
    "response_format": "auto",
    "tool_choice": "auto"
  }
}

Einreichen – Werkzeugausgaben zum Ausführen

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/submit_tool_outputs?api-version=2025-04-01-preview

Wenn ein Run das status: "requires_action" und required_action.type hat submit_tool_outputs, kann dieser Endpunkt verwendet werden, um die Ausgaben der Werkzeugaufrufe zu senden, sobald sie alle abgeschlossen sind. Alle Ausgaben müssen in einer einzigen Anfrage eingereicht werden.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id	path	Ja	string	Die ID der Threads, zu denen dieser Run gehört.
run_id	path	Ja	string	Die ID des Durchlaufs, für die die Werkzeugausgabe eingereicht werden muss.
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name	Typ	Beschreibung	Erforderlich	Vorgabe
stream	Boolescher Wert	Wenn `true`, gibt einen Strom von Ereignissen zurück, die während des Runs als servergesendete Ereignisse auftreten, und endet, wenn der Run mit einer `data: [DONE]` Nachricht in einen Terminalzustand eintritt.	No
tool_outputs	array	Eine Liste der Werkzeuge, für die die Ausgaben eingereicht werden.	Ja

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	runObject

Beispiele

Example

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/submit_tool_outputs?api-version=2025-04-01-preview

{
 "tool_outputs": [
  {
   "tool_call_id": "call_001",
   "output": "70 degrees and sunny."
  }
 ]
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "run_123",
    "object": "thread.run",
    "created_at": 1699075592,
    "assistant_id": "asst_123",
    "thread_id": "thread_123",
    "status": "queued",
    "started_at": 1699075592,
    "expires_at": 1699076192,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": null,
    "last_error": null,
    "model": "gpt-4-turbo",
    "instructions": null,
    "tools": [
      {
        "type": "function",
        "function": {
          "name": "get_current_weather",
          "description": "Get the current weather in a given location",
          "parameters": {
            "type": "object",
            "properties": {
              "location": {
                "type": "string",
                "description": "The city and state, e.g. San Francisco, CA"
              },
              "unit": {
                "type": "string",
                "enum": [
                  "celsius",
                  "fahrenheit"
                ]
              }
            },
            "required": [
              "location"
            ]
          }
        }
      }
    ],
    "metadata": {},
    "usage": null,
    "temperature": 1.0,
    "top_p": 1.0,
    "max_prompt_tokens": 1000,
    "max_completion_tokens": 1000,
    "truncation_strategy": {
      "type": "auto",
      "last_messages": null
    },
    "response_format": "auto",
    "tool_choice": "auto"
  }
}

Abbrechen – Ausführen

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/cancel?api-version=2025-04-01-preview

Hebt einen Durchlauf ab, der ist in_progress.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id	path	Ja	string	Die ID des Threads, zu dem dieser Run gehört.
run_id	path	Ja	string	Die ID des Laufs zum Absagen.
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	runObject

Beispiele

Example

Hebt einen Durchlauf ab, der ist in_progress.

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/cancel?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "run_abc123",
    "object": "thread.run",
    "created_at": 1699076126,
    "assistant_id": "asst_abc123",
    "thread_id": "thread_abc123",
    "status": "cancelling",
    "started_at": 1699076126,
    "expires_at": 1699076726,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": null,
    "last_error": null,
    "model": "gpt-4-turbo",
    "instructions": "You summarize books.",
    "tools": [
      {
        "type": "file_search"
      }
    ],
    "tool_resources": {
      "file_search": {
        "vector_store_ids": [
          "vs_123"
        ]
      }
    },
    "metadata": {},
    "usage": null,
    "temperature": 1.0,
    "top_p": 1.0,
    "response_format": "auto"
  }
}

Liste – Laufschritte

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps?api-version=2025-04-01-preview

Gibt eine Liste der Laufschritte zurück, die zu einem Lauf gehören.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id	path	Ja	string	Die ID des Threads, zu dem die Lauf- und Ausführensschritte gehören.
run_id	path	Ja	string	Die ID des Runs, zu dem die Laufschritte gehören.
Begrenzung	Anfrage	No	Ganzzahl	Eine Begrenzung der Anzahl der zurückzugebenden Objekte. Das Limit kann zwischen 1 und 100 liegen, und der Standard liegt bei 20.
order	Anfrage	No	string Mögliche Werte: `asc`, `desc`	Sortiere die Reihenfolge nach dem `created_at` Zeitstempel der Objekte. `asc` für aufsteigende und `desc` absteigende Ordnung.
Nach	Anfrage	No	string	Ein Cursor für die Paginierung. `after` ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, die mit obj_foo enden, kann Ihr nachfolgender Aufruf after=obj_foo enthalten, um die nächste Seite der Liste abzurufen.
before	Anfrage	No	string	Ein Cursor für die Paginierung. `before` ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, beginnend mit obj_foo, kann Ihr nachfolgender Aufruf before=obj_foo enthalten, um die vorherige Seite der Liste abzurufen.
API-Version	Anfrage	Ja	string
include[]	Anfrage	No	array	Eine Liste zusätzlicher Felder, die in die Antwort aufgenommen werden sollten. Derzeit ist `step_details.tool_calls[].file_search.results[].content` der einzige unterstützte Wert, den Inhalt der Dateisuchergebnisse abzurufen.

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	listRunStepsResponse

Beispiele

Example

Gibt eine Liste der Laufschritte zurück, die zu einem Lauf gehören.

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "step_abc123",
        "object": "thread.run.step",
        "created_at": 1699063291,
        "run_id": "run_abc123",
        "assistant_id": "asst_abc123",
        "thread_id": "thread_abc123",
        "type": "message_creation",
        "status": "completed",
        "cancelled_at": null,
        "completed_at": 1699063291,
        "expired_at": null,
        "failed_at": null,
        "last_error": null,
        "step_details": {
          "type": "message_creation",
          "message_creation": {
            "message_id": "msg_abc123"
          }
        },
        "usage": {
          "prompt_tokens": 123,
          "completion_tokens": 456,
          "total_tokens": 579
        }
      }
    ],
    "first_id": "step_abc123",
    "last_id": "step_abc456",
    "has_more": false
  }
}

Get - Run Step

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps/{step_id}?api-version=2025-04-01-preview

Holt einen Laufschritt ab.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
thread_id	path	Ja	string	Die ID des Threads, zu dem der Lauf- und Ausführen-Schritt gehört.
run_id	path	Ja	string	Die ID des Durchlaufs, zu dem der Laufschritt gehört.
step_id	path	Ja	string	Die ID des Laufschritts zum Abrufen.
include[]	Anfrage	No	array	Eine Liste zusätzlicher Felder, die in die Antwort aufgenommen werden sollten. Derzeit ist `step_details.tool_calls[].file_search.results[].content` der einzige unterstützte Wert, den Inhalt der Dateisuchergebnisse abzurufen.
API-Version	Anfrage	Ja	string

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	runStepObject

Beispiele

Example

Holt einen Laufschritt ab.

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps/{step_id}?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "step_abc123",
    "object": "thread.run.step",
    "created_at": 1699063291,
    "run_id": "run_abc123",
    "assistant_id": "asst_abc123",
    "thread_id": "thread_abc123",
    "type": "message_creation",
    "status": "completed",
    "cancelled_at": null,
    "completed_at": 1699063291,
    "expired_at": null,
    "failed_at": null,
    "last_error": null,
    "step_details": {
      "type": "message_creation",
      "message_creation": {
        "message_id": "msg_abc123"
      }
    },
    "usage": {
      "prompt_tokens": 123,
      "completion_tokens": 456,
      "total_tokens": 579
    }
  }
}

Liste - Vektorspeicher

GET https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview

Gibt eine Liste der Vektorspeicher zurück.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
Begrenzung	Anfrage	No	Ganzzahl	Eine Begrenzung der Anzahl der zurückzugebenden Objekte. Das Limit kann zwischen 1 und 100 liegen, und der Standard liegt bei 20.
order	Anfrage	No	string Mögliche Werte: `asc`, `desc`	Sortiere die Reihenfolge nach dem `created_at` Zeitstempel der Objekte. `asc` für aufsteigende und `desc` absteigende Ordnung.
Nach	Anfrage	No	string	Ein Cursor für die Paginierung. `after` ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, die mit obj_foo enden, kann Ihr nachfolgender Aufruf after=obj_foo enthalten, um die nächste Seite der Liste abzurufen.
before	Anfrage	No	string	Ein Cursor für die Paginierung. `before` ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, beginnend mit obj_foo, kann Ihr nachfolgender Aufruf before=obj_foo enthalten, um die vorherige Seite der Liste abzurufen.
API-Version	Anfrage	Ja	string	API-Version

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	listVectorStoresResponse

Beispiele

Example

Gibt eine Liste der Vektorspeicher zurück.

GET https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "vs_abc123",
        "object": "vector_store",
        "created_at": 1699061776,
        "name": "Support FAQ",
        "bytes": 139920,
        "file_counts": {
          "in_progress": 0,
          "completed": 3,
          "failed": 0,
          "cancelled": 0,
          "total": 3
        }
      },
      {
        "id": "vs_abc456",
        "object": "vector_store",
        "created_at": 1699061776,
        "name": "Support FAQ v2",
        "bytes": 139920,
        "file_counts": {
          "in_progress": 0,
          "completed": 3,
          "failed": 0,
          "cancelled": 0,
          "total": 3
        }
      }
    ],
    "first_id": "vs_abc123",
    "last_id": "vs_abc456",
    "has_more": false
  }
}

Erstellen - Vektorspeicher

POST https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview

Erstelle einen Vektorspeicher.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
API-Version	Anfrage	Ja	string	API-Version

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name	Typ	Beschreibung	Erforderlich
chunking_strategy	autoChunkingStrategyRequestParam oder staticChunkingStrategyRequestParam	Die Chunking-Strategie, die verwendet wird, um die Datei(en) zu chunken. Wenn nicht gesetzt, werde ich die Strategie `auto` verwenden. Nur dann anwendbar, wenn `file_ids` nicht leer ist.	No
expires_after	vectorStoreExpirationAfter	Die Ablaufrichtlinie für einen Vektorspeicher.	No
Datei-IDs	array	Eine Liste von Datei-IDs, die der Vektorspeicher verwenden sollte. Nützlich für Werkzeuge wie `file_search` diese, die auf Dateien zugreifen können.	No
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	No
Name	string	Der Name des Vektorspeichers.	No

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	vectorStoreObject

Beispiele

Example

Erstellt einen Vektorspeicher.

POST https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "vs_abc123",
    "object": "vector_store",
    "created_at": 1699061776,
    "name": "Support FAQ",
    "bytes": 139920,
    "file_counts": {
      "in_progress": 0,
      "completed": 3,
      "failed": 0,
      "cancelled": 0,
      "total": 3
    }
  }
}

Erhalten - Vektorspeicher

GET https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

Ruft einen Vektorspeicher ab.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id	path	Ja	string	Die ID des zu abrufenden Vektorspeichers.
API-Version	Anfrage	Ja	string	API-Version

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	vectorStoreObject

Beispiele

Example

Ruft einen Vektorspeicher ab.

GET https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "vs_abc123",
    "object": "vector_store",
    "created_at": 1699061776
  }
}

Modify – Vektorspeicher

POST https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

Verändert einen Vektorspeicher.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id	path	Ja	string	Die ID des Vektorspeichers, der modifiziert werden soll.
API-Version	Anfrage	Ja	string	API-Version

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name	Typ	Beschreibung	Erforderlich
expires_after	vectorStoreExpirationAfter	Die Ablaufrichtlinie für einen Vektorspeicher.	No
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	No
Name	string	Der Name des Vektorspeichers.	No

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	vectorStoreObject

Beispiele

Example

Verändert einen Vektorspeicher.

POST https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

{
 "name": "Support FAQ"
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "vs_abc123",
    "object": "vector_store",
    "created_at": 1699061776,
    "name": "Support FAQ",
    "bytes": 139920,
    "file_counts": {
      "in_progress": 0,
      "completed": 3,
      "failed": 0,
      "cancelled": 0,
      "total": 3
    }
  }
}

Löschen – Vektorspeicher

DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

Lösche einen Vektorspeicher.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id	path	Ja	string	Die ID des Vektorspeichers, den gelöscht werden soll.
API-Version	Anfrage	Ja	string	API-Version

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	deleteVectorStoreResponse

Beispiele

Example

Löscht einen Vektorspeicher.

DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "vs_abc123",
    "object": "vector_store.deleted",
    "deleted": true
  }
}

Liste – Vektorspeicherdateien

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview

Gibt eine Liste von Vektorspeicherdateien zurück.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id	path	Ja	string	Die ID des Vektorspeichers, zu dem die Dateien gehören.
Begrenzung	Anfrage	No	Ganzzahl	Eine Begrenzung der Anzahl der zurückzugebenden Objekte. Das Limit kann zwischen 1 und 100 liegen, und der Standard liegt bei 20.
order	Anfrage	No	string Mögliche Werte: `asc`, `desc`	Sortiere die Reihenfolge nach dem `created_at` Zeitstempel der Objekte. `asc` für aufsteigende und `desc` absteigende Ordnung.
Nach	Anfrage	No	string	Ein Cursor für die Paginierung. `after` ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, die mit obj_foo enden, kann Ihr nachfolgender Aufruf after=obj_foo enthalten, um die nächste Seite der Liste abzurufen.
before	Anfrage	No	string	Ein Cursor für die Paginierung. `before` ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, beginnend mit obj_foo, kann Ihr nachfolgender Aufruf before=obj_foo enthalten, um die vorherige Seite der Liste abzurufen.
filter	Anfrage	No	string Mögliche Werte: `in_progress`, `completed`, `failed`, `cancelled`	Filtern Sie nach Dateistatus. Einer von `in_progress`, `completed`, `failed`, . `cancelled`
API-Version	Anfrage	Ja	string	API-Version

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	listVectorStoreFilesResponse

Beispiele

Example

Gibt eine Liste von Vektorspeicherdateien zurück.

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "file-abc123",
        "object": "vector_store.file",
        "created_at": 1699061776,
        "vector_store_id": "vs_abc123"
      },
      {
        "id": "file-abc456",
        "object": "vector_store.file",
        "created_at": 1699061776,
        "vector_store_id": "vs_abc123"
      }
    ],
    "first_id": "file-abc123",
    "last_id": "file-abc456",
    "has_more": false
  }
}

Erstellen - Vektorspeicher-Datei

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview

Erstellen Sie eine Vektorspeicherdatei, indem Sie eine Datei an einen Vektorspeicher anhängen.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id	path	Ja	string	Die ID des Vektorspeichers, für den eine Datei erstellt werden soll.
API-Version	Anfrage	Ja	string	API-Version

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name	Typ	Beschreibung	Erforderlich	Vorgabe
chunking_strategy	chunkingStrategyRequestParam	Die Chunking-Strategie, die verwendet wird, um die Datei(en) zu chunken. Wenn nicht gesetzt, werde ich die Strategie `auto` verwenden.	No
Datei-ID	string	Eine Datei-ID, die der Vektorspeicher verwenden sollte. Nützlich für Werkzeuge wie `file_search` diese, die auf Dateien zugreifen können.	Ja

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	vectorStoreFileObject

Beispiele

Example

Erstellen Sie eine Vektorspeicherdatei, indem Sie eine Datei an einen Vektorspeicher anhängen.

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview

{
 "file_id": "file-abc123"
}

Antworten: Statuscode: 200

{
  "body": {
    "id": "file-abc123",
    "object": "vector_store.file",
    "created_at": 1699061776,
    "usage_bytes": 1234,
    "vector_store_id": "vs_abcd",
    "status": "completed",
    "last_error": null
  }
}

Get - Vektorspeicher-Datei

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview

Ruft eine Vektorspeicherdatei ab.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id	path	Ja	string	Die ID des Vektorspeichers, zu dem die Datei gehört.
Datei-ID	path	Ja	string	Die ID der gesicherten Datei.
API-Version	Anfrage	Ja	string	API-Version

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	vectorStoreFileObject

Beispiele

Example

Ruft eine Vektorspeicherdatei ab.

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "file-abc123",
    "object": "vector_store.file",
    "created_at": 1699061776,
    "vector_store_id": "vs_abcd",
    "status": "completed",
    "last_error": null
  }
}

Löschen – Vektorspeicher-Datei

DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview

Lösche eine Vektorspeicherdatei. Dadurch wird die Datei aus dem Vektorspeicher entfernt, aber die Datei selbst wird nicht gelöscht. Um die Datei zu löschen, verwenden Sie den Endpunkt für das Löschen der Datei.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id	path	Ja	string	Die ID des Vektorspeichers, zu dem die Datei gehört.
Datei-ID	path	Ja	string	Die ID der zu löschenden Datei.
API-Version	Anfrage	Ja	string	API-Version

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	deleteVectorStoreFileResponse

Beispiele

Example

DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "file_abc123",
    "object": "vector_store.file.deleted",
    "deleted": true
  }
}

Updatevectorstorefileattributes

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview

Aktualisiere Attribute in einer Vektorspeicherdatei.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id	path	Ja	string	Die ID des Vektorspeichers, zu dem die Datei gehört.
Datei-ID	path	Ja	string	Die ID der Datei, um die Attribute zu aktualisieren.

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name	Typ	Beschreibung	Erforderlich	Vorgabe
attributes	VectorStoreFileAttributes	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern und Objekte über die API oder das Dashboard abzufragen. Tasten sind Zeichenketten mit einer maximalen Länge von 64 Zeichen. Werte sind Zeichenketten mit einer maximalen Länge von 512 Zeichen, Booleans oder Zahlen.	Ja

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	vectorStoreFileObject

Vektorspeicher-Dateiinhalt abrufen

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}/content?api-version=2025-04-01-preview

Rufen Sie den geparsten Inhalt einer Vektorspeicherdatei ab.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id	path	Ja	string	Die ID des Vektorspeichers.
Datei-ID	path	Ja	string	Die ID der Datei im Vektorspeicher.

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	VectorStoreFileContentResponse

Suchvektorspeicher

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/search?api-version=2025-04-01-preview

Durchsuche einen Vektorspeicher nach relevanten Chunks basierend auf einem Abfrage- und Dateiattributfilter.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id	path	Ja	string	Die ID des zu suchenden Vektorspeichers.

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Filter	ComparisonFilter oder CompoundFilter	Ein Filter, der basierend auf Dateiattributen angewendet wird.	No
max_anzahl_ergebnisse	Ganzzahl	Die maximale Anzahl an Ergebnissen, die du ergeben kannst. Diese Zahl sollte zwischen 1 und 50 liegen.	No	10
Anfrage	Saite oder Array	Eine Abfragefolge für eine Suche	Ja
Ranglistenoptionen	Objekt	Rangfolgeoptionen für die Suche.	No
└– Ranker	enum	Mögliche Werte: `auto`, `default-2024-11-15`	No
└─ Punktschwelle	number		No	0
rewrite_query	Boolescher Wert	Ob die natürliche Sprachanfrage für die Vektorsuche umgeschrieben werden soll.	No	Falsch

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	VectorStoreSearchResultsPage

Erstellen – Vektorspeicher-Datei-Batch

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches?api-version=2025-04-01-preview

Erstellen Sie eine Vektorspeicher-Datei-Batch.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id	path	Ja	string	Die ID des Vektorspeichers, für den ein File Batch erstellt werden soll.
API-Version	Anfrage	Ja	string	API-Version

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Anforderungstext

Content-Type: application/json

Name	Typ	Beschreibung	Erforderlich	Vorgabe
chunking_strategy	chunkingStrategyRequestParam	Die Chunking-Strategie, die verwendet wird, um die Datei(en) zu chunken. Wenn nicht gesetzt, werde ich die Strategie `auto` verwenden.	No
Datei-IDs	array	Eine Liste von Datei-IDs, die der Vektorspeicher verwenden sollte. Nützlich für Werkzeuge wie `file_search` diese, die auf Dateien zugreifen können.	Ja

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	vectorStoreFileBatchObject

Beispiele

Example

Erstellen Sie eine Vektorspeicher-Datei-Batch.

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches?api-version=2025-04-01-preview

{
 "file_ids": [
  "file-abc123",
  "file-abc456"
 ]
}

Antworten: Statuscode: 200

{
  "id": "vsfb_abc123",
  "object": "vector_store.file_batch",
  "created_at": 1699061776,
  "vector_store_id": "vs_abc123",
  "status": "in_progress",
  "file_counts": {
    "in_progress": 1,
    "completed": 1,
    "failed": 0,
    "cancelled": 0,
    "total": 0
  }
}

Get - Vektorspeicher-Dateibatch

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}?api-version=2025-04-01-preview

Ruft einen Vektorspeicher-Dateibatch ab.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id	path	Ja	string	Die ID des Vektorspeichers, zu dem der Dateibatch gehört.
batch_id	path	Ja	string	Die ID des Dateibatches, der abgerufen wird.
API-Version	Anfrage	Ja	string	API-Version

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	vectorStoreFileBatchObject

Beispiele

Example

Ruft einen Vektorspeicher-Dateibatch ab.

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "vsfb_abc123",
    "object": "vector_store.file_batch",
    "created_at": 1699061776,
    "vector_store_id": "vs_abc123",
    "status": "in_progress",
    "file_counts": {
      "in_progress": 1,
      "completed": 1,
      "failed": 0,
      "cancelled": 0,
      "total": 0
    }
  }
}

Abbrechen – Vektorspeicher-Datei-Batch

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/cancel?api-version=2025-04-01-preview

Einen Vektorspeicher-Dateibatch abbrechen. Dies versucht, die Verarbeitung der Dateien in diesem Batch so schnell wie möglich zu beenden.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id	path	Ja	string	Die ID des Vektorspeichers, zu dem der Dateibatch gehört.
batch_id	path	Ja	string	Die ID des Dateibatches, um zu stornieren.
API-Version	Anfrage	Ja	string	API-Version

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	vectorStoreFileBatchObject

Beispiele

Example

Einen Vektorspeicher-Dateibatch abbrechen. Dies versucht, die Verarbeitung der Dateien in diesem Batch so schnell wie möglich zu beenden.

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/cancel?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "id": "vsfb_abc123",
    "object": "vector_store.file_batch",
    "created_at": 1699061776,
    "vector_store_id": "vs_abc123",
    "status": "cancelling",
    "file_counts": {
      "in_progress": 12,
      "completed": 3,
      "failed": 0,
      "cancelled": 0,
      "total": 15
    }
  }
}

Liste – Vektorspeicher-Datei-Batchdateien

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/files?api-version=2025-04-01-preview

Gibt eine Liste von Vektorspeicherdateien in einem Batch zurück.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
vector_store_id	path	Ja	string	Die ID des Vektorspeichers, zu dem die Dateien gehören.
batch_id	path	Ja	string	Die ID des Dateibatches, zu dem die Dateien gehören.
Begrenzung	Anfrage	No	Ganzzahl	Eine Begrenzung der Anzahl der zurückzugebenden Objekte. Das Limit kann zwischen 1 und 100 liegen, und der Standard liegt bei 20.
order	Anfrage	No	string Mögliche Werte: `asc`, `desc`	Sortiere die Reihenfolge nach dem `created_at` Zeitstempel der Objekte. `asc` für aufsteigende und `desc` absteigende Ordnung.
Nach	Anfrage	No	string	Ein Cursor für die Paginierung. `after` ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, die mit obj_foo enden, kann Ihr nachfolgender Aufruf after=obj_foo enthalten, um die nächste Seite der Liste abzurufen.
before	Anfrage	No	string	Ein Cursor für die Paginierung. `before` ist eine Objekt-ID, die deinen Platz in der Liste definiert. Wenn Sie beispielsweise eine Listenanfrage stellen und 100 Objekte erhalten, beginnend mit obj_foo, kann Ihr nachfolgender Aufruf before=obj_foo enthalten, um die vorherige Seite der Liste abzurufen.
filter	Anfrage	No	string Mögliche Werte: `in_progress`, `completed`, `failed`, `cancelled`	Filtern Sie nach Dateistatus. Einer von `in_progress`, `completed`, `failed`, . `cancelled`
API-Version	Anfrage	Ja	string	API-Version

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	listVectorStoreFilesResponse

Beispiele

Example

Gibt eine Liste von Vektorspeicherdateien zurück.

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/files?api-version=2025-04-01-preview

Antworten: Statuscode: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "file-abc123",
        "object": "vector_store.file",
        "created_at": 1699061776,
        "vector_store_id": "vs_abc123"
      },
      {
        "id": "file-abc456",
        "object": "vector_store.file",
        "created_at": 1699061776,
        "vector_store_id": "vs_abc123"
      }
    ],
    "first_id": "file-abc123",
    "last_id": "file-abc456",
    "has_more": false
  }
}

Erstellen – Realtimesession

POST https://{endpoint}/openai/realtimeapi/sessions?api-version=2025-04-01-preview

Erstellen Sie ein flüchtiges API-Token für die Verwendung in clientseitigen Anwendungen mit der Realtime API. Kann mit denselben Sitzungsparametern wie das session.update Client-Event konfiguriert werden. Es antwortet mit einem Sitzungsobjekt sowie einem client_secret Schlüssel, der ein brauchbares ephemeres API-Token enthält, das zur Authentifizierung von Browser-Clients für die Echtzeit-API verwendet werden kann.

Anforderungstext

Content-Type: application/json

Name	Typ	Beschreibung	Erforderlich	Vorgabe
input_audio_format	enum	Das Format des Eingabeaudios. Optionen sind `pcm16`, `g711_ulaw`, oder `g711_alaw`. Für `pcm16`muss das Eingangsaudio 16-Bit-PCM mit einer Abtastrate von 24 kHz, Einkanal-(Mono) und Little-Endian-Byte-Ordnung sein. Mögliche Werte: `pcm16`, `g711_ulaw`, `g711_alaw`	No
input_audio_noise_reduction	Objekt	Konfiguration zur Rauschreduktion des Eingangs-Audios. Dieser kann auf `null` ausgeschaltet eingestellt werden. Rauschunterdrückung filtert Audio, der dem Eingangs-Audiopuffer hinzugefügt wird, bevor er an VAD und das Modell gesendet wird. Das Filtern des Audios kann die Genauigkeit von VAD und Kurvenerkennung verbessern (Fehlalarme reduzieren) und die Leistung modellieren, indem die Wahrnehmung des Eingabetons verbessert wird.	No
└– Typ	enum	Art der Lärmunterdrückung. `near_field` ist für nah sprechende Mikrofone wie Kopfhörer, `far_field` ist für Fernfeldmikrofone wie Laptop- oder Konferenzraummikrofone. Mögliche Werte: `near_field`, `far_field`	No
input_audio_transcription	Objekt	Die Konfiguration für die Eingangs-Audiotranskription ist standardmäßig auf aus eingestellt und kann so `null` eingestellt werden, dass sie sich nach Einschalten ausschaltet. Eingabe-Audiotranskription ist nicht native im Modell, da das Modell Audio direkt konsumiert. Die Transkription läuft asynchron über das Transkriptions-Endpunkt und sollte als Leitfaden für die Eingabe-Audioinhalte behandelt werden, statt als genau das, was das Modell gehört hat. Der Kunde kann optional die Sprache und den Prompt für die Transkription einstellen; diese bieten dem Transkriptionsdienst zusätzliche Orientierung.	No
└– Sprache	string	Die Sprache des eingegebenen Audios. Die Bereitstellung der Eingabesprache im ISO-639-1 (z. B. `en`) Format verbessert die Genauigkeit und Latenz.	No
└─ Modell	string	Das Modell für die Transkription, aktuelle Optionen sind `gpt-4o-transcribe`, `gpt-4o-transcribe-diarize`, , `gpt-4o-mini-transcribe`, `gpt-4o-mini-transcribe-2025-12-15`und `whisper-1`.	No
└– Eingabeaufforderung	string	Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen. Für `whisper-1`, ist der Prompt eine Liste von Schlüsselwörtern. Für `gpt-4o-transcribe` Modelle ist die Aufforderung eine Freitextzeichenkette, zum Beispiel "erwarten Sie Wörter, die mit Technologie zu tun haben".	No
Anweisungen	string	Die Standard-Systeminstruktionen (d. h. Systemnachricht) wurden vorangestellt, um Modellaufrufe zu erstellen. Dieses Feld ermöglicht es dem Client, das Modell anhand der gewünschten Antworten zu steuern. Das Modell kann zum Inhalt und Format der Antwort angewiesen werden (z. B. "sehr prägnant sein", "freundlich handeln", "hier sind Beispiele für gute Antworten") und zum Audioverhalten (z. B. "schnell sprechen", "Emotion in deine Stimme einbringen", "häufig lachen"). Die Anweisungen werden nicht garantiert vom Modell befolgt, aber sie geben dem Modell Hinweise auf das gewünschte Verhalten. Beachten Sie, dass der Server Standardbefehle setzt, die verwendet werden, wenn dieses Feld nicht gesetzt ist und zu Beginn der Sitzung im `session.created` Event sichtbar sind.	No
max_response_output_tokens	Ganzzahl oder String	Maximale Anzahl von Ausgabetoken für eine einzelne Assistentenantwort, einschließlich Werkzeugaufrufe. Geben Sie eine ganze Zahl zwischen 1 und 4096 an, um die Ausgabetoken zu begrenzen oder `inf` für die maximal verfügbaren Token für ein bestimmtes Modell. Standardmäßig gilt `inf`.	No
modalities		Die Menge der Modalitäten, mit denen das Modell antworten kann. Um Audio zu deaktivieren, setze dies auf ["text"].	No
Modell	string	Der Name der für diese Sitzung verwendeten Einsatz.	No
output_audio_format	enum	Das Format der Ausgabe des Audios. Optionen sind `pcm16`, `g711_ulaw`, oder `g711_alaw`. Für `pcm16`wird das Ausgangsaudio mit einer Frequenz von 24 kHz abgetastet. Mögliche Werte: `pcm16`, `g711_ulaw`, `g711_alaw`	No
Temperatur	number	Stichprobentemperatur für das Modell, begrenzt auf [0,6, 1,2]. Für Audiomodelle wird eine Temperatur von 0,8 für die beste Leistung sehr empfohlen.	No	0.8
tool_choice	string	Wie das Modell Werkzeuge auswählt. Optionen sind `auto`, `none`, , `required`oder geben Sie eine Funktion an.	No	auto
tools	array	Werkzeuge (Funktionen), die dem Modell zur Verfügung stehen.	No
turn_detection	Objekt	Konfiguration für Zugerkennung, entweder Server-VAD oder semantisches VAD. Dies kann auf `null` deaktiviert eingestellt werden, wobei der Client die Modellantwort manuell auslösen muss. Server-VAD bedeutet, dass das Modell den Beginn und das Ende der Sprache basierend auf der Lautstärke erkennt und am Ende der Benutzersprache antwortet. Semantisches VAD ist fortschrittlicher und verwendet ein Dreherkennungsmodell (in Verbindung mit VAD), um semantisch zu schätzen, ob der Benutzer mit dem Sprechen fertig ist, und setzt dann dynamisch eine Auszeit basierend auf dieser Wahrscheinlichkeit. Wenn zum Beispiel der User-Audio mit `uhhm`abklingt, wird das Modell eine geringe Wahrscheinlichkeit für das Ende der Zuge erzielen und länger warten, bis der Benutzer weiterspricht. Das kann für natürlichere Gespräche nützlich sein, kann aber eine höhere Latenz haben.	No
└– create_response	Boolescher Wert	Ob automatisch eine Antwort generiert werden soll, wenn ein VAD-Stopp-Event auftritt.	No	Richtig
└– Eifer	enum	Wird nur für den `semantic_vad` Modus verwendet. Die Bereitschaft des Modells zu reagieren. `low` Er wartet länger, bis der Nutzer weiterspricht, antwortet `high` schneller. `auto` ist der Standard und äquivalent zu `medium`. Mögliche Werte: `low`, `medium`, `high`, `auto`	No
└– interrupt_response	Boolescher Wert	Ob man eine laufende Antwort automatisch unterbrechen soll, die zur Standardkonversation (d. h. `conversation` von `auto`) führt, wenn ein VAD-Startereignis auftritt.	No	Richtig
└– prefix_padding_ms	Ganzzahl	Wird nur für den `server_vad` Modus verwendet. Menge an Audio, die vor der Erkennung der Sprache (in Millisekunden) durch das VAD enthalten sein sollte. Standardmäßig liegt es auf 300 ms.	No
└– Dauer_der_Stille_in_ms	Ganzzahl	Wird nur für den `server_vad` Modus verwendet. Dauer der Stille zur Erkennung des Sprachstopps (in Millisekunden). Standardmäßig 500 ms. Bei kürzeren Werten reagiert das Modell schneller, kann aber bei kurzen Pausen des Nutzers eingreifen.	No
└– Schwellenwert	number	Wird nur für den `server_vad` Modus verwendet. Aktivierungsschwelle für VAD (0,0 bis 1,0) liegt standardmäßig bei 0,5. Ein höherer Schwellenwert erfordert lauteren Ton, um das Modell zu aktivieren, und kann daher in lauten Umgebungen besser abschneiden.	No
└– Typ	enum	Art der Abzugserkennung. Mögliche Werte: `server_vad`, `semantic_vad`	No
Stimme	VoiceIdsShared		No

Antworten

Statuscode: 200

Beschreibung: Sitzung erfolgreich erstellt.

Inhaltstyp	Typ	Beschreibung
application/json	RealtimeSessionCreateResponse

Erstellen - TranskriptionEchtzeitsitzung

POST https://{endpoint}/openai/realtimeapi/transcription_sessions?api-version=2025-04-01-preview

Erstellen Sie ein ephemeres API-Token für die Nutzung in clientseitigen Anwendungen mit der Realtime-API speziell für Echtzeit-Transkriptionen. Kann mit denselben Sitzungsparametern wie das transcription_session.update Client-Event konfiguriert werden. Es antwortet mit einem Sitzungsobjekt sowie einem client_secret Schlüssel, der ein brauchbares ephemeres API-Token enthält, das zur Authentifizierung von Browser-Clients für die Echtzeit-API verwendet werden kann.

Anforderungstext

Content-Type: application/json

Name	Typ	Beschreibung	Erforderlich	Vorgabe
include	array	Die Sammlung von Elementen, die in die Transkription aufgenommen werden sollten. Derzeit verfügbare Artikel sind: - `item.input_audio_transcription.logprobs`	No
input_audio_format	enum	Das Format des Eingabeaudios. Optionen sind `pcm16`, `g711_ulaw`, oder `g711_alaw`. Für `pcm16`muss das Eingangsaudio 16-Bit-PCM mit einer Abtastrate von 24 kHz, Einkanal-(Mono) und Little-Endian-Byte-Ordnung sein. Mögliche Werte: `pcm16`, `g711_ulaw`, `g711_alaw`	No
input_audio_noise_reduction	Objekt	Konfiguration zur Rauschreduktion des Eingangs-Audios. Dieser kann auf `null` ausgeschaltet eingestellt werden. Rauschunterdrückung filtert Audio, der dem Eingangs-Audiopuffer hinzugefügt wird, bevor er an VAD und das Modell gesendet wird. Das Filtern des Audios kann die Genauigkeit von VAD und Kurvenerkennung verbessern (Fehlalarme reduzieren) und die Leistung modellieren, indem die Wahrnehmung des Eingabetons verbessert wird.	No
└– Typ	enum	Art der Lärmunterdrückung. `near_field` ist für nah sprechende Mikrofone wie Kopfhörer, `far_field` ist für Fernfeldmikrofone wie Laptop- oder Konferenzraummikrofone. Mögliche Werte: `near_field`, `far_field`	No
input_audio_transcription	Objekt	Konfiguration für Eingabe-Audio-Transkription. Der Kunde kann optional die Sprache und den Prompt für die Transkription einstellen; diese bieten dem Transkriptionsdienst zusätzliche Orientierung.	No
└– Sprache	string	Die Sprache des eingegebenen Audios. Die Bereitstellung der Eingabesprache im ISO-639-1 (z. B. `en`) Format verbessert die Genauigkeit und Latenz.	No
└─ Modell	enum	Das Modell für die Transkription, aktuelle Optionen sind `gpt-4o-transcribe`, `gpt-4o-mini-transcribe`, , `gpt-4o-mini-transcribe-2025-12-15`und `whisper-1`. Mögliche Werte: `gpt-4o-transcribe`, `gpt-4o-mini-transcribe`, `gpt-4o-mini-transcribe-2025-12-15`, `whisper-1`	No
└– Eingabeaufforderung	string	Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen. Für `whisper-1`, ist der Prompt eine Liste von Schlüsselwörtern. Für `gpt-4o-transcribe` Modelle ist die Aufforderung eine Freitextzeichenkette, zum Beispiel "erwarten Sie Wörter, die mit Technologie zu tun haben".	No
modalities		Die Menge der Modalitäten, mit denen das Modell antworten kann. Um Audio zu deaktivieren, setze dies auf ["text"].	No
turn_detection	Objekt	Konfiguration für Zugerkennung, entweder Server-VAD oder semantisches VAD. Dies kann auf `null` deaktiviert eingestellt werden, wobei der Client die Modellantwort manuell auslösen muss. Server-VAD bedeutet, dass das Modell den Beginn und das Ende der Sprache basierend auf der Lautstärke erkennt und am Ende der Benutzersprache antwortet. Semantisches VAD ist fortschrittlicher und verwendet ein Dreherkennungsmodell (in Verbindung mit VAD), um semantisch zu schätzen, ob der Benutzer mit dem Sprechen fertig ist, und setzt dann dynamisch eine Auszeit basierend auf dieser Wahrscheinlichkeit. Wenn zum Beispiel der User-Audio mit `uhhm`abklingt, wird das Modell eine geringe Wahrscheinlichkeit für das Ende der Zuge erzielen und länger warten, bis der Benutzer weiterspricht. Das kann für natürlichere Gespräche nützlich sein, kann aber eine höhere Latenz haben.	No
└– create_response	Boolescher Wert	Ob automatisch eine Antwort generiert werden soll, wenn ein VAD-Stopp-Event auftritt. Für Transkriptionssitzungen nicht verfügbar.	No	Richtig
└– Eifer	enum	Wird nur für den `semantic_vad` Modus verwendet. Die Bereitschaft des Modells zu reagieren. `low` Er wartet länger, bis der Nutzer weiterspricht, antwortet `high` schneller. `auto` ist der Standard und äquivalent zu `medium`. Mögliche Werte: `low`, `medium`, `high`, `auto`	No
└– interrupt_response	Boolescher Wert	Ob man eine laufende Antwort automatisch unterbrechen soll, die zur Standardkonversation (d. h. `conversation` von `auto`) führt, wenn ein VAD-Startereignis auftritt. Für Transkriptionssitzungen nicht verfügbar.	No	Richtig
└– prefix_padding_ms	Ganzzahl	Wird nur für den `server_vad` Modus verwendet. Menge an Audio, die vor der Erkennung der Sprache (in Millisekunden) durch das VAD enthalten sein sollte. Standardmäßig liegt es auf 300 ms.	No
└– Dauer_der_Stille_in_ms	Ganzzahl	Wird nur für den `server_vad` Modus verwendet. Dauer der Stille zur Erkennung des Sprachstopps (in Millisekunden). Standardmäßig 500 ms. Bei kürzeren Werten reagiert das Modell schneller, kann aber bei kurzen Pausen des Nutzers eingreifen.	No
└– Schwellenwert	number	Wird nur für den `server_vad` Modus verwendet. Aktivierungsschwelle für VAD (0,0 bis 1,0) liegt standardmäßig bei 0,5. Ein höherer Schwellenwert erfordert lauteren Ton, um das Modell zu aktivieren, und kann daher in lauten Umgebungen besser abschneiden.	No
└– Typ	enum	Art der Abzugserkennung. Mögliche Werte: `server_vad`, `semantic_vad`	No

Antworten

Statuscode: 200

Beschreibung: Sitzung erfolgreich erstellt.

Inhaltstyp	Typ	Beschreibung
application/json	RealtimeTranscriptionSessionCreateResponse

Antworten

POST https://{endpoint}/openai/responses?api-version=2025-04-01-preview

Erzeugt eine Modellantwort.

Anforderungstext

Content-Type: application/json

Name	Typ	Beschreibung	Erforderlich	Vorgabe
include	array		No
input	Saite oder Array	Modelleingaben	Ja
Anweisungen	string	Fügt eine System- (oder Entwickler-) Nachricht als erstes Element im Kontext des Modells ein. Wenn man zusammen mit `previous_response_id`verwendet, werden die Anweisungen aus einer vorherigen Antwort nicht auf die nächste Antwort übernommen. Dadurch ist es einfach, System- (oder Entwickler-) Nachrichten in neuen Antworten auszutauschen.	No
max_output_tokens	Ganzzahl	Eine obere Obergrenze für die Anzahl der Tokens, die für eine Antwort generiert werden können, einschließlich sichtbarer Ausgabetoken und des Gesprächszustands.	No
Parallele Werkzeugaufrufe	Boolescher Wert	Ob das Modell Werkzeugaufrufe parallel ausführen soll.	No	Richtig
previous_response_id	string	Die eindeutige ID der vorherigen Antwort auf das Modell. Nutzen Sie dies, um Gespräche mit mehreren Runden zu erstellen. Erfahren Sie mehr über den Gesprächszustand.	No
reasoning	Reasoning	Konfigurationsoptionen für Schlussfolgermodelle.	No
store	Boolescher Wert	Ob die generierte Modellantwort für eine spätere Abruf über die API gespeichert werden soll.	No	Richtig
stream	Boolescher Wert	Wenn auf true gesetzt, werden die Antwortdaten des Modells an den Client gestreamt, während sie mithilfe von Server-gesendeten Ereignissen generiert werden. Weitere Informationen finden Sie im Abschnitt Streaming unten.	No	Falsch
Text	Objekt	Konfigurationsoptionen für eine Textantwort des Modells. Es können Klartext oder strukturierte JSON-Daten sein. Erfahren Sie mehr: - Texteingaben und -ausgaben - Strukturierte Ausgaben	No
└─ Format	TextResponseFormatConfiguration	Ein Objekt, das das Format angibt, das das Modell ausgeben muss. Die Konfiguration `{ "type": "json_schema" }` aktiviert strukturierte Ausgaben, die sicherstellen, dass das Modell mit dem bereitgestellten JSON-Schema übereinstimmt. Das Standardformat ist `{ "type": "text" }` ohne zusätzliche Optionen. Nicht empfohlen für GPT-4o und neuere Modelle: Einstellung aktiviert den `{ "type": "json_object" }` älteren JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültiges JSON ist. Die Verwendung `json_schema` ist bevorzugt für Modelle, die sie unterstützen.	No
tool_choice	ToolChoiceOptions oder ToolChoiceTypes oder ToolChoiceFunction	Wie das Modell auswählen sollte, welches Tool (oder welche Werkzeuge) es bei der Generierung einer Antwort verwendet. Sehen Sie sich den Parameter `tools` an, um zu sehen, welche Werkzeuge das Modell aufrufen kann.	No
tools	array	Ein Array von Werkzeugen, die das Modell aufrufen kann, während es eine Antwort erzeugt. Du kannst angeben, welches Werkzeug du verwenden sollst, indem du den Parameter `tool_choice` einlegst. Die zwei Kategorien von Werkzeugen, die Sie dem Modell bereitstellen können, sind: - Integrierte Tools: Werkzeuge, die von OpenAI bereitgestellt werden und das erweitern Funktionen des Modells	No
truncation	enum	Die Abschneidungsstrategie, die für die Modellantwort verwendet werden soll. - `auto`: Wenn der Kontext dieser und der vorherigen Antwort die Größe des Kontextfensters des Modells übersteigt, wird das Modell die Antwort kürzen, um zum Kontextfenster zu passen, indem es Eingabepunkte mitten im Gespräch platziert. - `disabled` (Standard): Wenn eine Modellantwort die Kontextfenstergröße eines Modells überschreitet, schlägt die Anfrage mit einem Fehler von 400 fehl. Mögliche Werte: `auto`, `disabled`	No

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	response
text/event-stream	responseStreamEvent

Statuscode: Standard

Beschreibung: Dienst nicht verfügbar

Inhaltstyp	Typ	Beschreibung
application/json	errorResponse

Responses API – Eingabepunkte

GET https://{endpoint}/openai/responses/{response_id}?api-version=2025-04-01-preview

Ruft eine Modellantwort mit der gegebenen ID ab.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
response_id	path	Ja	string	Die ID der Antwort, die abgerufen werden soll.
include	Anfrage	No	array	Zusätzliche Felder, die in die Antwort aufgenommen werden sollten. Weitere Informationen finden Sie den `include` obigen Parameter zur Antworterstellung.

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	response

Statuscode: Standard

Beschreibung: Dienst nicht verfügbar

Inhaltstyp	Typ	Beschreibung
application/json	errorResponse

Antwort löschen

DELETE https://{endpoint}/openai/responses/{response_id}?api-version=2025-04-01-preview

Löscht eine Modellantwort mit der angegebenen ID.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
response_id	path	Ja	string	Die ID der Antwort zum Löschen.

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Statuscode: 404

Beschreibung: Nicht gefunden

Inhaltstyp	Typ	Beschreibung
application/json	error

Statuscode: Standard

Beschreibung: Dienst nicht verfügbar

Inhaltstyp	Typ	Beschreibung
application/json	errorResponse

Responses API – Liste der Antwortobjekte

GET https://{endpoint}/openai/responses/{response_id}/input_items?api-version=2025-04-01-preview

Gibt eine Liste von Eingabeelementen für eine gegebene Antwort zurück.

URI-Parameter

Name	In	Erforderlich	Typ	Beschreibung
endpoint	path	Ja	Zeichenketten-URL	Unterstützt Azure OpenAI-Endpunkte (Protokoll und Hostname, zum Beispiel: `https://aoairesource.openai.azure.com`. Ersetze "aoairesource" durch deinen Azure OpenAI-Ressourcennamen). https://{your-resource-name}.openai.azure.com
response_id	path	Ja	string	Die ID der Antwort, für die Eingaben abgerufen werden soll.
Begrenzung	Anfrage	No	Ganzzahl	Eine Begrenzung der Anzahl der zurückzugebenden Objekte. Das Limit kann zwischen 1 und 100 liegen, und der Standard liegt bei 20.
order	Anfrage	No	string Mögliche Werte: `asc`, `desc`	Die Reihenfolge, in der die Eingabeelemente zurückgegeben werden. Standard ist `asc`. - `asc`: Geben Sie die Eingabeelemente in aufsteigender Reihenfolge zurück. - `desc`: Geben Sie die Eingabeelemente in absteigender Reihenfolge zurück.
Nach	Anfrage	No	string	Eine Item-ID, nach der man die Einträge auflisten kann, verwendet in der Paginierung.
before	Anfrage	No	string	Eine Item-ID, um vorherige Artikel aufzulisten, verwendet in der Paginierung.

Anfrage-Kopf

Verwenden Sie entweder tokenbasierte Authentifizierung oder API-Schlüssel. Eine Authentifizierung mit tokenbasierter Authentifizierung wird empfohlen und ist sicherer.

Name	Erforderlich	Typ	Beschreibung
Autorisierung	Richtig	string	Beispiel:`Authorization: Bearer {Azure_OpenAI_Auth_Token}` Um ein Authentifizierungstoken mit Azure CLI zu generieren: `az account get-access-token --resource https://cognitiveservices.azure.com` Typ: oauth2 Autorisierungs-URL: `https://login.microsoftonline.com/common/oauth2/v2.0/authorize` Umfang: `https://ai.azure.com/.default`
API-Schlüssel	Richtig	string	Stellen Sie hier den Azure OpenAI API-Schlüssel bereit

Antworten

Statuscode: 200

Beschreibung: OK

Inhaltstyp	Typ	Beschreibung
application/json	responseItemList

Komponenten

errorResponse

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Fehler	error		No

errorBase

Name	Typ	Beschreibung	Erforderlich	Vorgabe
code	string		No
Nachricht	string		No

Fehler

Name	Typ	Beschreibung	Erforderlich
innerer Fehler	innerError	Innerer Fehler mit zusätzlichen Details.	No
param	string		No
type	string		No

innerError

Innerer Fehler mit zusätzlichen Details.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
code	innerErrorCode	Fehlercodes für das innere Fehlerobjekt.	No
Content-Filtern-Egebnisse	contentFilterPromptResults	Informationen über die Kategorie der Inhaltsfilterung (Hass, sexuell, Gewalt, self_harm), ob sie erkannt wurde, sowie das Schweregrad (very_low, niedrig, mittel, hoch im Maßstab, das die Intensität und das Risikoniveau schädlicher Inhalte bestimmt) und ob sie gefiltert wurden oder nicht. Informationen zu Jailbreak-Inhalten und Schimpfwörtern, ob sie erkannt wurden und ob sie gefiltert wurden oder nicht. Und Informationen zur Kundensperrliste, falls sie gefiltert wurde und deren ID es ist.	No

innerErrorCode

Fehlercodes für das innere Fehlerobjekt.

Eigentum	Wert
Beschreibung	Fehlercodes für das innere Fehlerobjekt.
Typ	string
Werte	`ResponsibleAIPolicyViolation`

dalleErrorResponse

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Fehler	dalleError		No

dalleError

Name	Typ	Beschreibung	Erforderlich
innerer Fehler	dalleInnerError	Innerer Fehler mit zusätzlichen Details.	No
param	string		No
type	string		No

dalleInnerError

Innerer Fehler mit zusätzlichen Details.

Name	Typ	Beschreibung	Erforderlich
code	innerErrorCode	Fehlercodes für das innere Fehlerobjekt.	No
Content-Filtern-Egebnisse	dalleFilterResults	Informationen über die Kategorie der Inhaltsfilterung (Hass, sexuell, Gewalt, self_harm), ob sie erkannt wurde, sowie das Schweregrad (very_low, niedrig, mittel, hoch im Maßstab, das die Intensität und das Risikoniveau schädlicher Inhalte bestimmt) und ob sie gefiltert wurden oder nicht. Informationen zu Jailbreak-Inhalten und Schimpfwörtern, ob sie erkannt wurden und ob sie gefiltert wurden oder nicht. Und Informationen zur Kundensperrliste, falls sie gefiltert wurde und deren ID es ist.	No
überarbeitete_Aufforderung	string	Der Prompt, mit dem das Bild generiert wurde, falls es eine Überarbeitung des Prompts gab.	No

contentFilterCompletionTextSpan

Beschreibt einen Zeitraum innerhalb des generierten Vervollständigungstextes. Offset 0 ist der erste UTF32-Codepunkt des Vervollständigungstextes.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
completion_end_offset	Ganzzahl	Versatz des ersten UTF32-Codepunkts, der aus der Spannweite ausgeschlossen ist. Dieses Feld ist für leere Felder immer gleich completion_start_offset. Dieses Feld ist für nichtleere Felder immer größer als completion_start_offset.	Ja
completion_start_offset	Ganzzahl	Versatz des UTF32-Codepunkts, der die Spanne beginnt.	Ja

InhaltFilterErgebnisBasis

Name	Typ	Beschreibung	Erforderlich	Vorgabe
gefiltert	Boolescher Wert		Ja

contentFilterSeverityResult

Name	Typ	Beschreibung	Erforderlich	Vorgabe
gefiltert	Boolescher Wert		Ja
severity	string		No

Ergebnis der Inhaltserkennungsfilterung

Name	Typ	Beschreibung	Erforderlich	Vorgabe
erkannt	Boolescher Wert		No
gefiltert	Boolescher Wert		Ja

Content-Filter mit Zitierungsergebnis erkannt

Name	Typ	Erforderlich
Zitat	Objekt	No
└– URL	string	No
└– Lizenz	string	No

contentFilterDetectedWithCompletionTextSpansResult

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Details	array		No

contentFilterIdResult

Name	Typ	Beschreibung	Erforderlich	Vorgabe
gefiltert	Boolescher Wert		Ja
id	string		No

contentFilterResultsBase

Informationen zu den Inhaltsfilterergebnissen.

Name	Typ	Beschreibung	Erforderlich
custom_blocklists	contentFilterDetailedResults	Das Filtern von Inhalten liefert eine detaillierte Anzahl der Inhaltsfilter-IDs für die gefilterten Segmente.	No
Fehler	errorBase		No
hate	Inhaltsfilter-Schweregrad-Ergebnis		No
Profanität	Ergebnis des Inhaltsfilters erkannt		No
Selbstverletzung	Inhaltsfilter-Schweregrad-Ergebnis		No
Sexuelle	Inhaltsfilter-Schweregrad-Ergebnis		No
Gewalt	Inhaltsfilter-Schweregrad-Ergebnis		No

contentFilterPromptResults

Informationen über die Kategorie der Inhaltsfilterung (Hass, sexuell, Gewalt, self_harm), ob sie erkannt wurde, sowie das Schweregrad (very_low, niedrig, mittel, hoch im Maßstab, das die Intensität und das Risikoniveau schädlicher Inhalte bestimmt) und ob sie gefiltert wurden oder nicht. Informationen zu Jailbreak-Inhalten und Schimpfwörtern, ob sie erkannt wurden und ob sie gefiltert wurden oder nicht. Und Informationen zur Kundensperrliste, falls sie gefiltert wurde und deren ID es ist.

Name	Typ	Beschreibung	Erforderlich
custom_blocklists	contentFilterDetailedResults	Das Filtern von Inhalten liefert eine detaillierte Anzahl der Inhaltsfilter-IDs für die gefilterten Segmente.	No
Fehler	errorBase		No
hate	Inhaltsfilter-Schweregrad-Ergebnis		No
indirect_attack	Ergebnis des Inhaltsfilters erkannt		No
Jailbreak	Ergebnis des Inhaltsfilters erkannt		No
Profanität	Ergebnis des Inhaltsfilters erkannt		No
Selbstverletzung	Inhaltsfilter-Schweregrad-Ergebnis		No
Sexuelle	Inhaltsfilter-Schweregrad-Ergebnis		No
Gewalt	Inhaltsfilter-Schweregrad-Ergebnis		No

Inhaltsfilterauswahl-Ergebnisse

Informationen über die Kategorie der Inhaltsfilterung (Hass, sexuell, Gewalt, self_harm), ob sie erkannt wurde, sowie das Schweregrad (very_low, niedrig, mittel, hoch im Maßstab, das die Intensität und das Risikoniveau schädlicher Inhalte bestimmt) und ob sie gefiltert wurden oder nicht. Informationen über Texte und Schimpfwörter von Drittanbietern, ob sie erkannt wurden und ob sie gefiltert wurden oder nicht. Und Informationen zur Kundensperrliste, falls sie gefiltert wurde und deren ID es ist.

Name	Typ	Beschreibung	Erforderlich
custom_blocklists	contentFilterDetailedResults	Das Filtern von Inhalten liefert eine detaillierte Anzahl der Inhaltsfilter-IDs für die gefilterten Segmente.	No
Fehler	errorBase		No
hate	Inhaltsfilter-Schweregrad-Ergebnis		No
Profanität	Ergebnis des Inhaltsfilters erkannt		No
protected_material_code	contentFilterDetectedWithCitationResult		No
protected_material_text	Ergebnis des Inhaltsfilters erkannt		No
Selbstverletzung	Inhaltsfilter-Schweregrad-Ergebnis		No
Sexuelle	Inhaltsfilter-Schweregrad-Ergebnis		No
ungrounded_material	contentFilterDetectedWithCompletionTextSpansResult		No
Gewalt	Inhaltsfilter-Schweregrad-Ergebnis		No

contentFilterDetailedResults

Das Filtern von Inhalten liefert eine detaillierte Anzahl der Inhaltsfilter-IDs für die gefilterten Segmente.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Details	array		No
gefiltert	Boolescher Wert		Ja

PromptFilterErgebnis

Inhaltsfilterung führt für einen einzelnen Prompt in der Anfrage.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Content-Filtern-Egebnisse	contentFilterPromptResults	Informationen über die Kategorie der Inhaltsfilterung (Hass, sexuell, Gewalt, self_harm), ob sie erkannt wurde, sowie das Schweregrad (very_low, niedrig, mittel, hoch im Maßstab, das die Intensität und das Risikoniveau schädlicher Inhalte bestimmt) und ob sie gefiltert wurden oder nicht. Informationen zu Jailbreak-Inhalten und Schimpfwörtern, ob sie erkannt wurden und ob sie gefiltert wurden oder nicht. Und Informationen zur Kundensperrliste, falls sie gefiltert wurde und deren ID es ist.	No
prompt_index	Ganzzahl		No

promptFilterResults

Inhaltsfilterung führt zu null oder mehr Prompts in der Anfrage. Bei einer Streaming-Anfrage können Ergebnisse für verschiedene Prompts zu unterschiedlichen Zeiten oder in unterschiedlicher Reihenfolge eingehen.

Für diese Komponente sind keine Eigenschaften definiert.

dalleContentFilterResults

Informationen zu den Inhaltsfilterergebnissen.

Name	Typ	Erforderlich
hate	Inhaltsfilter-Schweregrad-Ergebnis	No
Selbstverletzung	Inhaltsfilter-Schweregrad-Ergebnis	No
Sexuelle	Inhaltsfilter-Schweregrad-Ergebnis	No
Gewalt	Inhaltsfilter-Schweregrad-Ergebnis	No

dalleFilterResults

Name	Typ	Beschreibung	Erforderlich
custom_blocklists	contentFilterDetailedResults	Das Filtern von Inhalten liefert eine detaillierte Anzahl der Inhaltsfilter-IDs für die gefilterten Segmente.	No
hate	Inhaltsfilter-Schweregrad-Ergebnis		No
Jailbreak	Ergebnis des Inhaltsfilters erkannt		No
Profanität	Ergebnis des Inhaltsfilters erkannt		No
Selbstverletzung	Inhaltsfilter-Schweregrad-Ergebnis		No
Sexuelle	Inhaltsfilter-Schweregrad-Ergebnis		No
Gewalt	Inhaltsfilter-Schweregrad-Ergebnis		No

chatCompletionsRequestCommon

Name	Typ	Beschreibung	Erforderlich	Vorgabe
frequency_penalty	number	Zahl zwischen -2,0 und 2,0. Positive Werte bestrafen neue Token basierend auf ihrer bisherigen Häufigkeit im Text, wodurch die Wahrscheinlichkeit des Modells verringert, dieselbe Zeile wortwörtlich zu wiederholen.	No	0
Logit-Bias	Objekt	Ändere die Wahrscheinlichkeit, dass bestimmte Token im Completion erscheinen. Akzeptiert ein JSON-Objekt, das Token (angegeben durch ihre Token-ID im Tokenizer) auf einen zugehörigen Bias-Wert von -100 bis 100 zuordnet. Mathematisch wird der Bias zu den vom Modell vor der Stichprobe erzeugten Logits addiert. Der genaue Effekt variiert je nach Modell, aber Werte zwischen -1 und 1 sollten die Selektionswahrscheinlichkeit verringern oder erhöhen; Werte wie -100 oder 100 sollten zu einem Bann oder zur exklusiven Auswahl des entsprechenden Tokens führen.	No
max_completion_tokens	Ganzzahl	Eine obere Schranke für die Anzahl der Tokens, die für einen Abschluss generiert werden können, einschließlich sichtbarer Ausgabetoken und Reasoning-Tokens.	No
maximale_Anzahl_von_Tokens	Ganzzahl	Die maximale Anzahl der Token, die für die generierte Antwort erlaubt war. Standardmäßig beträgt die Anzahl der Tokens, die das Modell zurückgeben kann, (4096 – Prompt-Token). Das ist nicht mit O1-Modellen kompatibel.	No	4096
metadata	Objekt	Vom Entwickler definierte Tags und Werte, die zum Filtern von Abschlüssen im gespeicherten Abschluss-Dashboard verwendet werden.	No
presence_penalty	number	Zahl zwischen -2,0 und 2,0. Positive Werte bestrafen neue Tokens basierend darauf, ob sie bisher im Text erscheinen, was die Wahrscheinlichkeit erhöht, dass das Modell über neue Themen spricht.	No	0
Stopp	Saite oder Array	Bis zu 4 Sequenzen, bei denen die API aufhört, weitere Token zu generieren.	No
store	Boolescher Wert	Ob das Ergebnis dieser Chat-Abschlussanfrage für die Verwendung in unseren Modelldestillations- oder Bewertungsprodukten gespeichert werden soll oder nicht.	No
stream	Boolescher Wert	Wenn gesetzt, werden partielle Nachrichtendeltas gesendet, wie in ChatGPT. Token werden als rein datenbasierte, servergesendete Ereignisse gesendet, sobald sie verfügbar sind, wobei der Strom durch eine `data: [DONE]` Nachricht beendet wird.	No	Falsch
Temperatur	number	Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen. Wir empfehlen im Allgemeinen, dies zu ändern oder `top_p` , aber nicht beides.	No	1
top_p	number	Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden. Wir empfehlen im Allgemeinen, dies zu ändern oder `temperature` , aber nicht beides.	No	1
user	string	Eine eindeutige Identifikator, die Ihren Endnutzer repräsentiert und Azure OpenAI helfen kann, Missbrauch zu überwachen und zu erkennen.	No

erstellenAbschlussanfrage

Name	Typ	Beschreibung	Erforderlich	Vorgabe
best_of	Ganzzahl	Erzeugt `best_of` serverseitige Komplettierungen und gibt das "beste" zurück (das mit der höchsten Log-Wahrscheinlichkeit pro Token). Die Ergebnisse können nicht gestreamt werden. Wenn mit `n`verwendet, steuert die `best_of` Anzahl der Kandidatenkomplettierungen und `n` gibt an, wie viele zurückgegeben werden sollen. `best_of` muss größer als `n`sein. Hinweis: Da dieser Parameter viele Vervollständigungen erzeugt, kann er Ihre Token-Quote schnell verbrauchen. Verwenden Sie sorgfältig und stellen Sie sicher, dass Sie angemessene Einstellungen für `max_tokens` und `stop`haben.	No	1
Echo	Boolescher Wert	Echo den Prompt zusätzlich zum Abschluss	No	Falsch
frequency_penalty	number	Zahl zwischen -2,0 und 2,0. Positive Werte bestrafen neue Token basierend auf ihrer bisherigen Häufigkeit im Text, wodurch die Wahrscheinlichkeit des Modells verringert, dieselbe Zeile wortwörtlich zu wiederholen.	No	0
Logit-Bias	Objekt	Ändere die Wahrscheinlichkeit, dass bestimmte Token im Completion erscheinen. Akzeptiert ein JSON-Objekt, das Token (angegeben durch ihre Token-ID im GPT-Tokenizer) auf einen zugehörigen Bias-Wert von -100 bis 100 zuordnet. Mathematisch wird der Bias zu den vom Modell vor der Stichprobe erzeugten Logits addiert. Der genaue Effekt variiert je nach Modell, aber Werte zwischen -1 und 1 sollten die Selektionswahrscheinlichkeit verringern oder erhöhen; Werte wie -100 oder 100 sollten zu einem Bann oder zur exklusiven Auswahl des entsprechenden Tokens führen. Zum Beispiel kannst du passen `{"50256": -100}` , um zu verhindern, dass das <\|endoftext\|> Token generiert wird.	No	Nichts
logprobs	Ganzzahl	Beziehen Sie die Log-Wahrscheinlichkeiten der `logprobs` wahrscheinlichsten Ausgabetoken sowie der ausgewählten Token ein. Zum Beispiel, wenn `logprobs` 5 ist, gibt die API eine Liste der 5 wahrscheinlichsten Token zurück. Die API gibt immer das `logprob` von dem abgetasteten Token zurück, sodass es bis zu viele `logprobs+1` Elemente in der Antwort geben kann. Der maximale Wert für `logprobs` ist 5.	No	Nichts
maximale_Anzahl_von_Tokens	Ganzzahl	Die maximale Anzahl der Token, die bei der Fertigstellung generiert werden können. Die Token-Anzahl deines Prompts plus `max_tokens` darf die Kontextlänge des Modells nicht überschreiten.	No	16
n	Ganzzahl	Wie viele Abschlüsse für jeden Prompt generiert werden sollen. Hinweis: Da dieser Parameter viele Vervollständigungen erzeugt, kann er Ihre Token-Quote schnell verbrauchen. Verwenden Sie sorgfältig und stellen Sie sicher, dass Sie angemessene Einstellungen für `max_tokens` und `stop`haben.	No	1
presence_penalty	number	Zahl zwischen -2,0 und 2,0. Positive Werte bestrafen neue Tokens basierend darauf, ob sie bisher im Text erscheinen, was die Wahrscheinlichkeit erhöht, dass das Modell über neue Themen spricht.	No	0
Eingabeaufforderung	Saite oder Array	Die Eingabeaufforderung(en) zur Generierung von Komplettierungen, codiert als String, Array von Strings, Array von Token oder Array von Token-Arrays. Beachten Sie, dass <\|endoftext\|> der Dokumentseparator ist, den das Modell während des Trainings sieht, sodass das Modell generiert, wenn kein Prompt angegeben ist, als ob es vom Anfang eines neuen Dokuments stammt.	Ja
seed	Ganzzahl	Wenn angegeben, bemüht sich unser System, deterministisch zu samplingen, sodass wiederholte Anfragen mit denselben `seed` Parametern dasselbe Ergebnis liefern. Determinismus ist nicht garantiert, und du solltest auf den Antwortparameter `system_fingerprint` zurückgreifen, um Änderungen im Backend zu überwachen.	No
Stopp	Saite oder Array	Bis zu 4 Sequenzen, bei denen die API aufhört, weitere Token zu generieren. Der zurückgegebene Text enthält die Stoppsequenz nicht.	No
stream	Boolescher Wert	Ob ich den Teilfortschritt zurückstreamen soll. Wenn gesetzt, werden Token als rein datenbasierte, servergesendete Ereignisse gesendet, sobald sie verfügbar sind, wobei der Strom durch eine `data: [DONE]` Nachricht beendet wird. Beispiel Python Code.	No	Falsch
Suffix	string	Das Suffix, das nach dem Abschluss des eingefügten Textes kommt. Dieser Parameter wird nur für `gpt-3.5-turbo-instruct`unterstützt.	No	Nichts
Temperatur	number	Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen. Wir empfehlen im Allgemeinen, dies zu ändern oder `top_p` , aber nicht beides.	No	1
top_p	number	Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden. Wir empfehlen im Allgemeinen, dies zu ändern oder `temperature` , aber nicht beides.	No	1
user	string	Eine eindeutige Kennung, die Ihren Endnutzer repräsentiert und dabei helfen kann, Missbrauch zu überwachen und zu erkennen.	No

createCompletionResponse

Stellt eine Vervollständigungsantwort der API dar. Hinweis: Sowohl das gestreamte als auch das nicht gestreamte Antwortobjekt haben die gleiche Form (im Gegensatz zum Chat-Endpunkt).

Name	Typ	Beschreibung	Erforderlich
Optionen	array	Die Liste der Vervollständigungsoptionen, die das Modell für die Eingabeaufforderung generiert hat.	Ja
erstellt	Ganzzahl	Der Unix-Zeitstempel (in Sekunden) des Zeitpunkts, an dem die Fertigstellung erstellt wurde.	Ja
id	string	Eine eindeutige Kennung für den Abschluss.	Ja
Modell	string	Das Modell, das für die Fertigstellung verwendet wird.	Ja
Objekt	enum	Der Objekttyp, der immer "text_completion" ist. Mögliche Werte: `text_completion`	Ja
prompt_filter_results	promptFilterResults	Inhaltsfilterung führt zu null oder mehr Prompts in der Anfrage. Bei einer Streaming-Anfrage können Ergebnisse für verschiedene Prompts zu unterschiedlichen Zeiten oder in unterschiedlicher Reihenfolge eingehen.	No
Systemfingerabdruck	string	Dieser Fingerabdruck stellt die Backend-Konfiguration dar, mit der das Modell läuft. Kann zusammen mit dem `seed` Anfrageparameter verwendet werden, um zu verstehen, wann Backend-Änderungen vorgenommen wurden, die den Determinismus beeinflussen könnten.	No
Nutzung	completionUsage	Nutzungsstatistiken für die Abschlussanfrage.	No

Chat-Vervollständigungsanfrage erstellen

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Audio	Objekt	Parameter für den Audioausgang. Erforderlich, wenn die Audioausgabe mit `modalities: ["audio"]`angefordert wird.	No
└─ Format	enum	Spezifiziert das Ausgabe-Audioformat. Muss einer von `wav`, `mp3`, `flac`, , `opus`oder `pcm16`sein. Mögliche Werte: `wav`, `mp3`, `flac`, `opus`, `pcm16`	No
└– Stimme	enum	Spezifiziert den Sprachtyp. Unterstützte Stimmen sind `alloy`, `echo`, `fable`, , `onyx`, `nova`und `shimmer`. Mögliche Werte: `alloy`, `echo`, , `fableonyx`, `nova`,`shimmer`	No
data_sources	array	Die Konfigurationseinträge für Azure OpenAI-Chat-Erweiterungen, die sie verwenden. Diese zusätzliche Spezifikation ist nur mit Azure OpenAI kompatibel.	No
frequency_penalty	number	Zahl zwischen -2,0 und 2,0. Positive Werte bestrafen neue Token basierend auf ihrer bisherigen Häufigkeit im Text, wodurch die Wahrscheinlichkeit des Modells verringert, dieselbe Zeile wortwörtlich zu wiederholen.	No	0
function_call	string oder chatCompletionFunctionCallOption	Veraltet zugunsten von `tool_choice`. Kontrolliert, welche (falls vorhandene) Funktion vom Modell aufgerufen wird. `none` das bedeutet, dass das Modell keine Funktion aufruft, sondern stattdessen eine Nachricht generiert. `auto` das bedeutet, dass das Modell zwischen der Erzeugung einer Nachricht oder dem Aufruf einer Funktion wählen kann. Die Spezifizierung einer bestimmten Funktion über `{"name": "my_function"}` zwingt das Modell, diese Funktion aufzurufen. `none` ist der Standard, wenn keine Funktionen vorhanden sind. `auto` ist der Standard, wenn Funktionen vorhanden sind.	No
functions	array	Veraltet zugunsten von `tools`. Eine Liste von Funktionen, für die das Modell JSON-Eingaben generieren kann.	No
Logit-Bias	Objekt	Ändere die Wahrscheinlichkeit, dass bestimmte Token im Completion erscheinen. Akzeptiert ein JSON-Objekt, das Token (angegeben durch ihre Token-ID im Tokenizer) auf einen zugehörigen Bias-Wert von -100 bis 100 abbildet. Mathematisch wird der Bias zu den vom Modell vor der Stichprobe erzeugten Logits addiert. Der genaue Effekt variiert je nach Modell, aber Werte zwischen -1 und 1 sollten die Selektionswahrscheinlichkeit verringern oder erhöhen; Werte wie -100 oder 100 sollten zu einem Bann oder zur exklusiven Auswahl des entsprechenden Tokens führen.	No	Nichts
logprobs	Boolescher Wert	Ob die Log-Wahrscheinlichkeiten der Ausgabetoken zurückgegeben werden sollen oder nicht. Wenn wahr, gibt die logaritarischen Wahrscheinlichkeiten jedes in der `contentmessage`von zurückgegebenen Ausgabetokens zurück.	No	Falsch
max_completion_tokens	Ganzzahl	Eine obere Schranke für die Anzahl der Tokens, die für einen Abschluss generiert werden können, einschließlich sichtbarer Ausgabetoken und Reasoning-Tokens.	No
maximale_Anzahl_von_Tokens	Ganzzahl	Die maximale Anzahl der Token, die im Chat-Abschluss generiert werden kann. Die Gesamtlänge der Eingabetoken und generierten Tokens ist durch die Kontextlänge des Modells begrenzt.	No
Nachrichten	array	Eine Liste der Nachrichten, die das bisherige Gespräch ausmachen. Beispiel Python Code.	Ja
metadata	Objekt	Vom Entwickler definierte Tags und Werte, die zum Filtern von Abschlüssen im gespeicherten Abschluss-Dashboard verwendet werden.	No
modalities	ChatCompletionModalities	Ausgabetypen, die das Modell für diese Anfrage generieren soll. Die meisten Modelle sind in der Lage, Text zu generieren, was standardmäßig ist: `["text"]` Das `gpt-4o-audio-preview` Modell kann auch zur Audioerzeugung verwendet werden. Um zu verlangen, dass dieses Modell sowohl Text- als auch Audioantworten erzeugt, können Sie verwenden: `["text", "audio"]`	No
n	Ganzzahl	Wie viele Chat-Abschlussoptionen soll für jede Eingabenachricht generiert werden? Beachten Sie, dass Sie basierend auf der Anzahl der generierten Token in allen Optionen berechnet werden. Achten Sie `n` darauf, `1` die Kosten zu minimieren.	No	1
Parallele Werkzeugaufrufe	ParallelToolCalls	Ob man während der Werkzeugnutzung parallele Funktionsaufrufe aktivieren soll.	No	Richtig
prediction	PredictionContent	Konfiguration für eine vorhergesagte Ausgabe, die die Reaktionszeiten erheblich verbessern kann, wenn große Teile der Modellantwort im Voraus bekannt sind. Dies tritt am häufigsten auf, wenn Sie eine Datei mit nur geringfügigen Änderungen an den meisten Inhalten neu generieren.	No
presence_penalty	number	Zahl zwischen -2,0 und 2,0. Positive Werte bestrafen neue Tokens basierend darauf, ob sie bisher im Text erscheinen, was die Wahrscheinlichkeit erhöht, dass das Modell über neue Themen spricht.	No	0
Denkanstrengung	enum	Nur O1-Modelle Begrenzt den Aufwand beim Schließen bei Denkmustern. Derzeit unterstützte Werte sind `low`, `medium`, und `high`. Eine Reduzierung des Schlussarbeitsaufwands kann zu schnelleren Antworten und weniger Token beim Schließen in einer Antwort führen. Mögliche Werte: `low`, `medium`, `high`	No
Antwortformat	ResponseFormatText oder ResponseFormatJsonObject oder ResponseFormatJsonSchema	Ein Objekt, das das Format angibt, das das Modell ausgeben muss. Kompatibel mit GPT-4o,GPT-4o Mini, GPT-4 Turbo und allen GPT-3.5 Turbo Modellen, die neuer als `gpt-3.5-turbo-1106`. Einstellung auf `{ "type": "json_schema", "json_schema": {...} }` aktiviert strukturierte Ausgaben, die garantieren, dass das Modell mit deinem bereitgestellten JSON-Schema übereinstimmt. Die Einstellung aktiviert den `{ "type": "json_object" }` JSON-Modus, der garantiert, dass die vom Modell erzeugte Nachricht gültig ist. Wichtig: Beim Einsatz des JSON-Modus müssen Sie das Modell auch anweisen, selbst JSON über eine System- oder Benutzernachricht zu erzeugen. Ohne dies kann das Modell einen endlosen Strom von Leerraum erzeugen, bis die Erzeugung das Token-Limit erreicht, was zu einer langanhaltenden und scheinbar "festgefahrenen" Anfrage führt. Beachten Sie auch, dass der Nachrichteninhalt teilweise abgeschnitten werden kann, wenn `finish_reason="length"`, was darauf hinweist, dass die Generation überschritten `max_tokens` wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.	No
seed	Ganzzahl	Diese Funktion befindet sich noch in der Beta. Wenn angegeben, bemüht sich unser System, deterministisch zu samplingen, sodass wiederholte Anfragen mit denselben `seed` Parametern dasselbe Ergebnis liefern. Determinismus ist nicht garantiert, und du solltest auf den Antwortparameter `system_fingerprint` zurückgreifen, um Änderungen im Backend zu überwachen.	No
Stopp	Saite oder Array	Bis zu 4 Sequenzen, bei denen die API aufhört, weitere Token zu generieren.	No
store	Boolescher Wert	Ob das Ergebnis dieser Chat-Abschlussanfrage für die Verwendung in unseren Modelldestillations- oder Bewertungsprodukten gespeichert werden soll oder nicht.	No
stream	Boolescher Wert	Wenn gesetzt, werden partielle Nachrichtendeltas gesendet, wie in ChatGPT. Token werden als rein datenbasierte, servergesendete Ereignisse gesendet, sobald sie verfügbar sind, wobei der Strom durch eine `data: [DONE]` Nachricht beendet wird. Beispiel Python Code.	No	Falsch
stream_options	chatCompletionStreamOptions	Optionen für Streaming-Antworten. Setzen Sie dies nur, wenn Sie `stream: true`setzen.	No	Nichts
Temperatur	number	Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen. Wir empfehlen im Allgemeinen, dies zu ändern oder `top_p` , aber nicht beides.	No	1
tool_choice	chatCompletionToolChoiceOption	Kontrolliert, welches (falls vorhandenes) Werkzeug vom Modell aufgerufen wird. `none` Das bedeutet, dass das Modell kein Tool aufruft, sondern stattdessen eine Nachricht generiert. `auto` das bedeutet, dass das Modell zwischen der Generierung einer Nachricht oder dem Aufrufen eines oder mehrerer Werkzeuge wählen kann. `required` das bedeutet, dass das Modell ein oder mehrere Werkzeuge aufrufen muss. Die Angabe eines bestimmten Werkzeugs über `{"type": "function", "function": {"name": "my_function"}}` zwingt das Modell, dieses Werkzeug aufzurufen. `none` ist der Standard, wenn keine Werkzeuge vorhanden sind. `auto` ist der Standard, wenn Werkzeuge vorhanden sind.	No
tools	array	Eine Liste der Werkzeuge, die das Modell aufrufen kann. Derzeit werden nur Funktionen als Werkzeug unterstützt. Nutzen Sie dies, um eine Liste von Funktionen bereitzustellen, für die das Modell JSON-Eingaben generieren kann. Maximal 128 Funktionen werden unterstützt.	No
top_logprobs	Ganzzahl	Eine ganze Zahl zwischen 0 und 20, die die Anzahl der wahrscheinlichsten Token angibt, die an jeder Tokenposition zurückgegeben werden sollen, jeweils mit einer zugehörigen Log-Wahrscheinlichkeit. `logprobs` muss auf `true` gesetzt werden, wenn dieser Parameter verwendet wird.	No
top_p	number	Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden. Wir empfehlen im Allgemeinen, dies zu ändern oder `temperature` , aber nicht beides.	No	1
user	string	Eine eindeutige Kennung, die Ihren Endnutzer repräsentiert und dabei helfen kann, Missbrauch zu überwachen und zu erkennen.	No
user_security_context	userSecurityContext	Der Benutzersicherheitskontext enthält mehrere Parameter, die die KI-Anwendung selbst und den Endnutzer beschreiben, der mit der KI-Anwendung interagiert. Diese Bereiche unterstützen Ihre Sicherheitsteams dabei, Sicherheitsvorfälle zu untersuchen und zu mindern, indem sie einen umfassenden Ansatz zum Schutz Ihrer KI-Anwendungen bieten. Erfahren Sie mehr zum Schutz von KI-Anwendungen mit Microsoft Defender for Cloud.	No

userSecurityContext

Der Benutzersicherheitskontext enthält mehrere Parameter, die die KI-Anwendung selbst und den Endnutzer beschreiben, der mit der KI-Anwendung interagiert. Diese Bereiche unterstützen Ihre Sicherheitsteams dabei, Sicherheitsvorfälle zu untersuchen und zu mindern, indem sie einen umfassenden Ansatz zum Schutz Ihrer KI-Anwendungen bieten. Erfahren Sie mehr zum Schutz von KI-Anwendungen mit Microsoft Defender for Cloud.

Name	Typ	Beschreibung	Erforderlich
application_name	string	Der Name der Anwendung. Sensible personenbezogene Daten sollten in diesem Bereich nicht enthalten sein.	No
end_user_id	string	Diese Kennung ist die Microsoft Entra ID (früher Azure Active Directory) Benutzerobjekt-ID, die zur Authentifizierung von Endbenutzern innerhalb der generativen KI-Anwendung verwendet wird. Sensible personenbezogene Daten sollten in diesem Bereich nicht enthalten sein.	No
end_user_tenant_id	string	Die Microsoft 365-Tenant-ID, zu der der Endnutzer gehört. Es ist erforderlich, wenn die generative KI-Anwendung Multitenant ist.	No
source_ip	string	Erfasst die IP-Adresse des ursprünglichen Clients und akzeptiert sowohl IPv4- als auch IPv6-Formate.	No

chatCompletionFunctions

Name	Typ	Beschreibung	Erforderlich
Beschreibung	string	Eine Beschreibung dessen, was die Funktion tut, verwendet vom Modell, um zu entscheiden, wann und wie die Funktion aufgerufen wird.	No
Name	string	Der Name der aufzurufenden Funktion. Muss a-z, A-Z, 0-9 sein oder Unterstriche und Striche enthalten, mit einer maximalen Länge von 64.	Ja
parameters	FunctionParameters	Die Parameter, die die Funktion akzeptiert, werden als JSON-Schema-Objekt beschrieben. Siehe den Leitfaden für Beispiele und die JSON-Schema-Referenz für die Dokumentation zum Format. Das Weglassen `parameters` definiert eine Funktion mit einer leeren Parameterliste.	No

chatCompletionFunctionCallOption

Die Spezifizierung einer bestimmten Funktion über {"name": "my_function"} zwingt das Modell, diese Funktion aufzurufen.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Name	string	Der Name der Funktion, die aufgerufen werden soll.	Ja

chatCompletionFunctionParameters

Die Parameter, die die Funktion akzeptiert, werden als JSON-Schema-Objekt beschrieben. Siehe die Anleitung/ Beispiele und die JSON-Schema-Referenz für die Dokumentation zum Format.

Für diese Komponente sind keine Eigenschaften definiert.

chatCompletionRequestMessage

Diese Komponente kann eine der folgenden sein:

ChatCompletionRequestDeveloperMessage
chatCompletionRequestSystemMessage
chatCompletionRequestUserMessage
chatCompletionRequestAssistantMessage
chatCompletionRequestToolMessage
chatCompletionRequestFunctionMessage

ChatCompletionRequestDeveloperMessage

Vom Entwickler bereitgestellte Anweisungen, denen das Modell folgen sollte, unabhängig davon, welche Nachrichten der Nutzer gesendet hat. Bei O1-Modellen und neueren developer ersetzen Nachrichten die vorherigen system Nachrichten.

Name	Typ	Beschreibung	Erforderlich
Inhalt	Saite oder Array	Der Inhalt der Entwicklernachricht.	Ja
Name	string	Ein optionaler Name für den Teilnehmer. Liefert die Modellinformationen, um Teilnehmer derselben Rolle zu unterscheiden.	No
Rolle	enum	Die Rolle des Verfassers der Nachrichten, in diesem Fall `developer`. Mögliche Werte: `developer`	Ja

chatCompletionRequestSystemMessage

Name	Typ	Beschreibung	Erforderlich
Inhalt	Saite oder Array	Der Inhalt der Systemnachricht.	Ja
Name	string	Ein optionaler Name für den Teilnehmer. Liefert die Modellinformationen, um Teilnehmer derselben Rolle zu unterscheiden.	No
Rolle	enum	Die Rolle des Verfassers der Nachrichten, in diesem Fall `system`. Mögliche Werte: `system`	Ja

chatCompletionRequestUserMessage

Name	Typ	Beschreibung	Erforderlich
Inhalt	Saite oder Array	Der Inhalt der Benutzernachricht.	Ja
Name	string	Ein optionaler Name für den Teilnehmer. Liefert die Modellinformationen, um Teilnehmer derselben Rolle zu unterscheiden.	No
Rolle	enum	Die Rolle des Verfassers der Nachrichten, in diesem Fall `user`. Mögliche Werte: `user`	Ja

chatCompletionRequestAssistantMessage

Name	Typ	Beschreibung	Erforderlich
Inhalt	Saite oder Array	Der Inhalt der Assistentennachricht. Erforderlich, sofern `tool_calls` nicht angegeben oder `function_call` angegeben ist.	No
function_call	Objekt	Abgeschafft und durch `tool_calls`. Der Name und die Argumente einer Funktion, die aufgerufen werden sollte, wie sie vom Modell erzeugt werden.	No
└- Argumente	string	Die Argumente, mit denen die Funktion aufgerufen werden können, wie sie vom Modell im JSON-Format erzeugt werden. Beachte, dass das Modell nicht immer gültiges JSON erzeugt und Parameter halluzinieren kann, die nicht durch dein Funktionsschema definiert sind. Validiere die Argumente in deinem Code, bevor du deine Funktion aufrufst.	No
└– Name	string	Der Name der Funktion, die aufgerufen werden soll.	No
Name	string	Ein optionaler Name für den Teilnehmer. Liefert die Modellinformationen, um Teilnehmer derselben Rolle zu unterscheiden.	No
Weigerung	string	Die Ablehnungsnachricht der Assistentin.	No
Rolle	enum	Die Rolle des Verfassers der Nachrichten, in diesem Fall `assistant`. Mögliche Werte: `assistant`	Ja
tool_calls	chatCompletionMessageToolCalls	Die vom Modell generierten Werkzeugaufrufe, wie zum Beispiel Funktionsaufrufe.	No

chatCompletionRequestToolMessage

Name	Typ	Beschreibung	Erforderlich
Inhalt	Saite oder Array	Der Inhalt der Werkzeugnachricht.	Ja
Rolle	enum	Die Rolle des Verfassers der Nachrichten, in diesem Fall `tool`. Mögliche Werte: `tool`	Ja
tool_call_id	string	Tool-Anruf, auf den diese Nachricht reagiert.	Ja

chatCompletionRequestFunctionMessage

Name	Typ	Beschreibung	Erforderlich
Inhalt	string	Der Inhalt der Funktionsnachricht.	Ja
Name	string	Der Name der Funktion, die aufgerufen werden soll.	Ja
Rolle	enum	Die Rolle des Verfassers der Nachrichten, in diesem Fall `function`. Mögliche Werte: `function`	Ja

chatCompletionRequestDeveloperMessageContentPart

Diese Komponente kann eine der folgenden sein:

chatCompletionRequestMessageContentPartText

chatCompletionRequestSystemMessageContentPart

Diese Komponente kann eine der folgenden sein:

chatCompletionRequestMessageContentPartText

ChatabschlussanfrageBenutzernachrichtInhaltTeil

Diese Komponente kann eine der folgenden sein:

chatCompletionRequestMessageContentPartText
chatCompletionRequestMessageContentPartImage
chatCompletionRequestMessageContentPartAudio

chatCompletionRequestAssistantMessageContentPart

Diese Komponente kann eine der folgenden sein:

chatCompletionRequestMessageContentPartText
chatCompletionRequestMessageContentPartRefusal

chatCompletionRequestToolMessageContentPart

Diese Komponente kann eine der folgenden sein:

chatCompletionRequestMessageContentPartText

ChatVervollständigungsAnfrageNachrichtenInhaltTeilText

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Text	string	Der Textinhalt.	Ja
type	enum	Die Art des Inhalts. Mögliche Werte: `text`	Ja

chatCompletionRequestMessageContentPartAudio

Name	Typ	Beschreibung	Erforderlich
input_audio	Objekt		Ja
└– Daten	string	Base64-kodierte Audiodaten.	No
└─ Format	enum	Das Format der codierten Audiodaten. Derzeit unterstützt es "wav" und "mp3". Mögliche Werte: `wav`, `mp3`	No
type	enum	Die Art des Inhalts. Immer `input_audio`. Mögliche Werte: `input_audio`	Ja

chatCompletionRequestMessageContentPartImage

Name	Typ	Beschreibung	Erforderlich
image_url	Objekt		Ja
└– Detail	enum	Spezifiziert den Detailgrad des Bildes. Erfahren Sie mehr im Vision-Leitfaden. Mögliche Werte: `auto`, `low`, `high`	No
└– URL	string	Entweder eine URL des Bildes oder die von base64 codierten Bilddaten.	No
type	enum	Die Art des Inhalts. Mögliche Werte: `image_url`	Ja

chatCompletionRequestMessageContentPartRefusal

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Weigerung	string	Die vom Modell generierte Ablehnungsnachricht.	Ja
type	enum	Die Art des Inhalts. Mögliche Werte: `refusal`	Ja

Azure-Chat-Erweiterungskonfiguration

Eine Darstellung von Konfigurationsdaten für eine einzelne Azure OpenAI Chat-Erweiterung. Dies wird von einer Chat-Abschlussanfrage verwendet, die Azure OpenAI-Chaterweiterungen nutzen sollte, um das Antwortverhalten zu verbessern. Die Verwendung dieser Konfiguration ist nur mit Azure OpenAI kompatibel.

###Discriminator für azureChatExtensionConfiguration

Diese Komponente nutzt die Eigenschaft type , um zwischen verschiedenen Typen zu unterscheiden:

Typwert	Schema
`azure_search`	azureSearchChatExtensionConfiguration
`azure_cosmos_db`	azureCosmosDBChatExtensionConfiguration
`elasticsearch`	elasticsearchChatExtensionConfiguration
`mongo_db`	mongoDBChatExtensionConfiguration
`pinecone`	pineconeChatExtensionConfiguration

Name	Typ	Beschreibung	Erforderlich	Vorgabe
type	azureChatExtensionType	Eine Darstellung von Konfigurationsdaten für eine einzelne Azure OpenAI Chat-Erweiterung. Dies wird von einer Chat-Abschlussanfrage verwendet, die Azure OpenAI-Chaterweiterungen nutzen sollte, um das Antwortverhalten zu verbessern. Die Verwendung dieser Konfiguration ist nur mit Azure OpenAI kompatibel.	Ja

Azure-Chat-Erweiterungs-Typ

Eigentum	Wert
Beschreibung	Eine Darstellung von Konfigurationsdaten für eine einzelne Azure OpenAI Chat-Erweiterung. Dies wird von einer Chat-Abschlussanfrage verwendet, die Azure OpenAI-Chaterweiterungen nutzen sollte, um das Antwortverhalten zu verbessern. Die Verwendung dieser Konfiguration ist nur mit Azure OpenAI kompatibel.
Typ	string
Werte	`azure_search` `azure_cosmos_db` `elasticsearch` `mongo_db` `pinecone`

azureSearchChatExtensionConfiguration

Eine spezifische Darstellung konfigurierbarer Optionen für Azure Search bei Verwendung als Azure OpenAI Chat-Erweiterung.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
parameters	azureSearchChatErweiterungsParameter	Parameter für Azure Search, wenn sie als Azure OpenAI Chat-Erweiterung verwendet werden.	No
type	azureChatExtensionType	Eine Darstellung von Konfigurationsdaten für eine einzelne Azure OpenAI Chat-Erweiterung. Dies wird von einer Chat-Abschlussanfrage verwendet, die Azure OpenAI-Chaterweiterungen nutzen sollte, um das Antwortverhalten zu verbessern. Die Verwendung dieser Konfiguration ist nur mit Azure OpenAI kompatibel.	Ja

azureSearchChatExtensionParameters

Parameter für Azure Search, wenn sie als Azure OpenAI Chat-Erweiterung verwendet werden.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
allow_partial_result	Boolescher Wert	Wenn es als wahr angegeben ist, erlaubt das System die Verwendung von teilweisen Suchergebnissen, und die Anfrage schlägt ab, wenn alle Abfragen fehlschlagen. Wenn nicht angegeben oder als falsch angegeben, schlägt die Anfrage fehl, wenn eine Suchanfrage fehlschlägt.	No	Falsch
authentication	onYourDataApiKeyAuthenticationOptions oder onYourDataSystemAssignedManagedIdentityAuthenticationOptions oder onYourDataUserAssignedManagedIdentityAuthenticationOptions oder onYourDataAccessTokenAuthenticationOptions		Ja
Einbettungsabhängigkeit	onYourDataEndpointVectorizationSource oder onYourDataDeploymentNameVectorizationSource oder onYourDataIntegratedVectorizationSource		No
endpoint	string	Der absolute Endpunktpfad für die Azure Search-Ressource.	Ja
Feldzuordnung	Azure-Suche-Index-Feldzuordnungsoptionen	Optionale Einstellungen zur Steuerung, wie Felder verarbeitet werden, wenn eine konfigurierte Azure Search-Ressource verwendet wird.	No
filter	string	Suchfilter.	No
in_scope	Boolescher Wert	Ob Abfragen auf die Verwendung indexierter Daten beschränkt werden sollten.	No
include_contexts	array	Die enthaltenen Eigenschaften des Ausgabekontexts. Wenn nicht angegeben, ist `citations` der Standardwert und `intent`.	No
index_name	string	Der Name des Indexes, der in der referenzierten Azure Search-Ressource verfügbar ist.	Ja
max_search_queries	Ganzzahl	Die maximale Anzahl umgeschriebener Abfragen sollte für eine Benutzernachricht an den Suchanbieter gesendet werden. Wenn dies nicht angegeben ist, bestimmt das System die Anzahl der zu sendenden Anfragen.	No
Abfrage_typ	azureSearchQueryType	Die Art der Azure Search-Abfrage, die ausgeführt werden sollte, wenn sie als Azure OpenAI-Chat-Erweiterung verwendet wird.	No
semantische_Konfiguration	string	Die zusätzliche semantische Konfiguration für die Abfrage.	No
Striktheit	Ganzzahl	Die konfigurierte Strenge der Suchrelevanzfilterung. Je höher die Strenge, desto höher ist die Präzision, aber das Erinnern an die Antwort.	No
top_n_documents	Ganzzahl	Die konfigurierte Anzahl an Dokumenten, die für die konfigurierte Abfrage angezeigt werden sollen.	No

Azure-Suche-Index-Feldzuordnungsoptionen

Optionale Einstellungen zur Steuerung, wie Felder verarbeitet werden, wenn eine konfigurierte Azure Search-Ressource verwendet wird.

Name	Typ	Beschreibung	Erforderlich
Inhaltsfelder	array	Die Namen der Indexfelder, die als Inhalt behandelt werden sollten.	No
content_fields_separator	string	Das Trennungsmuster, das Inhaltsfelder verwenden sollten.	No
filepath_field	string	Der Name des Indexfeldes, das als Dateipfad verwendet werden soll.	No
image_vector_fields	array	Die Namen von Feldern, die Bildvektordaten darstellen.	No
Titel_Feld	string	Der Name des Indexfeldes, das als Titel verwendet werden soll.	No
url_field	string	Der Name des Indexfeldes, das als URL verwendet werden soll.	No
Vektorfelder	array	Die Namen von Feldern, die Vektordaten repräsentieren.	No

Azure-Suchanfragetyp

Die Art der Azure Search-Abfrage, die ausgeführt werden sollte, wenn sie als Azure OpenAI-Chat-Erweiterung verwendet wird.

Eigentum	Wert
Beschreibung	Die Art der Azure Search-Abfrage, die ausgeführt werden sollte, wenn sie als Azure OpenAI-Chat-Erweiterung verwendet wird.
Typ	string
Werte	`simple` `semantic` `vector` `vector_simple_hybrid` `vector_semantic_hybrid`

Azure Cosmos DB Chat Erweiterung Konfiguration

Eine spezifische Darstellung konfigurierbarer Optionen für Azure Cosmos DB, wenn es als Azure OpenAI Chat-Erweiterung verwendet wird.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
parameters	azureCosmosDBChatExtensionParameters	Parameter, die bei der Konfiguration von Azure OpenAI On Your Data Chat-Erweiterungen verwendet werden sollten, wenn man Azure Cosmos DB für MongoDB vCore verwendet.	No
type	azureChatExtensionType	Eine Darstellung von Konfigurationsdaten für eine einzelne Azure OpenAI Chat-Erweiterung. Dies wird von einer Chat-Abschlussanfrage verwendet, die Azure OpenAI-Chaterweiterungen nutzen sollte, um das Antwortverhalten zu verbessern. Die Verwendung dieser Konfiguration ist nur mit Azure OpenAI kompatibel.	Ja

azureCosmosDBChatExtensionParameters

Parameter, die bei der Konfiguration von Azure OpenAI On Your Data Chat-Erweiterungen verwendet werden sollten, wenn man Azure Cosmos DB für MongoDB vCore verwendet.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
allow_partial_result	Boolescher Wert	Wenn es als wahr angegeben ist, erlaubt das System die Verwendung von teilweisen Suchergebnissen, und die Anfrage schlägt ab, wenn alle Abfragen fehlschlagen. Wenn nicht angegeben oder als falsch angegeben, schlägt die Anfrage fehl, wenn eine Suchanfrage fehlschlägt.	No	Falsch
authentication	onYourDataConnectionStringAuthenticationOptions	Die Authentifizierungsoptionen für Azure OpenAI On Your Data bei Verwendung einer Verbindungszeichenfolge.	Ja
container_name	string	Der Name des Azure Cosmos DB Resource Containers.	Ja
Datenbankname	string	Der Name der MongoDB vCore-Datenbank zur Verwendung mit Azure Cosmos DB.	Ja
Einbettungsabhängigkeit	onYourDataEndpointVectorizationSource oder onYourDataDeploymentNameVectorizationSource		Ja
Feldzuordnung	azureCosmosDBFieldMappingOptions	Optionale Einstellungen zur Steuerung, wie Felder verarbeitet werden, wenn eine konfigurierte Azure Cosmos DB-Ressource verwendet wird.	Ja
in_scope	Boolescher Wert	Ob Abfragen auf die Verwendung indexierter Daten beschränkt werden sollten.	No
include_contexts	array	Die enthaltenen Eigenschaften des Ausgabekontexts. Wenn nicht angegeben, ist `citations` der Standardwert und `intent`.	No
index_name	string	Der MongoDB vCore-Indexname zur Verwendung mit Azure Cosmos DB.	Ja
max_search_queries	Ganzzahl	Die maximale Anzahl umgeschriebener Abfragen sollte für eine Benutzernachricht an den Suchanbieter gesendet werden. Wenn dies nicht angegeben ist, bestimmt das System die Anzahl der zu sendenden Anfragen.	No
Striktheit	Ganzzahl	Die konfigurierte Strenge der Suchrelevanzfilterung. Je höher die Strenge, desto höher ist die Präzision, aber das Erinnern an die Antwort.	No
top_n_documents	Ganzzahl	Die konfigurierte Anzahl an Dokumenten, die für die konfigurierte Abfrage angezeigt werden sollen.	No

Azure-Cosmos-DB-Feldzuordnungsoptionen

Optionale Einstellungen zur Steuerung, wie Felder verarbeitet werden, wenn eine konfigurierte Azure Cosmos DB-Ressource verwendet wird.

Name	Typ	Beschreibung	Erforderlich
Inhaltsfelder	array	Die Namen der Indexfelder, die als Inhalt behandelt werden sollten.	Ja
content_fields_separator	string	Das Trennungsmuster, das Inhaltsfelder verwenden sollten.	No
filepath_field	string	Der Name des Indexfeldes, das als Dateipfad verwendet werden soll.	No
Titel_Feld	string	Der Name des Indexfeldes, das als Titel verwendet werden soll.	No
url_field	string	Der Name des Indexfeldes, das als URL verwendet werden soll.	No
Vektorfelder	array	Die Namen von Feldern, die Vektordaten repräsentieren.	Ja

elasticsearchChatExtensionConfiguration

Eine spezifische Darstellung konfigurierbarer Optionen für Elasticsearch, wenn es als Azure OpenAI-Chat-Erweiterung verwendet wird.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
parameters	elasticsearchChatExtensionParameters	Parameter, die bei der Konfiguration von ElasticsearchÂ® als Azure OpenAI Chat-Erweiterung verwendet werden sollten.	No
type	azureChatExtensionType	Eine Darstellung von Konfigurationsdaten für eine einzelne Azure OpenAI Chat-Erweiterung. Dies wird von einer Chat-Abschlussanfrage verwendet, die Azure OpenAI-Chaterweiterungen nutzen sollte, um das Antwortverhalten zu verbessern. Die Verwendung dieser Konfiguration ist nur mit Azure OpenAI kompatibel.	Ja

elasticsearchChatExtensionParameters

Parameter, die bei der Konfiguration von ElasticsearchÂ® als Azure OpenAI Chat-Erweiterung verwendet werden sollten.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
allow_partial_result	Boolescher Wert	Wenn es als wahr angegeben ist, erlaubt das System die Verwendung von teilweisen Suchergebnissen, und die Anfrage schlägt ab, wenn alle Abfragen fehlschlagen. Wenn nicht angegeben oder als falsch angegeben, schlägt die Anfrage fehl, wenn eine Suchanfrage fehlschlägt.	No	Falsch
authentication	onYourDataKeyUndKeyIdAuthenticationOptions oder onYourDataEncodedApiKeyAuthenticationOptions		Ja
Einbettungsabhängigkeit	onYourDataEndpointVectorizationSource oder onYourDataDeploymentNameVectorizationSource oder onYourDataModelIdVectorizationSource		No
endpoint	string	Der Endpunkt von Elasticsearch.®	Ja
Feldzuordnung	elasticsearchIndexFieldMappingOptions	Optionale Einstellungen zur Steuerung, wie Felder verarbeitet werden, wenn eine konfigurierte Elasticsearch-Ressource® verwendet wird.	No
in_scope	Boolescher Wert	Ob Abfragen auf die Verwendung indexierter Daten beschränkt werden sollten.	No
include_contexts	array	Die enthaltenen Eigenschaften des Ausgabekontexts. Wenn nicht angegeben, ist `citations` der Standardwert und `intent`.	No
index_name	string	Der Indexname von Elasticsearch.®	Ja
max_search_queries	Ganzzahl	Die maximale Anzahl umgeschriebener Abfragen sollte für eine Benutzernachricht an den Suchanbieter gesendet werden. Wenn dies nicht angegeben ist, bestimmt das System die Anzahl der zu sendenden Anfragen.	No
Abfrage_typ	elasticsearchQueryType	Die Art der Elasticsearch-Abrufanfrage®, die ausgeführt werden sollte, wenn sie als Azure OpenAI-Chaterweiterung verwendet wird.	No
Striktheit	Ganzzahl	Die konfigurierte Strenge der Suchrelevanzfilterung. Je höher die Strenge, desto höher ist die Präzision, aber das Erinnern an die Antwort.	No
top_n_documents	Ganzzahl	Die konfigurierte Anzahl an Dokumenten, die für die konfigurierte Abfrage angezeigt werden sollen.	No

elasticsearchIndexFieldMappingOptions

Optionale Einstellungen zur Steuerung, wie Felder verarbeitet werden, wenn eine konfigurierte Elasticsearch-Ressource® verwendet wird.

Name	Typ	Beschreibung	Erforderlich
Inhaltsfelder	array	Die Namen der Indexfelder, die als Inhalt behandelt werden sollten.	No
content_fields_separator	string	Das Trennungsmuster, das Inhaltsfelder verwenden sollten.	No
filepath_field	string	Der Name des Indexfeldes, das als Dateipfad verwendet werden soll.	No
Titel_Feld	string	Der Name des Indexfeldes, das als Titel verwendet werden soll.	No
url_field	string	Der Name des Indexfeldes, das als URL verwendet werden soll.	No
Vektorfelder	array	Die Namen von Feldern, die Vektordaten repräsentieren.	No

elasticsearchQueryType

Die Art der Elasticsearch-Abrufanfrage®, die ausgeführt werden sollte, wenn sie als Azure OpenAI-Chaterweiterung verwendet wird.

Eigentum	Wert
Beschreibung	Die Art der Elasticsearch-Abrufanfrage®, die ausgeführt werden sollte, wenn sie als Azure OpenAI-Chaterweiterung verwendet wird.
Typ	string
Werte	`simple` `vector`

mongoDBChatExtensionConfiguration

Eine spezifische Darstellung konfigurierbarer Optionen für Mongo DB, wenn es als Azure OpenAI Chat-Erweiterung verwendet wird.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
parameters	mongoDBChatExtensionParameters	Parameter, die bei der Konfiguration von Azure OpenAI On Your Data Chat-Erweiterungen bei der Verwendung von Mongo DB verwendet werden sollten.	No
type	azureChatExtensionType	Eine Darstellung von Konfigurationsdaten für eine einzelne Azure OpenAI Chat-Erweiterung. Dies wird von einer Chat-Abschlussanfrage verwendet, die Azure OpenAI-Chaterweiterungen nutzen sollte, um das Antwortverhalten zu verbessern. Die Verwendung dieser Konfiguration ist nur mit Azure OpenAI kompatibel.	Ja

mongoDBChatExtensionParameters

Parameter, die bei der Konfiguration von Azure OpenAI On Your Data Chat-Erweiterungen bei der Verwendung von Mongo DB verwendet werden sollten.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
allow_partial_result	Boolescher Wert	Wenn es als wahr angegeben ist, erlaubt das System die Verwendung von teilweisen Suchergebnissen, und die Anfrage schlägt ab, wenn alle Abfragen fehlschlagen. Wenn nicht angegeben oder als falsch angegeben, schlägt die Anfrage fehl, wenn eine Suchanfrage fehlschlägt.	No	Falsch
app_name	string	Der Name der Mongo DB-Anwendung.	Ja
authentication	onYourDataUsernameAndPasswordAuthenticationOptions	Die Authentifizierungsoptionen für Azure OpenAI On Your Data, wenn man einen Benutzernamen und ein Passwort verwendet.	Ja
collection_name	string	Der Name der Mongo DB-Sammlung.	Ja
Datenbankname	string	Der Name der Mongo DB-Datenbank.	Ja
Einbettungsabhängigkeit	onYourDataEndpointVectorizationSource oder onYourDataDeploymentNameVectorizationSource		Ja
endpoint	string	Der Name des Mongo-DB-Cluster-Endpunkts.	Ja
Feldzuordnung	mongoDBFieldMappingOptions	Optionale Einstellungen zur Steuerung, wie Felder verarbeitet werden, wenn eine konfigurierte Mongo-Datenbank-Ressource verwendet wird.	Ja
in_scope	Boolescher Wert	Ob Abfragen auf die Verwendung indexierter Daten beschränkt werden sollten.	No
include_contexts	array	Die enthaltenen Eigenschaften des Ausgabekontexts. Wenn nicht angegeben, ist `citations` der Standardwert und `intent`.	No
index_name	string	Der Name des Mongo DB-Indexes.	Ja
max_search_queries	Ganzzahl	Die maximale Anzahl umgeschriebener Abfragen sollte für eine Benutzernachricht an den Suchanbieter gesendet werden. Wenn dies nicht angegeben ist, bestimmt das System die Anzahl der zu sendenden Anfragen.	No
Striktheit	Ganzzahl	Die konfigurierte Strenge der Suchrelevanzfilterung. Je höher die Strenge, desto höher ist die Präzision, aber das Erinnern an die Antwort.	No
top_n_documents	Ganzzahl	Die konfigurierte Anzahl an Dokumenten, die für die konfigurierte Abfrage angezeigt werden sollen.	No

mongoDBFieldMappingOptions

Optionale Einstellungen zur Steuerung, wie Felder verarbeitet werden, wenn eine konfigurierte Mongo-Datenbank-Ressource verwendet wird.

Name	Typ	Beschreibung	Erforderlich
Inhaltsfelder	array	Die Namen der Indexfelder, die als Inhalt behandelt werden sollten.	Ja
content_fields_separator	string	Das Trennungsmuster, das Inhaltsfelder verwenden sollten.	No
filepath_field	string	Der Name des Indexfeldes, das als Dateipfad verwendet werden soll.	No
Titel_Feld	string	Der Name des Indexfeldes, das als Titel verwendet werden soll.	No
url_field	string	Der Name des Indexfeldes, das als URL verwendet werden soll.	No
Vektorfelder	array	Die Namen von Feldern, die Vektordaten repräsentieren.	Ja

pineconeChatExtensionConfiguration

Eine spezifische Darstellung konfigurierbarer Optionen für Pinecone, wenn es als Azure OpenAI Chat-Erweiterung verwendet wird.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
parameters	pineconeChatExtensionParameters	Parameter zur Konfiguration von Azure OpenAI Pinecone Chat-Erweiterungen.	No
type	azureChatExtensionType	Eine Darstellung von Konfigurationsdaten für eine einzelne Azure OpenAI Chat-Erweiterung. Dies wird von einer Chat-Abschlussanfrage verwendet, die Azure OpenAI-Chaterweiterungen nutzen sollte, um das Antwortverhalten zu verbessern. Die Verwendung dieser Konfiguration ist nur mit Azure OpenAI kompatibel.	Ja

pineconeChatExtensionParameters

Parameter zur Konfiguration von Azure OpenAI Pinecone Chat-Erweiterungen.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
allow_partial_result	Boolescher Wert	Wenn es als wahr angegeben ist, erlaubt das System die Verwendung von teilweisen Suchergebnissen, und die Anfrage schlägt ab, wenn alle Abfragen fehlschlagen. Wenn nicht angegeben oder als falsch angegeben, schlägt die Anfrage fehl, wenn eine Suchanfrage fehlschlägt.	No	Falsch
authentication	onYourDataApiKeyAuthenticationOptions	Die Authentifizierungsoptionen für Azure OpenAI auf Ihren Daten bei Verwendung eines API-Schlüssels.	Ja
Einbettungsabhängigkeit	onYourDataDeploymentNameVectorizationSource	Die Details einer Vektorisierungsquelle, die von Azure OpenAI On Your Data bei der Anwendung der Vektorsuche verwendet wird, die auf einem internen Embeddings-Modell-Deployment-Namen in derselben Azure OpenAI-Ressource basiert.	Ja
environment	string	Der Umweltname Pinecone.	Ja
Feldzuordnung	pineconeFieldMappingOptions	Optionale Einstellungen, um zu steuern, wie Felder bei Verwendung einer konfigurierten Pinecone-Ressource verarbeitet werden.	Ja
in_scope	Boolescher Wert	Ob Abfragen auf die Verwendung indexierter Daten beschränkt werden sollten.	No
include_contexts	array	Die enthaltenen Eigenschaften des Ausgabekontexts. Wenn nicht angegeben, ist `citations` der Standardwert und `intent`.	No
index_name	string	Der Name des Pinecone-Datenbankindexes.	Ja
max_search_queries	Ganzzahl	Die maximale Anzahl umgeschriebener Abfragen sollte für eine Benutzernachricht an den Suchanbieter gesendet werden. Wenn dies nicht angegeben ist, bestimmt das System die Anzahl der zu sendenden Anfragen.	No
Striktheit	Ganzzahl	Die konfigurierte Strenge der Suchrelevanzfilterung. Je höher die Strenge, desto höher ist die Präzision, aber das Erinnern an die Antwort.	No
top_n_documents	Ganzzahl	Die konfigurierte Anzahl an Dokumenten, die für die konfigurierte Abfrage angezeigt werden sollen.	No

pineconeFieldMappingOptions

Optionale Einstellungen, um zu steuern, wie Felder bei Verwendung einer konfigurierten Pinecone-Ressource verarbeitet werden.

Name	Typ	Beschreibung	Erforderlich
Inhaltsfelder	array	Die Namen der Indexfelder, die als Inhalt behandelt werden sollten.	Ja
content_fields_separator	string	Das Trennungsmuster, das Inhaltsfelder verwenden sollten.	No
filepath_field	string	Der Name des Indexfeldes, das als Dateipfad verwendet werden soll.	No
Titel_Feld	string	Der Name des Indexfeldes, das als Titel verwendet werden soll.	No
url_field	string	Der Name des Indexfeldes, das als URL verwendet werden soll.	No

onYourDataAuthenticationOptions

Die Authentifizierungsoptionen für Azure OpenAI On Your Data.

Discriminator für onYourDataAuthenticationOptions

Diese Komponente nutzt die Eigenschaft type , um zwischen verschiedenen Typen zu unterscheiden:

Typwert	Schema
`api_key`	onYourDataApiKeyAuthenticationOptions
`connection_string`	onYourDataConnectionStringAuthenticationOptions
`key_and_key_id`	onYourDataKeyAndKeyIdAuthenticationOptions
`encoded_api_key`	onYourDataEncodedApiKeyAuthenticationOptions
`access_token`	onYourDataAccessTokenAuthenticationOptions
`system_assigned_managed_identity`	onYourDataSystemAssignedManagedIdentityAuthenticationOptions
`user_assigned_managed_identity`	onYourDataUserAssignedManagedIdentityAuthenticationOptions
`username_and_password`	onYourDataUsernameAndPasswordAuthenticationOptions

Name	Typ	Beschreibung	Erforderlich	Vorgabe
type	onYourDataAuthenticationType	Die Authentifizierungstypen, die mit Azure OpenAI On Your Data unterstützt werden.	Ja

onYourDataContextProperty

Die Kontexteigenschaft.

Eigentum	Wert
Beschreibung	Die Kontexteigenschaft.
Typ	string
Werte	`citations` `intent` `all_retrieved_documents`

onYourDataAuthenticationType

Die Authentifizierungstypen, die mit Azure OpenAI On Your Data unterstützt werden.

Eigentum	Wert
Beschreibung	Die Authentifizierungstypen, die mit Azure OpenAI On Your Data unterstützt werden.
Typ	string
Werte	`api_key` `connection_string` `key_and_key_id` `encoded_api_key` `access_token` `system_assigned_managed_identity` `user_assigned_managed_identity` `username_and_password`

onYourDataApiKeyAuthenticationOptions

Die Authentifizierungsoptionen für Azure OpenAI auf Ihren Daten bei Verwendung eines API-Schlüssels.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Schlüssel	string	Der API-Schlüssel zur Authentifizierung.	No
type	onYourDataAuthenticationType	Die Authentifizierungstypen, die mit Azure OpenAI On Your Data unterstützt werden.	Ja

onYourDataConnectionStringAuthentifizierungsoptionen

Die Authentifizierungsoptionen für Azure OpenAI On Your Data bei Verwendung einer Verbindungszeichenfolge.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
connection_string	string	Die Verbindungszeichenfolge zur Authentifizierung.	No
type	onYourDataAuthenticationType	Die Authentifizierungstypen, die mit Azure OpenAI On Your Data unterstützt werden.	Ja

onYourDataKeyAndKeyIdAuthenticationOptions

Die Authentifizierungsoptionen für Azure OpenAI On Your Data bei Verwendung eines Elasticsearch-Schlüssel- und Schlüssel-ID-Paares.

Name	Typ	Beschreibung	Erforderlich
Schlüssel	string	Der Elasticsearch-Schlüssel für die Authentifizierung.	No
key_id	string	Die Elasticsearch-Schlüssel-ID zur Verwendung zur Authentifizierung.	No
type	onYourDataAuthenticationType	Die Authentifizierungstypen, die mit Azure OpenAI On Your Data unterstützt werden.	Ja

onYourDataEncodedApiKeyAuthenticationOptions

Die Authentifizierungsoptionen für Azure OpenAI On Your Data bei Verwendung eines Elasticsearch-codierten API-Schlüssels.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
encoded_api_key	string	Der Elasticsearch kodierte API-Schlüssel zur Verwendung zur Authentifizierung.	No
type	onYourDataAuthenticationType	Die Authentifizierungstypen, die mit Azure OpenAI On Your Data unterstützt werden.	Ja

onYourDataAccessTokenAuthenticationOptions

Die Authentifizierungsoptionen für Azure OpenAI On Your Data bei Verwendung des Zugriffstokens.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
access_token	string	Der Zugangstoken zur Authentifizierung.	No
type	onYourDataAuthenticationType	Die Authentifizierungstypen, die mit Azure OpenAI On Your Data unterstützt werden.	Ja

onYourDataSystemAssignedManagedIdentityAuthenticationOptions

Die Authentifizierungsoptionen für Azure OpenAI On Your Data bei Verwendung einer systemzugeordneten verwalteten Identität.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
type	onYourDataAuthenticationType	Die Authentifizierungstypen, die mit Azure OpenAI On Your Data unterstützt werden.	Ja

onYourDataUserAssignedManagedIdentityAuthenticationOptions

Die Authentifizierungsoptionen für Azure OpenAI On Your Data bei Verwendung einer benutzerdefinierten verwalteten Identität.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
managed_identity_resource_id	string	Die Ressourcen-ID der vom Benutzer zugewiesenen verwalteten Identität zur Verwendung zur Authentifizierung.	No
type	onYourDataAuthenticationType	Die Authentifizierungstypen, die mit Azure OpenAI On Your Data unterstützt werden.	Ja

onYourDataUsernameAndPasswordAuthenticationOptions

Die Authentifizierungsoptionen für Azure OpenAI On Your Data, wenn man einen Benutzernamen und ein Passwort verwendet.

Name	Typ	Beschreibung	Erforderlich
Passwort	string	Das Kennwort. zur Authentifizierung.	No
type	onYourDataAuthenticationType	Die Authentifizierungstypen, die mit Azure OpenAI On Your Data unterstützt werden.	Ja
username	string	Der Benutzername für die Authentifizierung.	No

onYourDataVectorizationSource

Eine abstrakte Darstellung einer Vektorisierungsquelle für Azure OpenAI On Your Data mit Vektorsuche.

Diese Komponente nutzt die Eigenschaft type , um zwischen verschiedenen Typen zu unterscheiden:

Typwert	Schema
`endpoint`	onYourDataEndpointVectorizationSource
`deployment_name`	onYourDataDeploymentNameVectorizationSource
`integrated`	onYourDataIntegratedVectorizationSource
`model_id`	onYourDataModelIdVectorizationSource

Name	Typ	Beschreibung	Erforderlich	Vorgabe
type	onYourDataVectorizationSourceType	Repräsentiert die verfügbaren Quellen, die Azure OpenAI On Your Data verwenden kann, um die Vektorisierung von Daten für die Vektorsuche zu konfigurieren.	Ja

onYourDataVectorizationSourceType

Repräsentiert die verfügbaren Quellen, die Azure OpenAI On Your Data verwenden kann, um die Vektorisierung von Daten für die Vektorsuche zu konfigurieren.

Eigentum	Wert
Beschreibung	Repräsentiert die verfügbaren Quellen, die Azure OpenAI On Your Data verwenden kann, um die Vektorisierung von Daten für die Vektorsuche zu konfigurieren.
Typ	string
Werte	`endpoint` `deployment_name` `integrated` `model_id`

onYourDataEndpointVectorizationSource

Die Details einer Vektorisierungsquelle, die von Azure OpenAI On Your Data bei der Anwendung der Vektorsuche verwendet wird und auf einem öffentlichen Azure OpenAI-Endpunktaufruf für Embeddings basiert.

Name	Typ	Beschreibung	Erforderlich
authentication	onYourDataApiKeyAuthenticationOptions oder onYourDataAccessTokenAuthenticationOptions		No
Abmessungen	Ganzzahl	Die Anzahl der Dimensionen, die die Einbettungen haben sollten. Nur in `text-embedding-3` und neueren Modellen unterstützt.	No
endpoint	string	Spezifiziert die URL des Ressourcenendpunkts, von der Einbettungen abgerufen werden sollen. Es sollte im Format von `https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings`. Der API-Version Query-Parameter ist nicht erlaubt.	No
type	onYourDataVectorizationSourceType	Repräsentiert die verfügbaren Quellen, die Azure OpenAI On Your Data verwenden kann, um die Vektorisierung von Daten für die Vektorsuche zu konfigurieren.	Ja

onYourDataDeploymentNameVectorizationSource

Die Details einer Vektorisierungsquelle, die von Azure OpenAI On Your Data bei der Anwendung der Vektorsuche verwendet wird und auf einem internen Embeddings-Modell-Deploymentsnamen in derselben Azure OpenAI-Ressource basiert.

Name	Typ	Beschreibung	Erforderlich
deployment_name	string	Spezifiziert den Namen der Modellbereitstellung, die für die Vektorisierung verwendet werden soll. Diese Modellbereitstellung muss in derselben Azure OpenAI-Ressource erfolgen, aber On Your Data verwendet diese Modellbereitstellung über einen internen Aufruf statt eines öffentlichen Aufrufs, was Vektorsuche auch in privaten Netzwerken ermöglicht.	No
Abmessungen	Ganzzahl	Die Anzahl der Dimensionen, die die Einbettungen haben sollten. Nur in `text-embedding-3` und neueren Modellen unterstützt.	No
type	onYourDataVectorizationSourceType	Repräsentiert die verfügbaren Quellen, die Azure OpenAI On Your Data verwenden kann, um die Vektorisierung von Daten für die Vektorsuche zu konfigurieren.	Ja

onYourDataIntegratedVectorizationSource

Repräsentiert den integrierten Vektorizer, der innerhalb der Suchressource definiert ist.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
type	onYourDataVectorizationSourceType	Repräsentiert die verfügbaren Quellen, die Azure OpenAI On Your Data verwenden kann, um die Vektorisierung von Daten für die Vektorsuche zu konfigurieren.	Ja

onYourDataModelIdVectorizationSource

Die Details einer Vektorisierungsquelle, die von Azure OpenAI On Your Data bei der Anwendung der Vektorsuche verwendet wird, die auf der Modell-ID eines Suchdienstes basiert. Derzeit nur von Elasticsearch® unterstützt.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
model_id	string	Spezifiziert die Modell-ID für die Vektorisierung. Diese Modell-ID muss im Suchdienst definiert werden.	No
type	onYourDataVectorizationSourceType	Repräsentiert die verfügbaren Quellen, die Azure OpenAI On Your Data verwenden kann, um die Vektorisierung von Daten für die Vektorsuche zu konfigurieren.	Ja

Azure-Chat-ErweiterungenNachrichtKontext

Eine Darstellung der zusätzlichen Kontextinformationen, die verfügbar sind, wenn Azure OpenAI-Chat-Erweiterungen an der Erstellung einer entsprechenden Antwort auf Chat-Abschlüsse beteiligt sind. Diese Kontextinformationen werden nur ausgefüllt, wenn eine Azure OpenAI-Anfrage verwendet wird, die so konfiguriert ist, dass eine passende Erweiterung verwendet wird.

Name	Typ	Beschreibung	Erforderlich
all_retrieved_documents	array	Alle gesicherten Dokumente.	No
Zitationen	array	Das Ergebnis der Datenquellenabruf, das zur Erzeugung der Assistentennachricht in der Antwort verwendet wird.	No
Absicht	string	Die erkannte Absicht aus dem Chatverlauf wurde verwendet, um an die nächste Runde weitergegeben zu werden, um den Kontext zu übertragen.	No

Zitat

Zitationsinformationen für eine Chat-Komplettantwort-Nachricht.

Name	Typ	Beschreibung	Erforderlich
chunk_id	string	Die Chunk-ID der Strafzettel.	No
Inhalt	string	Der Inhalt der Zitate.	Ja
Dateipfad	string	Der Dateipfad des Zitats.	No
rerank_score	number	Die Rerang-Punktzahl des geborgenen Dokuments.	No
title	string	Der Titel der Auszeichnung.	No
url	string	Die URL des Zitats.	No

retrievedDocument

Das abgerufene Dokument.

Name	Typ	Beschreibung	Erforderlich
chunk_id	string	Die Chunk-ID der Strafzettel.	No
Inhalt	string	Der Inhalt der Zitate.	Ja
data_source_index	Ganzzahl	Der Index der Datenquelle.	No
Dateipfad	string	Der Dateipfad des Zitats.	No
filter_reason	filterReason	Der Filtergrund des abgerufenen Dokuments.	No
original_search_score	number	Die ursprüngliche Suchwertung des abgerufenen Dokuments.	No
rerank_score	number	Die Rerang-Punktzahl des geborgenen Dokuments.	No
search_queries	array	Die Suchanfragen wurden verwendet, um das Dokument abzurufen.	No
title	string	Der Titel der Auszeichnung.	No
url	string	Die URL des Zitats.	No

filterReason

Der Filtergrund des abgerufenen Dokuments.

Eigentum	Wert
Beschreibung	Der Filtergrund des abgerufenen Dokuments.
Typ	string
Werte	`score` `rerank`

chatCompletionMessageToolCall

Name	Typ	Beschreibung	Erforderlich
Funktion	Objekt	Die Funktion, die das Modell aufgerufen hat.	Ja
└- Argumente	string	Die Argumente, mit denen die Funktion aufgerufen werden können, wie sie vom Modell im JSON-Format erzeugt werden. Beachte, dass das Modell nicht immer gültiges JSON erzeugt und Parameter halluzinieren kann, die nicht durch dein Funktionsschema definiert sind. Validiere die Argumente in deinem Code, bevor du deine Funktion aufrufst.	No
└– Name	string	Der Name der Funktion, die aufgerufen werden soll.	No
id	string	Die ID des Werkzeugrufs.	Ja
type	toolCallType	Der Typ des Werkzeugaufrufs, in diesem Fall `function`.	Ja

toolCallType

Der Typ des Werkzeugaufrufs, in diesem Fall function.

Eigentum	Wert
Beschreibung	Der Typ des Werkzeugaufrufs, in diesem Fall `function`.
Typ	string
Werte	`function`

chatCompletionRequestMessageTool

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Inhalt	string	Der Inhalt der Nachricht.	No
tool_call_id	string	Tool-Anruf, auf den diese Nachricht reagiert.	No

chatCompletionRequestMessageFunction

Name	Typ	Beschreibung	Erforderlich
Inhalt	string	Der Inhalt der Nachricht.	No
Name	string	Der Inhalt der Nachricht.	No
Rolle	enum	Die Rolle des Verfassers der Nachrichten, in diesem Fall `function`. Mögliche Werte: `function`	No

createChatCompletionResponse

Repräsentiert eine vom Modell zurückgegebene Chat-Abschlussantwort, basierend auf der bereitgestellten Eingabe.

Name	Typ	Beschreibung	Erforderlich
Optionen	array	Eine Liste von Chat-Abschlussmöglichkeiten. Kann mehr als eins sein, wenn `n` größer als 1 ist.	Ja
erstellt	Ganzzahl	Der Unix-Zeitstempel (in Sekunden) von der Erstellung des Chat-Abschlusses.	Ja
id	string	Eine eindeutige Kennung für den Abschluss des Chats.	Ja
Modell	string	Das Modell, das für den Chat-Abschluss verwendet wird.	Ja
Objekt	enum	Der Objekttyp, der immer `chat.completion`ist. Mögliche Werte: `chat.completion`	Ja
prompt_filter_results	promptFilterResults	Inhaltsfilterung führt zu null oder mehr Prompts in der Anfrage. Bei einer Streaming-Anfrage können Ergebnisse für verschiedene Prompts zu unterschiedlichen Zeiten oder in unterschiedlicher Reihenfolge eingehen.	No
Systemfingerabdruck	string	Dieser Fingerabdruck stellt die Backend-Konfiguration dar, mit der das Modell läuft. Kann zusammen mit dem `seed` Anfrageparameter verwendet werden, um zu verstehen, wann Backend-Änderungen vorgenommen wurden, die den Determinismus beeinflussen könnten.	No
Nutzung	completionUsage	Nutzungsstatistiken für die Abschlussanfrage.	No

createChatCompletionStreamResponse

Repräsentiert einen gestreamten Chunk einer Chat-Abschlussantwort, die vom Modell auf Basis der bereitgestellten Eingabe zurückgegeben wird.

Name	Typ	Beschreibung	Erforderlich
Optionen	array	Eine Liste von Chat-Abschlussmöglichkeiten. Kann mehr als ein Element enthalten, wenn `n` größer als 1 ist.	Ja
erstellt	Ganzzahl	Der Unix-Zeitstempel (in Sekunden) von der Erstellung des Chat-Abschlusses. Jeder Chunk hat denselben Zeitstempel.	Ja
id	string	Eine eindeutige Kennung für den Abschluss des Chats. Jeder Chunk hat dieselbe ID.	Ja
Modell	string	Das Modell, um die Komplettierung zu erzeugen.	Ja
Objekt	enum	Der Objekttyp, der immer `chat.completion.chunk`ist. Mögliche Werte: `chat.completion.chunk`	Ja
Systemfingerabdruck	string	Dieser Fingerabdruck stellt die Backend-Konfiguration dar, mit der das Modell läuft. Kann zusammen mit dem `seed` Anfrageparameter verwendet werden, um zu verstehen, wann Backend-Änderungen vorgenommen wurden, die den Determinismus beeinflussen könnten.	No

chatCompletionStreamResponseDelta

Ein Chat-Abschluss-Delta, das durch gestreamte Modellantworten erzeugt wird.

Name	Typ	Beschreibung	Erforderlich
Inhalt	string	Der Inhalt der Chunk-Nachricht.	No
function_call	Objekt	Abgeschafft und durch `tool_calls`. Der Name und die Argumente einer Funktion, die aufgerufen werden sollte, wie sie vom Modell erzeugt werden.	No
└- Argumente	string	Die Argumente, mit denen die Funktion aufgerufen werden können, wie sie vom Modell im JSON-Format erzeugt werden. Beachte, dass das Modell nicht immer gültiges JSON erzeugt und Parameter halluzinieren kann, die nicht durch dein Funktionsschema definiert sind. Validiere die Argumente in deinem Code, bevor du deine Funktion aufrufst.	No
└– Name	string	Der Name der Funktion, die aufgerufen werden soll.	No
Weigerung	string	Die vom Modell generierte Ablehnungsnachricht.	No
Rolle	enum	Die Rolle des Verfassers dieser Botschaft. Mögliche Werte: `system`, `user`, `assistant`, `tool`	No
tool_calls	array		No

chatCompletionMessageToolCallChunk

Name	Typ	Beschreibung	Erforderlich
Funktion	Objekt		No
└- Argumente	string	Die Argumente, mit denen die Funktion aufgerufen werden können, wie sie vom Modell im JSON-Format erzeugt werden. Beachte, dass das Modell nicht immer gültiges JSON erzeugt und Parameter halluzinieren kann, die nicht durch dein Funktionsschema definiert sind. Validiere die Argumente in deinem Code, bevor du deine Funktion aufrufst.	No
└– Name	string	Der Name der Funktion, die aufgerufen werden soll.	No
id	string	Die ID des Werkzeugrufs.	No
index	Ganzzahl		Ja
type	enum	Die Art des Werkzeugs. Derzeit wird nur `function` unterstützt. Mögliche Werte: `function`	No

chatCompletionStreamOptions

Optionen für Streaming-Antworten. Setzen Sie dies nur, wenn Sie stream: truesetzen.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
include_usage	Boolescher Wert	Wenn gesetzt, wird ein zusätzlicher Chunk vor der `data: [DONE]` Nachricht gestreamt. Das Feld `usage` in diesem Chunk zeigt die Token-Nutzungsstatistiken für die gesamte Anfrage, und das `choices` Feld bleibt immer ein leeres Array. Alle anderen Chunks enthalten ebenfalls ein Feld `usage` , allerdings mit einem Nullwert.	No

chatCompletionChoiceLogProbs

Protokollieren Sie die Wahrscheinlichkeitsinformationen für die Wahl.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Inhalt	array	Eine Liste von Nachrichteninhaltstoken mit Log-Wahrscheinlichkeitsinformationen.	Ja
Weigerung	array	Eine Liste von Nachrichten-Ablehnungstoken mit Log-Wahrscheinlichkeitsinformationen.	No

chatCompletionTokenLogprob

Name	Typ	Beschreibung	Erforderlich
Bytes	array	Eine Liste von ganzen Zahlen, die die UTF-8-Bytes-Darstellung des Tokens darstellen. Nützlich in Fällen, in denen Zeichen durch mehrere Token dargestellt werden und deren Byte-Darstellungen kombiniert werden müssen, um die korrekte Textrepräsentation zu erzeugen. Kann passieren `null` , wenn es keine Bytes-Darstellung für das Token gibt.	Ja
logprob	number	Die Log-Wahrscheinlichkeit dieses Tokens.	Ja
Token	string	Das Token.	Ja
top_logprobs	array	Liste der wahrscheinlichsten Token und deren Log-Wahrscheinlichkeit an dieser Token-Position. In seltenen Fällen können weniger als die Anzahl der zurückgefragten `top_logprobs` Personen sein.	Ja

chatCompletionResponseMessage

Eine vom Modell generierte Chat-Abschluss-Nachricht.

Name	Typ	Beschreibung	Erforderlich
Audio	Objekt	Wenn die Audioausgabemodalität angefordert wird, enthält dieses Objekt Daten über die Audioantwort des Modells.	No
└– Daten	string	Base64 kodierte Audiobytes, die vom Modell generiert wurden, in dem in der Anfrage angegebenen Format.	No
└– abläuft_am	Ganzzahl	Der Unix-Zeitstempel (in Sekunden) dafür, wann diese Audioantwort auf dem Server nicht mehr für mehrfache Rundengespräche zugänglich ist.	No
└– ID	string	Eindeutige Kennung für diese Audioantwort.	No
└– Transkript	string	Transkript des vom Modell erzeugten Audios.	No
Inhalt	string	Der Inhalt der Nachricht.	Ja
context	azureChatExtensionsMessageContext	Eine Darstellung der zusätzlichen Kontextinformationen, die verfügbar sind, wenn Azure OpenAI-Chat-Erweiterungen an der Erstellung einer entsprechenden Antwort auf Chat-Abschlüsse beteiligt sind. Diese Kontextinformationen werden nur ausgefüllt, wenn eine Azure OpenAI-Anfrage verwendet wird, die so konfiguriert ist, dass eine passende Erweiterung verwendet wird.	No
function_call	chatCompletionFunctionCall	Abgeschafft und durch `tool_calls`. Der Name und die Argumente einer Funktion, die aufgerufen werden sollte, wie sie vom Modell erzeugt werden.	No
Weigerung	string	Die vom Modell generierte Ablehnungsnachricht.	Ja
Rolle	chatCompletionResponseMessageRole	Die Rolle des Autors der Antwortnachricht.	Ja
tool_calls	array	Die vom Modell generierten Werkzeugaufrufe, wie zum Beispiel Funktionsaufrufe.	No

chatCompletionResponseMessageRole

Die Rolle des Autors der Antwortnachricht.

Eigentum	Wert
Beschreibung	Die Rolle des Autors der Antwortnachricht.
Typ	string
Werte	`assistant`

chatCompletionToolChoiceOption

Kontrolliert, welches (falls vorhandenes) Werkzeug vom Modell aufgerufen wird. none Das bedeutet, dass das Modell kein Tool aufruft, sondern stattdessen eine Nachricht generiert. auto das bedeutet, dass das Modell zwischen der Generierung einer Nachricht oder dem Aufrufen eines oder mehrerer Werkzeuge wählen kann. required das bedeutet, dass das Modell ein oder mehrere Werkzeuge aufrufen muss. Die Angabe eines bestimmten Werkzeugs über {"type": "function", "function": {"name": "my_function"}} zwingt das Modell, dieses Werkzeug aufzurufen. none ist der Standard, wenn keine Werkzeuge vorhanden sind. auto ist der Standard, wenn Werkzeuge vorhanden sind.

Diese Komponente kann eine der folgenden sein:

chatCompletionNamedToolChoice

chatCompletionNamedToolChoice

Spezifiziert ein Werkzeug, das das Modell verwenden soll. Verwenden Sie, um das Modell zu zwingen, eine bestimmte Funktion aufzurufen.

Name	Typ	Beschreibung	Erforderlich
Funktion	Objekt		Ja
└– Name	string	Der Name der Funktion, die aufgerufen werden soll.	No
type	enum	Die Art des Werkzeugs. Derzeit wird nur `function` unterstützt. Mögliche Werte: `function`	Ja

ParallelToolCalls

Ob man während der Werkzeugnutzung parallele Funktionsaufrufe aktivieren soll.

Für diese Komponente sind keine Eigenschaften definiert.

PredictionContent

Statisch vorhergesagte Ausgabeinhalte, wie zum Beispiel der Inhalt einer Textdatei, die regeneriert wird.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Inhalt	Saite oder Array	Der Inhalt, der bei der Erstellung einer Modellantwort abgestimmt werden sollte. Wenn generierte Tokens mit diesem Inhalt übereinstimmen, kann die gesamte Modellantwort viel schneller zurückgegeben werden.	Ja
type	enum	Die Art der vorhergesagten Inhalte, die Sie bereitstellen möchten. Dieser Typ ist derzeit immer `content`. Mögliche Werte: `content`	Ja

chatCompletionMessageToolCalls

Die vom Modell generierten Werkzeugaufrufe, wie zum Beispiel Funktionsaufrufe.

Für diese Komponente sind keine Eigenschaften definiert.

ChatCompletionModalities

Ausgabetypen, die das Modell für diese Anfrage generieren soll. Die meisten Modelle sind in der Lage, Text zu generieren, was standardmäßig ist:

["text"]

Das gpt-4o-audio-preview Modell kann auch zur Audioerzeugung verwendet werden. Um zu verlangen, dass dieses Modell sowohl Text- als auch Audioantworten erzeugt, können Sie verwenden:

["text", "audio"]

Für diese Komponente sind keine Eigenschaften definiert.

chatCompletionFunctionCall

Abgeschafft und durch tool_calls. Der Name und die Argumente einer Funktion, die aufgerufen werden sollte, wie sie vom Modell erzeugt werden.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Argumente	string	Die Argumente, mit denen die Funktion aufgerufen werden können, wie sie vom Modell im JSON-Format erzeugt werden. Beachte, dass das Modell nicht immer gültiges JSON erzeugt und Parameter halluzinieren kann, die nicht durch dein Funktionsschema definiert sind. Validiere die Argumente in deinem Code, bevor du deine Funktion aufrufst.	Ja
Name	string	Der Name der Funktion, die aufgerufen werden soll.	Ja

completionUsage

Nutzungsstatistiken für die Abschlussanfrage.

Name	Typ	Beschreibung	Erforderlich
completion_tokens	Ganzzahl	Anzahl der Token in der generierten Komplettierung.	Ja
completion_tokens_details	Objekt	Aufschlüsselung der in einer Komplettierung verwendeten Token.	No
└– akzeptierte_Vorhersage_Token	Ganzzahl	Bei Verwendung von Predicted Outputs ist die Anzahl der Token in der Vorhersage, die in der Completion erschienen sind.	No
└– audio_tokens	Ganzzahl	Audio-Eingangstoken, die vom Modell generiert werden.	No
└– reasoning_tokens	Ganzzahl	Tokens, die vom Modell zur Argumentation generiert werden.	No
└– rejected_prediction_tokens	Ganzzahl	Bei Verwendung von Predicted Outputs ist die Anzahl der Token in der Vorhersage, die in der Completion nicht erschienen sind. Wie Reasoning-Tokens werden diese Token jedoch weiterhin in die Gesamtvervollständigungstoken für Abrechnungs-, Ausgabe- und Kontextfenstergrenzen gezählt.	No
prompt_tokens	Ganzzahl	Anzahl der Tokens im Prompt.	Ja
prompt_tokens_details	Objekt	Details zu den Prompt-Tokens.	No
└– audio_tokens	Ganzzahl	Audio-Eingabetoken sind im Prompt vorhanden.	No
└– zwischengespeicherte_Token	Ganzzahl	Die Anzahl der zwischengespeicherten Prompt-Token.	No
Gesamtanzahl Tokens	Ganzzahl	Gesamtzahl der in der Anfrage verwendeten Token (Prompt + Abschluss).	Ja

chatCompletionTool

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Funktion	FunctionObject		Ja
type	enum	Die Art des Werkzeugs. Derzeit wird nur `function` unterstützt. Mögliche Werte: `function`	Ja

FunctionParameters

Die Parameter, die die Funktion akzeptiert, werden als JSON-Schema-Objekt beschrieben. Siehe den Leitfaden für Beispiele und die JSON-Schema-Referenz für die Dokumentation zum Format.

Das Weglassen parameters definiert eine Funktion mit einer leeren Parameterliste.

Für diese Komponente sind keine Eigenschaften definiert.

FunctionObject

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Beschreibung	string	Eine Beschreibung dessen, was die Funktion tut, verwendet vom Modell, um zu entscheiden, wann und wie die Funktion aufgerufen wird.	No
Name	string	Der Name der aufzurufenden Funktion. Muss a-z, A-Z, 0-9 sein oder Unterstriche und Striche enthalten, mit einer maximalen Länge von 64.	Ja
parameters	FunctionParameters	Die Parameter, die die Funktion akzeptiert, werden als JSON-Schema-Objekt beschrieben. Siehe den Leitfaden für Beispiele und die JSON-Schema-Referenz für die Dokumentation zum Format. Das Weglassen `parameters` definiert eine Funktion mit einer leeren Parameterliste.	No
strict	Boolescher Wert	Ob beim Erstellen des Funktionsaufrufs strikte Schema-Treue aktiviert werden soll. Wenn auf true gesetzt, folgt das Modell dem exakt im Feld `parameters` definierten Schema. Nur eine Teilmenge des JSON-Schemas wird unterstützt, wenn `strict` .`true`	No	Falsch

ResponseFormatText

Name	Typ	Beschreibung	Erforderlich	Vorgabe
type	enum	Der definierte Antwortformat: `text` Mögliche Werte: `text`	Ja

ResponseFormatJsonObject

Name	Typ	Beschreibung	Erforderlich	Vorgabe
type	enum	Der definierte Antwortformat: `json_object` Mögliche Werte: `json_object`	Ja

ResponseFormatJsonSchemaSchema

Das Schema für das Antwortformat, beschrieben als JSON-Schema-Objekt.

Für diese Komponente sind keine Eigenschaften definiert.

AntwortformatJsonSchema

Name	Typ	Beschreibung	Erforderlich	Vorgabe
JSON-Schema	Objekt		Ja
└– Beschreibung	string	Eine Beschreibung, wofür das Antwortformat dient, verwendet vom Modell zur Bestimmung der Antwort im Format.	No
└– Name	string	Der Name des Antwortformats. Muss a-z, A-Z, 0-9 sein oder Unterstriche und Striche enthalten, mit einer maximalen Länge von 64.	No
└- Schema	ResponseFormatJsonSchemaSchema	Das Schema für das Antwortformat, beschrieben als JSON-Schema-Objekt.	No
└– streng	Boolescher Wert	Ob strikte Schema-Compliance bei der Erzeugung der Ausgabe aktiviert werden soll. Setzt es auf wahr, folgt das Modell immer dem exakt im Feld `schema` definierten Schema. Nur eine Teilmenge des JSON-Schemas wird unterstützt, wenn `strict` .`true`	No	Falsch
type	enum	Der definierte Antwortformat: `json_schema` Mögliche Werte: `json_schema`	Ja

chatCompletionChoiceCommon

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Beendigungsgrund	string		No
index	Ganzzahl		No

Übersetzungsanforderung erstellen

Übersetzungsanforderung.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Datei	string	Die Audiodatei zum Übersetzen.	Ja
Eingabeaufforderung	string	Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen. Der Prompt sollte auf Englisch sein.	No
Antwortformat	audioResponseFormat	Definiert das Format der Ausgabe.	No
Temperatur	number	Die Probentemperatur liegt zwischen 0 und 1. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen. Wenn auf 0 gesetzt, verwendet das Modell die logaritarische Wahrscheinlichkeit, um die Temperatur automatisch zu erhöhen, bis bestimmte Schwellenwerte erreicht sind.	No	0

Audio-Antwort

Übersetzungs- oder Transkriptionsantwort, wenn response_format json war

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Text	string	Übersetzter oder transkribierter Text.	Ja

audioVerboseResponse

Übersetzungs- oder Transkriptionsantwort, wenn response_format verbose_json

Name	Typ	Beschreibung	Erforderlich
Dauer	number	Dauer.	No
language	string	Language.	No
Segmente	array		No
Aufgabe	string	Art von Audioaufgabe.	No
Text	string	Übersetzter oder transkribierter Text.	Ja
words	array		No

audioResponseFormat

Definiert das Format der Ausgabe.

Eigentum	Wert
Beschreibung	Definiert das Format der Ausgabe.
Typ	string
Werte	`json` `text` `srt` `verbose_json` `vtt`

createTranscriptionRequest

Transkriptionsanforderung.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Datei	string	Das Audiodatei-Objekt, das transkribiert werden soll.	Ja
language	string	Die Sprache des eingegebenen Audios. Die Bereitstellung der Eingabesprache im ISO-639-1-Format verbessert die Genauigkeit und Latenz.	No
Eingabeaufforderung	string	Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen. Der Prompt sollte mit der Audiosprache übereinstimmen.	No
Antwortformat	audioResponseFormat	Definiert das Format der Ausgabe.	No
Temperatur	number	Die Probentemperatur liegt zwischen 0 und 1. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen. Wenn auf 0 gesetzt, verwendet das Modell die logaritarische Wahrscheinlichkeit, um die Temperatur automatisch zu erhöhen, bis bestimmte Schwellenwerte erreicht sind.	No	0
timestamp_granularities[]	array	Die Zeitstempel-Granularitäten, die für diese Transkription gefüllt werden sollen. `response_format` muss so eingestellt `verbose_json` werden, dass Zeitstempel-Granularitäten verwendet werden. Entweder oder beide dieser Optionen werden unterstützt: `word`, oder `segment`. Hinweis: Es gibt keine zusätzliche Latenz für Segmentzeitstempel, aber das Erstellen von Wortzeitstempeln verursacht zusätzliche Latenz.	No	['segment']

audioSegment

Transkriptions- oder Übersetzungssegment.

Name	Typ	Beschreibung	Erforderlich
avg_logprob	number	Durchschnittliche Log-Wahrscheinlichkeit.	No
Kompressionsverhältnis	number	Kompressionsrate.	No
end	number	Segmentend-Offset.	No
id	Ganzzahl	Segmentbezeichner.	No
no_speech_prob	number	Wahrscheinlichkeit für 'keine Rede'.	No
seek	number	Versatz des Segments.	No
start	number	Segmentstart-Offset.	No
Temperatur	number	Temperatur.	No
Text	string	Segmentierungstext.	No
tokens	array	Symbole des Textes.	No

audioWord

Transkription oder Übersetzungswort.

Name	Typ	Beschreibung	Erforderlich
end	number	Word end-Offset.	No
start	number	Word Start Offset.	No
word	string	Word	No

createSpeechRequest

Sprachanforderung.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
input	string	Der Text, um Audio zu synthetisieren. Die maximale Länge beträgt 4.096 Zeichen.	Ja
Antwortformat	enum	Das Format, um das Audio zu synthetisieren. Mögliche Werte: `mp3`, `opus`, , `aacflac`, `wav`,`pcm`	No
Geschwindigkeit	number	Die Geschwindigkeit des synthetisierten Audios. Wählen Sie einen Wert von bis `0.254.0`aus. `1.0` ist der Standard.	No	1.0
Stimme	enum	Die Stimme für Sprachsynthese. Mögliche Werte: `alloy`, `echo`, , `fableonyx`, `nova`,`shimmer`	Ja

imageQuality

Die Qualität des erzeugten Bildes.

Eigentum	Wert
Beschreibung	Die Qualität des erzeugten Bildes.
Typ	string
Vorgabe	auto
Werte	`auto` `high` `medium` `low` `hd` `standard`

imagesResponseFormat

Das Format, in dem die generierten Bilder zurückgegeben werden.

Eigentum	Wert
Beschreibung	Das Format, in dem die generierten Bilder zurückgegeben werden.
Typ	string
Vorgabe	url
Werte	`url` `b64_json`

imagesOutputFormat

Das Dateiformat, in dem die generierten Bilder zurückgegeben werden. Nur für Serienmodelle unterstützt.

Eigentum	Wert
Beschreibung	Das Dateiformat, in dem die generierten Bilder zurückgegeben werden. Wird nur für GPT-Image-1-Modelle unterstützt.
Typ	string
Vorgabe	png
Werte	`png` `jpeg`

imageSize

Die Größe der generierten Bilder.

Eigentum	Wert
Beschreibung	Die Größe der generierten Bilder.
Typ	string
Vorgabe	auto
Werte	`auto` `1792x1024` `1024x1792` `1024x1024` `1024x1536` `1536x1024`

imageStyle

Der Stil der generierten Bilder. Nur für DALL-e-3 unterstützt.

Eigentum	Wert
Beschreibung	Der Stil der generierten Bilder. Nur für DALL-e-3 unterstützt.
Typ	string
Vorgabe	vivid
Werte	`vivid` `natural`

imageBackground

Ermöglicht es, Transparenz für den Hintergrund der generierten Bilder einzustellen. Dieser Parameter wird nur für GPT-Image-1-Serienmodelle unterstützt.

Eigentum	Wert
Beschreibung	Ermöglicht es, Transparenz für den Hintergrund der generierten Bilder einzustellen. Dieser Parameter wird nur für GPT-Image-1-Serienmodelle unterstützt.
Typ	string
Vorgabe	auto
Werte	`transparent` `opaque` `auto`

Bildgenerierungsanfrage

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Hintergrund	imageBackground	Ermöglicht es, Transparenz für den Hintergrund der generierten Bilder einzustellen. Dieser Parameter wird nur für GPT-Image-1-Serienmodelle unterstützt.	No	auto
n	Ganzzahl	Die Anzahl der zu erzeugenden Bilder. Für dall-e-3 wird nur n=1 unterstützt.	No	1
Ausgabekomprimierung	Ganzzahl	Der Kompressionswert (0–100%) für die erzeugten Bilder. Dieser Parameter wird nur für GPT-Image-1-Serienmodelle mit dem JPEG-Ausgabeformat unterstützt.	No	100
Ausgabeformat	imagesOutputFormat	Das Dateiformat, in dem die generierten Bilder zurückgegeben werden. Wird nur für GPT-Image-1-Modelle unterstützt.	No	png
Eingabeaufforderung	string	Eine Textbeschreibung des gewünschten Bildes. Die maximale Länge beträgt 32.000 Zeichen für GPT-Image-1-Serienmodelle und 4000 Zeichen für DALL-e-3	Ja
Qualität	imageQuality	Die Qualität des erzeugten Bildes.	No	auto
Antwortformat	imagesResponseFormat	Das Format, in dem die generierten Bilder zurückgegeben werden. Nur für DALL-e-3 unterstützt.	No	url
size	imageSize	Die Größe der generierten Bilder.	No	auto
Stil	imageStyle	Der Stil der generierten Bilder. Nur für DALL-e-3 unterstützt.	No	vivid
user	string	Eine eindeutige Kennung, die Ihren Endnutzer repräsentiert und dabei helfen kann, Missbrauch zu überwachen und zu erkennen.	No

imageEditsRequest

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Bild	Saite oder Array	Die Bild(e) zum Bearbeiten. Muss eine unterstützte Bilddatei oder ein Array von Bildern sein. Jedes Bild sollte eine PNG- oder jpg-Datei mit weniger als 25 MB sein.	Ja
mask	string	Ein zusätzliches Bild, dessen vollständig transparente Flächen (z. B. bei null Alpha) anzeigen, wo das Bild bearbeitet werden soll. Wenn mehrere Bilder bereitgestellt werden, wird die Maske auf das erste Bild angewendet. Es muss eine gültige PNG-Datei sein, weniger als 4 MB, und die gleichen Abmessungen wie das Bild haben.	No
n	Ganzzahl	Die Anzahl der zu erzeugenden Bilder.	No	1
Eingabeaufforderung	string	Eine Textbeschreibung des gewünschten Bildes. Die maximale Länge beträgt 32.000 Zeichen.	Ja
Qualität	imageQuality	Die Qualität des erzeugten Bildes.	No	auto
Antwortformat	imagesResponseFormat	Das Format, in dem die generierten Bilder zurückgegeben werden.	No	url
size	imageSize	Die Größe der generierten Bilder.	No	auto
user	string	Eine eindeutige Kennung, die Ihren Endnutzer repräsentiert und dabei helfen kann, Missbrauch zu überwachen und zu erkennen.	No

generateImagesResponse

Name	Typ	Beschreibung	Erforderlich
erstellt	Ganzzahl	Der Unix-Zeitstempel, als die Operation erstellt wurde.	Ja
data	array	Die Ergebnisdaten der Operation, falls erfolgreich	Ja
Nutzung	imageGenerationsUsage	Repräsentiert Details zur Tokennutzung für Bildgenerierungsanfragen. Nur für Modelle der GPT-Image-1-Serie.	No

imageResult

Die Bild-URL oder das codierte Bild, falls erfolgreich, und ansonsten ein Fehler.

Name	Typ	Beschreibung	Erforderlich
b64_json	string	Das base64-kodierte Bild	No
Content-Filtern-Egebnisse	dalleContentFilterResults	Informationen zu den Inhaltsfilterergebnissen.	No
prompt_filter_results	dalleFilterResults	Informationen über die Kategorie der Inhaltsfilterung (Hass, sexuell, Gewalt, self_harm), ob sie erkannt wurde, sowie das Schweregrad (very_low, niedrig, mittel, hoch im Maßstab, das die Intensität und das Risikoniveau schädlicher Inhalte bestimmt) und ob sie gefiltert wurden oder nicht. Informationen zu Jailbreak-Inhalten und Schimpfwörtern, ob sie erkannt wurden und ob sie gefiltert wurden oder nicht. Und Informationen zur Kundensperrliste, falls sie gefiltert wurde und deren ID es ist.	No
überarbeitete_Aufforderung	string	Der Prompt, mit dem das Bild generiert wurde, falls es eine Überarbeitung des Prompts gab.	No
url	string	Die Bild-URL.	No

imageGenerationsUsage

Repräsentiert Details zur Tokennutzung für Bildgenerierungsanfragen. Nur für Modelle der GPT-Image-1-Serie.

Name	Typ	Beschreibung	Erforderlich
input_tokens	Ganzzahl	Die Anzahl der Eingabetoken.	No
input_tokens_details	Objekt	Eine detaillierte Aufschlüsselung der Eingabetoken.	No
└– image_tokens	Ganzzahl	Die Anzahl der Bildtokens.	No
└- text_tokens	Ganzzahl	Die Anzahl der Texttokens.	No
output_tokens	Ganzzahl	Die Anzahl der Ausgabetoken.	No
Gesamtanzahl Tokens	Ganzzahl	Die Gesamtzahl der verwendeten Token.	No

Linie

Ein Inhaltszeilenobjekt, das aus einer benachbarten Folge von Inhaltselementen besteht, wie Wörter und Auswahlmarkierungen.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
spans	array	Ein Array von Spans, die erkannte Objekte und deren Begrenzungsbox-Informationen repräsentieren.	Ja
Text	string		Ja

span

Ein Spannobjekt, das ein erkanntes Objekt und seine Begrenzungsbox-Informationen darstellt.

Name	Typ	Beschreibung	Erforderlich
length	Ganzzahl	Die Länge des Spannes in Zeichen, gemessen in Unicode-Codepunkten.	Ja
offset	Ganzzahl	Der Zeichenversatz innerhalb des Textes, wo der Abschnitt beginnt. Dieser Offset ist definiert als die Position des ersten Zeichens des Spans, der vom Anfang des Textes als Unicode-Codepunkte zählt.	Ja
Polygon	array	Ein Array von Objekten, die Punkte im Polygon repräsentieren, das das erkannte Objekt umschließt.	Ja
Text	string	Der Textinhalt des Spanns, der das erkannte Objekt darstellt.	Ja

runCompletionUsage

Nutzungsstatistiken im Zusammenhang mit dem Lauf. Dieser Wert gilt, null wenn der Run sich nicht im terminalen Zustand befindet (d. h. in_progress, queued, usw.).

Name	Typ	Beschreibung	Erforderlich
completion_tokens	Ganzzahl	Anzahl der im Verlauf des Durchlaufs verwendeten Komplettmarker.	Ja
prompt_tokens	Ganzzahl	Anzahl der im Verlauf des Durchlaufs verwendeten Prompt-Tokens.	Ja
Gesamtanzahl Tokens	Ganzzahl	Gesamtzahl der verwendeten Tokens (Prompt + Abschluss).	Ja

runStepCompletionUsage

Nutzungsstatistiken im Zusammenhang mit dem Laufschritt. Dieser Wert gilt, null während der Status in_progressdes Laufschritts ist.

Name	Typ	Beschreibung	Erforderlich
completion_tokens	Ganzzahl	Anzahl der im Verlauf des Laufschritts verwendeten Vervollständigungstokens.	Ja
prompt_tokens	Ganzzahl	Anzahl der im Verlauf des Laufschritts verwendeten Prompt-Tokens.	Ja
Gesamtanzahl Tokens	Ganzzahl	Gesamtzahl der verwendeten Tokens (Prompt + Abschluss).	Ja

assistantsApiResponseFormatOption

Spezifiziert das Format, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit gpt-3.5-turbo-1106.

Einstellung aktiviert { "type": "json_schema", "json_schema": {...} } strukturierte Ausgaben, die sicherstellen, dass das Modell mit deinem bereitgestellten JSON-Schema übereinstimmt. Erfahren Sie mehr im Leitfaden für strukturierte Ausgaben.

Einstellung aktiviert den { "type": "json_object" } JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültig ist.

Wichtig: Beim Einsatz des JSON-Modus müssen Sie das Modell auch anweisen, selbst JSON über eine System- oder Benutzernachricht zu erzeugen. Ohne dies kann das Modell einen endlosen Strom von Leerraum erzeugen, bis die Erzeugung das Token-Limit erreicht, was zu einer langanhaltenden und scheinbar "festgefahrenen" Anfrage führt. Beachten Sie auch, dass der Nachrichteninhalt teilweise abgeschnitten werden kann, wenn finish_reason="length", was darauf hinweist, dass die Generation überschritten max_tokens wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.

Diese Komponente kann eine der folgenden sein:

ResponseFormatText
ResponseFormatJsonObject
ResponseFormatJsonSchema

assistantsApiResponseFormat

Ein Objekt, das die erwartete Ausgabe des Modells beschreibt. Wenn json_object nur function der Typ tools an den Run weitergegeben werden darf. Ob text das Modell Text oder einen beliebigen benötigten Wert zurückgeben kann.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
type	string	Muss eines von oder `textjson_object`sein.	No	Text

type Enum: AssistantsApiResponseFormat

Wert	Beschreibung
Text
json_object

assistantObject

Stellt ein assistant dar, das das Modell aufrufen und Werkzeuge verwenden kann.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
erstellt_am	Ganzzahl	Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem der Assistent erstellt wurde.	Ja
Beschreibung	string	Die Beschreibung des Assistenten. Die maximale Länge beträgt 512 Zeichen.	Ja
id	string	Der Identifikator, der in API-Endpunkten referenziert werden kann.	Ja
Anweisungen	string	Die Systemanweisungen, die der Assistent verwendet. Die maximale Länge beträgt 256.000 Zeichen.	Ja
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	Ja
Modell	string	ID des zu verwendenden Modells.	Ja
Name	string	Der Name des Assistenten. Die maximale Länge beträgt 256 Zeichen.	Ja
Objekt	string	Der Objekttyp, der immer `assistant`ist.	Ja
Antwortformat	assistantsApiResponseFormatOption	Spezifiziert das Format, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit `gpt-3.5-turbo-1106`. Einstellung aktiviert `{ "type": "json_schema", "json_schema": {...} }` strukturierte Ausgaben, die sicherstellen, dass das Modell mit deinem bereitgestellten JSON-Schema übereinstimmt. Erfahren Sie mehr im Leitfaden für strukturierte Ausgaben. Einstellung aktiviert den `{ "type": "json_object" }` JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültig ist. Wichtig: Beim Einsatz des JSON-Modus müssen Sie das Modell auch anweisen, selbst JSON über eine System- oder Benutzernachricht zu erzeugen. Ohne dies kann das Modell einen endlosen Strom von Leerraum erzeugen, bis die Erzeugung das Token-Limit erreicht, was zu einer langanhaltenden und scheinbar "festgefahrenen" Anfrage führt. Beachten Sie auch, dass der Nachrichteninhalt teilweise abgeschnitten werden kann, wenn `finish_reason="length"`, was darauf hinweist, dass die Generation überschritten `max_tokens` wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.	No
Temperatur	number	Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen.	No	1
tool_resources	Objekt	Eine Sammlung von Ressourcen, die von den Werkzeugen des Assistenten genutzt werden. Die Ressourcen sind spezifisch für die Art des Werkzeugs. Zum Beispiel benötigt das `code_interpreter` Tool eine Liste von Datei-IDs, während das `file_search` Tool eine Liste von Vektorspeicher-IDs benötigt.	No
└– code_interpreter	Objekt		No
└– file_ids	array	Eine Liste der Datei-IDs, die dem `code_interpreter` Tool zur Verfügung gestellt wurden. Es können maximal 20 Dateien mit dem Tool verknüpft sein.	No	[]
└– Dateisuche	Objekt		No
└– vector_store_ids	array	Die ID des Vektorspeichers, der mit diesem Assistenten verbunden ist. Maximal 1 Vektorspeicher kann an den Assistenten angeschlossen sein.	No
tools	array	Eine Liste der auf dem Assistenten aktivierten Tools. Es können maximal 128 Werkzeuge pro Assistent sein. Werkzeuge können von den Typen `code_interpreter`, `file_search`, oder `function`sein.	Ja	[]
top_p	number	Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden. Wir empfehlen im Allgemeinen, diese oder die Temperatur zu verändern, aber nicht beides.	No	1

objekt Enum: AssistantObjectType

Wert	Beschreibung
Assistent	Der Objekttyp, der immer Assistant ist

createAssistantRequest

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Beschreibung	string	Die Beschreibung des Assistenten. Die maximale Länge beträgt 512 Zeichen.	No
Anweisungen	string	Die Systemanweisungen, die der Assistent verwendet. Die maximale Länge beträgt 256.000 Zeichen.	No
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	No
Modell	string		Ja
Name	string	Der Name des Assistenten. Die maximale Länge beträgt 256 Zeichen.	No
Antwortformat	assistantsApiResponseFormatOption	Spezifiziert das Format, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit `gpt-3.5-turbo-1106`. Einstellung aktiviert `{ "type": "json_schema", "json_schema": {...} }` strukturierte Ausgaben, die sicherstellen, dass das Modell mit deinem bereitgestellten JSON-Schema übereinstimmt. Erfahren Sie mehr im Leitfaden für strukturierte Ausgaben. Einstellung aktiviert den `{ "type": "json_object" }` JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültig ist. Wichtig: Beim Einsatz des JSON-Modus müssen Sie das Modell auch anweisen, selbst JSON über eine System- oder Benutzernachricht zu erzeugen. Ohne dies kann das Modell einen endlosen Strom von Leerraum erzeugen, bis die Erzeugung das Token-Limit erreicht, was zu einer langanhaltenden und scheinbar "festgefahrenen" Anfrage führt. Beachten Sie auch, dass der Nachrichteninhalt teilweise abgeschnitten werden kann, wenn `finish_reason="length"`, was darauf hinweist, dass die Generation überschritten `max_tokens` wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.	No
Temperatur	number	Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen.	No	1
tool_resources	Objekt	Eine Sammlung von Ressourcen, die von den Werkzeugen des Assistenten genutzt werden. Die Ressourcen sind spezifisch für die Art des Werkzeugs. Zum Beispiel benötigt das `code_interpreter` Tool eine Liste von Datei-IDs, während das `file_search` Tool eine Liste von Vektorspeicher-IDs benötigt.	No
└– code_interpreter	Objekt		No
└– file_ids	array	Eine Liste der Datei-IDs, die dem `code_interpreter` Tool zur Verfügung gestellt wurden. Es können maximal 20 Dateien mit dem Tool verknüpft sein.	No	[]
└– Dateisuche	Objekt		No
└– vector_store_ids	array	Der Vektorspeicher ist mit diesem Assistenten verbunden. Maximal 1 Vektorspeicher kann an den Assistenten angeschlossen sein.	No
└– Vektorspeicher	array	Ein Helfer, um mit file_ids einen Vektorspeicher zu erstellen und ihn an diesen Assistenten anzuhängen. Maximal 1 Vektorspeicher kann an den Assistenten angeschlossen sein.	No
tools	array	Eine Liste der auf dem Assistenten aktivierten Tools. Es können maximal 128 Werkzeuge pro Assistent sein. Werkzeuge können von den Typen `code_interpreter`, `retrieval`, oder `function`sein.	No	[]
top_p	number	Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden. Wir empfehlen im Allgemeinen, diese oder die Temperatur zu verändern, aber nicht beides.	No	1

modifyAssistantRequest

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Beschreibung	string	Die Beschreibung des Assistenten. Die maximale Länge beträgt 512 Zeichen.	No
Anweisungen	string	Die Systemanweisungen, die der Assistent verwendet. Die maximale Länge beträgt 32.768 Zeichen.	No
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	No
Modell	string		No
Name	string	Der Name des Assistenten. Die maximale Länge beträgt 256 Zeichen.	No
Antwortformat	assistantsApiResponseFormatOption	Spezifiziert das Format, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit `gpt-3.5-turbo-1106`. Einstellung aktiviert `{ "type": "json_schema", "json_schema": {...} }` strukturierte Ausgaben, die sicherstellen, dass das Modell mit deinem bereitgestellten JSON-Schema übereinstimmt. Erfahren Sie mehr im Leitfaden für strukturierte Ausgaben. Einstellung aktiviert den `{ "type": "json_object" }` JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültig ist. Wichtig: Beim Einsatz des JSON-Modus müssen Sie das Modell auch anweisen, selbst JSON über eine System- oder Benutzernachricht zu erzeugen. Ohne dies kann das Modell einen endlosen Strom von Leerraum erzeugen, bis die Erzeugung das Token-Limit erreicht, was zu einer langanhaltenden und scheinbar "festgefahrenen" Anfrage führt. Beachten Sie auch, dass der Nachrichteninhalt teilweise abgeschnitten werden kann, wenn `finish_reason="length"`, was darauf hinweist, dass die Generation überschritten `max_tokens` wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.	No
Temperatur	number	Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen.	No	1
tool_resources	Objekt	Eine Sammlung von Ressourcen, die von den Werkzeugen des Assistenten genutzt werden. Die Ressourcen sind spezifisch für die Art des Werkzeugs. Zum Beispiel benötigt das `code_interpreter` Tool eine Liste von Datei-IDs, während das `file_search` Tool eine Liste von Vektorspeicher-IDs benötigt.	No
└– code_interpreter	Objekt		No
└– file_ids	array	Überschreibt die Liste der Datei-IDs, die dem `code_interpreter` Tool zur Verfügung stehen. Es können maximal 20 Dateien mit dem Tool verknüpft sein.	No	[]
└– Dateisuche	Objekt		No
└– vector_store_ids	array	Überschreibt den Vektorspeicher, der diesem Assistenten zugeordnet ist. Maximal 1 Vektorspeicher kann an den Assistenten angeschlossen sein.	No
tools	array	Eine Liste der auf dem Assistenten aktivierten Tools. Es können maximal 128 Werkzeuge pro Assistent sein. Werkzeuge können von den Typen `code_interpreter`, `retrieval`, oder `function`sein.	No	[]
top_p	number	Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden. Wir empfehlen im Allgemeinen, diese oder die Temperatur zu verändern, aber nicht beides.	No	1

deleteAssistantResponse

Name	Typ	Erforderlich
gelöscht	Boolescher Wert	Ja
id	string	Ja
Objekt	string	Ja

Objekt-Enum: DeleteAssistantResponseState

Wert	Beschreibung
assistant.deleted

listAssistantsResponse

Name	Typ	Erforderlich
data	array	Ja
first_id	string	Ja
has_more	Boolescher Wert	Ja
last_id	string	Ja
Objekt	string	Ja

assistantToolsCode

Name	Typ	Beschreibung	Erforderlich	Vorgabe
type	string	Der definierte Werkzeugtyp: `code_interpreter`	Ja

type Enum: assistantToolsCodeType

Wert	Beschreibung
code_interpreter

assistantToolsFileSearch

Name	Typ	Beschreibung	Erforderlich
file_search	Objekt	Überschreibungen für das Dateisuchwerkzeug.	No
└– max_num_results	Ganzzahl	Die maximale Anzahl an Ergebnissen, die das Dateisuchtool liefern sollte. Standardmäßig sind 20 für GPT-4*-Modelle und 5 für GPT-3.5-Turbo. Diese Zahl sollte zwischen 1 und 50 liegen. Beachten Sie, dass das Dateisuchwerkzeug möglicherweise weniger als `max_num_results` Ergebnisse liefert.	No
type	string	Der definierte Werkzeugtyp: `file_search`	Ja

type Enum: assistantToolsFileSearchType

Wert	Beschreibung
file_search

assistantToolsFileSearchTypeOnly

Name	Typ	Beschreibung	Erforderlich	Vorgabe
type	string	Der definierte Werkzeugtyp: `file_search`	Ja

type Enum: assistantToolsFileSearchType

Wert	Beschreibung
file_search

assistantToolsFunction

Name	Typ	Beschreibung	Erforderlich
Funktion	Objekt	Die Funktionsdefinition.	Ja
└– Beschreibung	string	Eine Beschreibung dessen, was die Funktion tut, verwendet vom Modell, um zu entscheiden, wann und wie die Funktion aufgerufen wird.	No
└– Name	string	Der Name der aufzurufenden Funktion. Muss a-z, A-Z, 0-9 sein oder Unterstriche und Striche enthalten, mit einer maximalen Länge von 64.	No
└- Parameter	chatCompletionFunctionParameters	Die Parameter, die die Funktion akzeptiert, werden als JSON-Schema-Objekt beschrieben. Siehe die Anleitung/ Beispiele und die JSON-Schema-Referenz für die Dokumentation zum Format.	No
type	string	Der definierte Werkzeugtyp: `function`	Ja

type Enum: assistantToolsFunction

Wert	Beschreibung
Funktion

truncationObject

Steuerungen, wie ein Thread vor dem Durchlauf abgeschnitten wird. Nutze dies, um das anfängliche Kontextfenster des Laufs zu steuern.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
last_messages	Ganzzahl	Die Anzahl der aktuellsten Nachrichten aus dem Thread beim Erstellen des Kontexts für den Lauf.	No
type	string	Die Trunkierungsstrategie, die für den Faden verwendet werden sollte. Der Standardwert ist `auto`. Wenn auf `last_messages`gesetzt ist, wird der Thread auf die n aktuellsten Nachrichten im Thread abgeschnitten. Wenn auf `auto`gesetzt wird, werden Nachrichten in der Mitte des Threads verworfen, um die Kontextlänge des Modells anzupassen. `max_prompt_tokens`	Ja

Typ Enum: TrunkationsTyp

Wert	Beschreibung
auto
last_messages

assistantsApiToolChoiceOption

Kontrolliert, welches (falls vorhandenes) Werkzeug vom Modell aufgerufen wird. none das bedeutet, dass das Modell keine Werkzeuge aufruft, sondern stattdessen eine Nachricht generiert. auto ist der Standardwert und bedeutet, dass das Modell zwischen der Generierung einer Nachricht oder dem Aufrufen eines Werkzeugs wählen kann. Ein bestimmtes Werkzeug zu spezifizieren oder {"type": "file_search"}{"type": "function", "function": {"name": "my_function"}} das Modell zu zwingen, dieses Tool aufzurufen.

Diese Komponente kann eine der folgenden sein:

assistantsNamedToolChoice

assistantsNamedToolChoice

Spezifiziert ein Werkzeug, das das Modell verwenden soll. Nutze es, um das Modell zu zwingen, ein bestimmtes Werkzeug aufzurufen.

Name	Typ	Beschreibung	Erforderlich
Funktion	Objekt		No
└– Name	string	Der Name der Funktion, die aufgerufen werden soll.	No
type	string	Die Art des Werkzeugs. Wenn der Typ ist `function`, muss der Funktionsname gesetzt werden	Ja

type Enum: AssistantsNamedToolChoiceType

Wert	Beschreibung
Funktion
code_interpreter
file_search

runObject

Repräsentiert eine Ausführung, die auf einem Thread ausgeführt wird.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
assistant_id	string	Die ID des Assistenten, der für die Durchführung dieses Laufs verwendet wurde.	Ja
cancelled_at	Ganzzahl	Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem der Lauf abgebrochen wurde.	Ja
abgeschlossen_am	Ganzzahl	Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem der Durchlauf abgeschlossen wurde.	Ja
erstellt_am	Ganzzahl	Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem der Lauf erstellt wurde.	Ja
läuft_ab_am	Ganzzahl	Der Unix-Zeitstempel (in Sekunden) dafür, wann der Durchlauf abläuft.	Ja
failed_at	Ganzzahl	Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem der Durchlauf fehlgeschlagen ist.	Ja
id	string	Der Identifikator, der in API-Endpunkten referenziert werden kann.	Ja
incomplete_details	Objekt	Details dazu, warum der Durchlauf unvollständig ist. Wird es sein `null` , solange der Durchlauf nicht unvollständig ist.	Ja
└– Grund	string	Der Grund, warum der Durchlauf unvollständig ist. Dies zeigt an, welches spezifische Token-Limit im Verlauf des Durchlaufs erreicht wurde.	No
Anweisungen	string	Die Anweisungen, die der Assistent für diesen Durchlauf benutzt hat.	Ja
last_error	Objekt	Der letzte Fehler, der mit diesem Durchlauf verbunden ist. Wird es sein `null` , wenn keine Fehler vorliegen.	Ja
└– Code	string	Einer von `server_error` oder `rate_limit_exceeded`.	No
└– Nachricht	string	Eine für Menschen lesbare Beschreibung des Fehlers.	No
max_completion_tokens	Ganzzahl	Die maximale Anzahl der Completion Tokens, die im Verlauf des Durchlaufs verwendet werden sollen.	Ja
max_prompt_tokens	Ganzzahl	Die maximale Anzahl der Prompt-Token, die im Verlauf des Durchlaufs verwendet werden sollen.	Ja
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	Ja
Modell	string	Das Modell, das der Assistent für diesen Lauf verwendet hat.	Ja
Objekt	string	Der Objekttyp, der immer `thread.run`ist.	Ja
Parallele Werkzeugaufrufe	ParallelToolCalls	Ob man während der Werkzeugnutzung parallele Funktionsaufrufe aktivieren soll.	No	Richtig
required_action	Objekt	Details zur Aktion, die erforderlich ist, um den Lauf fortzusetzen. Wird es sein `null` , wenn keine Maßnahmen erforderlich sind.	Ja
└– submit_tool_outputs	Objekt	Details zu den Werkzeugausgaben, die für diesen Durchlauf benötigt werden.	No
└- tool_calls	array	Eine Liste der relevanten Werkzeugaufrufe.	No
└– Typ	enum	Für den Moment ist das immer `submit_tool_outputs`so. Mögliche Werte: `submit_tool_outputs`	No
Antwortformat	assistantsApiResponseFormatOption	Spezifiziert das Format, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit `gpt-3.5-turbo-1106`. Einstellung aktiviert `{ "type": "json_schema", "json_schema": {...} }` strukturierte Ausgaben, die sicherstellen, dass das Modell mit deinem bereitgestellten JSON-Schema übereinstimmt. Erfahren Sie mehr im Leitfaden für strukturierte Ausgaben. Einstellung aktiviert den `{ "type": "json_object" }` JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültig ist. Wichtig: Beim Einsatz des JSON-Modus müssen Sie das Modell auch anweisen, selbst JSON über eine System- oder Benutzernachricht zu erzeugen. Ohne dies kann das Modell einen endlosen Strom von Leerraum erzeugen, bis die Erzeugung das Token-Limit erreicht, was zu einer langanhaltenden und scheinbar "festgefahrenen" Anfrage führt. Beachten Sie auch, dass der Nachrichteninhalt teilweise abgeschnitten werden kann, wenn `finish_reason="length"`, was darauf hinweist, dass die Generation überschritten `max_tokens` wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.	Ja
started_at	Ganzzahl	Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem der Durchlauf gestartet wurde.	Ja
Status	string	Der Status des Laufs, der entweder , , , , `queuedin_progressrequires_action`, `cancelling`oder `cancelled`sein kann. `failedcompletedexpired`	Ja
Temperatur	number	Die für diesen Durchgang verwendete Probetemperatur. Wenn nicht gesetzt, steht standardmäßig auf 1.	No
thread_id	string	Die ID der Threads, auf denen im Rahmen dieses Durchlaufs ausgeführt wurde.	Ja
tool_choice	assistantsApiToolChoiceOption	Kontrolliert, welches (falls vorhandenes) Werkzeug vom Modell aufgerufen wird. `none` das bedeutet, dass das Modell keine Werkzeuge aufruft, sondern stattdessen eine Nachricht generiert. `auto` ist der Standardwert und bedeutet, dass das Modell zwischen der Generierung einer Nachricht oder dem Aufrufen eines Werkzeugs wählen kann. Ein bestimmtes Werkzeug zu spezifizieren oder `{"type": "file_search"}{"type": "function", "function": {"name": "my_function"}}` das Modell zu zwingen, dieses Tool aufzurufen.	Ja
tools	array	Die Liste der Werkzeuge, die der Assistent für diesen Durchlauf verwendet hat.	Ja	[]
top_p	number	Der für diesen Lauf verwendete Kernprobenwert. Wenn nicht gesetzt, steht standardmäßig auf 1.	No
truncation_strategy	truncationObject	Steuerungen, wie ein Thread vor dem Durchlauf abgeschnitten wird. Nutze dies, um das anfängliche Kontextfenster des Laufs zu steuern.	Ja
Nutzung	runCompletionUsage	Nutzungsstatistiken im Zusammenhang mit dem Lauf. Dieser Wert gilt, `null` wenn der Run sich nicht im terminalen Zustand befindet (d. h. `in_progress`, `queued`, usw.).	Ja

object Enum: runObjectType

Wert	Beschreibung
thread.run	Der Run-Objekttyp, der immer thread.run ist, ist immer thread.run

Status Enum: RunObjectStatus

Wert	Beschreibung
queued	Der Warteschlangezustand
in_progress	Der in_progress Staat
requires_action	Der required_action Staat
cancelling	Der aufhebende Zustand
cancelled	Der aufgehobene Staat
misslungen	Der gescheiterte Staat
Abgeschlossen	Der vollendete Zustand
Abgelaufen	Der abgelaufene Zustand

createRunRequest

Name	Typ	Beschreibung	Erforderlich	Vorgabe
additional_instructions	string	Fügen Sie am Ende der Anweisungen für den Durchlauf zusätzliche Anweisungen hinzu. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern, ohne andere Anweisungen zu überschreiben.	No
additional_messages	array	Fügt dem Thread vor dem Erstellen des Runs zusätzliche Nachrichten hinzu.	No
assistant_id	string	Die ID des Assistenten, um diesen Durchgang auszuführen.	Ja
Anweisungen	string	Überschreiben Sie die Standard-Systemnachricht des Assistenten. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern.	No
max_completion_tokens	Ganzzahl	Die maximale Anzahl der Vervollständigungstoken, die im Verlauf des Durchlaufs verwendet werden dürfen. Der Lauf bemüht sich, nur die angegebene Anzahl der Abschlussmarker über mehrere Runden zu verwenden. Übersteigt der Run die angegebene Anzahl der Completion Tokens, endet der Run mit dem Status `incomplete`. Siehe `incomplete_details` für weitere Informationen.	No
max_prompt_tokens	Ganzzahl	Die maximale Anzahl der Prompt-Token, die im Verlauf des Laufs verwendet werden können. Der Lauf bemüht sich, nur die angegebene Anzahl der Prompt-Token über mehrere Runden zu verwenden. Übersteigt der Lauf die angegebene Anzahl der Prompt-Tokens, endet der Lauf mit dem Status `incomplete`. Siehe `incomplete_details` für weitere Informationen.	No
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	No
Modell	string	Die ID des Modells, das für diesen Durchlauf verwendet werden soll. Wenn hier ein Wert angegeben wird, überschreibt er das mit dem Assistenten verbundene Modell. Falls nicht, wird das mit dem Assistenten verbundene Modell verwendet.	No
Parallele Werkzeugaufrufe	ParallelToolCalls	Ob man während der Werkzeugnutzung parallele Funktionsaufrufe aktivieren soll.	No	Richtig
Antwortformat	assistantsApiResponseFormatOption	Spezifiziert das Format, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit `gpt-3.5-turbo-1106`. Einstellung aktiviert `{ "type": "json_schema", "json_schema": {...} }` strukturierte Ausgaben, die sicherstellen, dass das Modell mit deinem bereitgestellten JSON-Schema übereinstimmt. Erfahren Sie mehr im Leitfaden für strukturierte Ausgaben. Einstellung aktiviert den `{ "type": "json_object" }` JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültig ist. Wichtig: Beim Einsatz des JSON-Modus müssen Sie das Modell auch anweisen, selbst JSON über eine System- oder Benutzernachricht zu erzeugen. Ohne dies kann das Modell einen endlosen Strom von Leerraum erzeugen, bis die Erzeugung das Token-Limit erreicht, was zu einer langanhaltenden und scheinbar "festgefahrenen" Anfrage führt. Beachten Sie auch, dass der Nachrichteninhalt teilweise abgeschnitten werden kann, wenn `finish_reason="length"`, was darauf hinweist, dass die Generation überschritten `max_tokens` wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.	No
stream	Boolescher Wert	Wenn `true`, gibt einen Strom von Ereignissen zurück, die während des Runs als servergesendete Ereignisse auftreten, und endet, wenn der Run mit einer `data: [DONE]` Nachricht in einen Terminalzustand eintritt.	No
Temperatur	number	Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen.	No	1
tool_choice	assistantsApiToolChoiceOption	Kontrolliert, welches (falls vorhandenes) Werkzeug vom Modell aufgerufen wird. `none` das bedeutet, dass das Modell keine Werkzeuge aufruft, sondern stattdessen eine Nachricht generiert. `auto` ist der Standardwert und bedeutet, dass das Modell zwischen der Generierung einer Nachricht oder dem Aufrufen eines Werkzeugs wählen kann. Ein bestimmtes Werkzeug zu spezifizieren oder `{"type": "file_search"}{"type": "function", "function": {"name": "my_function"}}` das Modell zu zwingen, dieses Tool aufzurufen.	No
tools	array	Überschreiben Sie die Werkzeuge, die der Assistent für diesen Durchlauf verwenden kann. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern.	No
top_p	number	Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden. Wir empfehlen im Allgemeinen, diese oder die Temperatur zu verändern, aber nicht beides.	No	1
truncation_strategy	truncationObject	Steuerungen, wie ein Thread vor dem Durchlauf abgeschnitten wird. Nutze dies, um das anfängliche Kontextfenster des Laufs zu steuern.	No

listRunsResponse

Name	Typ	Erforderlich
data	array	Ja
first_id	string	Ja
has_more	Boolescher Wert	Ja
last_id	string	Ja
Objekt	string	Ja

modifyRunRequest

Name	Typ	Beschreibung	Erforderlich	Vorgabe
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	No

submitToolOutputsRunRequest

Name	Typ	Beschreibung	Erforderlich	Vorgabe
stream	Boolescher Wert	Wenn `true`, gibt einen Strom von Ereignissen zurück, die während des Runs als servergesendete Ereignisse auftreten, und endet, wenn der Run mit einer `data: [DONE]` Nachricht in einen Terminalzustand eintritt.	No
tool_outputs	array	Eine Liste der Werkzeuge, für die die Ausgaben eingereicht werden.	Ja

runToolCallObject

Werkzeugaufrufobjekte

Name	Typ	Beschreibung	Erforderlich
Funktion	Objekt	Die Funktionsdefinition.	Ja
└- Argumente	string	Die Argumente, von denen das Modell erwartet, dass du sie an die Funktion weitergibst.	No
└– Name	string	Der Name der Veranstaltung.	No
id	string	Die ID des Werkzeugrufs. Diese ID muss referenziert werden, wenn du die Werkzeugausgaben einreichst, indem du die Eingabe-Tool-Ausgaben nutzt, um Endpoint auszuführen.	Ja
type	string	Die Art des Werkzeugaufrufs, für den die Ausgabe erforderlich ist. Für den Moment ist das immer `function`so.	Ja

type Enum: RunToolCallObjectType

Wert	Beschreibung
Funktion

createThreadAndRunRequest

Name	Typ	Beschreibung	Erforderlich	Vorgabe
assistant_id	string	Die ID des Assistenten, um diesen Durchgang auszuführen.	Ja
Anweisungen	string	Überschreiben Sie die Standard-Systemnachricht des Assistenten. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern.	No
max_completion_tokens	Ganzzahl	Die maximale Anzahl der Vervollständigungstoken, die im Verlauf des Durchlaufs verwendet werden dürfen. Der Lauf bemüht sich, nur die angegebene Anzahl der Abschlussmarker über mehrere Runden zu verwenden. Übersteigt der Run die angegebene Anzahl der Completion Tokens, endet der Run mit dem Status `incomplete`. Siehe `incomplete_details` für weitere Informationen.	No
max_prompt_tokens	Ganzzahl	Die maximale Anzahl der Prompt-Token, die im Verlauf des Laufs verwendet werden können. Der Lauf bemüht sich, nur die angegebene Anzahl der Prompt-Token über mehrere Runden zu verwenden. Übersteigt der Lauf die angegebene Anzahl der Prompt-Tokens, endet der Lauf mit dem Status `incomplete`. Siehe `incomplete_details` für weitere Informationen.	No
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	No
Modell	string	Die ID der Modelle, die für diesen Durchlauf verwendet werden sollen. Wenn hier ein Wert angegeben wird, überschreibt er das mit dem Assistenten verbundene Modell. Falls nicht, wird das mit dem Assistenten verbundene Modell verwendet.	No
Parallele Werkzeugaufrufe	ParallelToolCalls	Ob man während der Werkzeugnutzung parallele Funktionsaufrufe aktivieren soll.	No	Richtig
Antwortformat	assistantsApiResponseFormatOption	Spezifiziert das Format, das das Modell ausgeben muss. Kompatibel mit GPT-4o, GPT-4 Turbo und allen GPT-3.5 Turbo-Modellen seit `gpt-3.5-turbo-1106`. Einstellung aktiviert `{ "type": "json_schema", "json_schema": {...} }` strukturierte Ausgaben, die sicherstellen, dass das Modell mit deinem bereitgestellten JSON-Schema übereinstimmt. Erfahren Sie mehr im Leitfaden für strukturierte Ausgaben. Einstellung aktiviert den `{ "type": "json_object" }` JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültig ist. Wichtig: Beim Einsatz des JSON-Modus müssen Sie das Modell auch anweisen, selbst JSON über eine System- oder Benutzernachricht zu erzeugen. Ohne dies kann das Modell einen endlosen Strom von Leerraum erzeugen, bis die Erzeugung das Token-Limit erreicht, was zu einer langanhaltenden und scheinbar "festgefahrenen" Anfrage führt. Beachten Sie auch, dass der Nachrichteninhalt teilweise abgeschnitten werden kann, wenn `finish_reason="length"`, was darauf hinweist, dass die Generation überschritten `max_tokens` wurde oder die Unterhaltung die maximale Kontextlänge überschritten hat.	No
stream	Boolescher Wert	Wenn `true`, gibt einen Strom von Ereignissen zurück, die während des Runs als servergesendete Ereignisse auftreten, und endet, wenn der Run mit einer `data: [DONE]` Nachricht in einen Terminalzustand eintritt.	No
stream_options	chatCompletionStreamOptions	Optionen für Streaming-Antworten. Setzen Sie dies nur, wenn Sie `stream: true`setzen.	No	Nichts
Temperatur	number	Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen.	No	1
thread	createThreadRequest		No
tool_choice	assistantsApiToolChoiceOption	Kontrolliert, welches (falls vorhandenes) Werkzeug vom Modell aufgerufen wird. `none` das bedeutet, dass das Modell keine Werkzeuge aufruft, sondern stattdessen eine Nachricht generiert. `auto` ist der Standardwert und bedeutet, dass das Modell zwischen der Generierung einer Nachricht oder dem Aufrufen eines Werkzeugs wählen kann. Ein bestimmtes Werkzeug zu spezifizieren oder `{"type": "file_search"}{"type": "function", "function": {"name": "my_function"}}` das Modell zu zwingen, dieses Tool aufzurufen.	No
tool_resources	Objekt	Eine Sammlung von Ressourcen, die von den Werkzeugen des Assistenten genutzt werden. Die Ressourcen sind spezifisch für die Art des Werkzeugs. Zum Beispiel benötigt das `code_interpreter` Tool eine Liste von Datei-IDs, während das `file_search` Tool eine Liste von Vektorspeicher-IDs benötigt.	No
└– code_interpreter	Objekt		No
└– file_ids	array	Eine Liste der Datei-IDs, die dem `code_interpreter` Tool zur Verfügung gestellt wurden. Es können maximal 20 Dateien mit dem Tool verknüpft sein.	No	[]
└– Dateisuche	Objekt		No
└– vector_store_ids	array	Die ID des Vektorspeichers, der mit diesem Assistenten verbunden ist. Maximal 1 Vektorspeicher kann an den Assistenten angeschlossen sein.	No
tools	array	Überschreiben Sie die Werkzeuge, die der Assistent für diesen Durchlauf verwenden kann. Dies ist nützlich, um das Verhalten pro Ausführung zu ändern.	No
top_p	number	Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden. Wir empfehlen im Allgemeinen, diese oder die Temperatur zu verändern, aber nicht beides.	No	1
truncation_strategy	truncationObject	Steuerungen, wie ein Thread vor dem Durchlauf abgeschnitten wird. Nutze dies, um das anfängliche Kontextfenster des Laufs zu steuern.	No

threadObject

Repräsentiert einen Thread, der Nachrichten enthält.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
erstellt_am	Ganzzahl	Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem der Thread erstellt wurde.	Ja
id	string	Der Identifikator, der in API-Endpunkten referenziert werden kann.	Ja
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	Ja
Objekt	string	Der Objekttyp, der immer `thread`ist.	Ja
tool_resources	Objekt	Eine Sammlung von Ressourcen, die den Werkzeugen des Assistenten in diesem Thread zur Verfügung gestellt werden. Die Ressourcen sind spezifisch für die Art des Werkzeugs. Zum Beispiel benötigt das `code_interpreter` Tool eine Liste von Datei-IDs, während das `file_search` Tool eine Liste von Vektorspeicher-IDs benötigt.	Ja
└– code_interpreter	Objekt		No
└– file_ids	array	Eine Liste der Datei-IDs, die dem `code_interpreter` Tool zur Verfügung gestellt wurden. Es können maximal 20 Dateien mit dem Tool verknüpft sein.	No	[]
└– Dateisuche	Objekt		No
└– vector_store_ids	array	Der Vektorspeicher, der an diesen Thread angeschlossen ist. Maximal 1 Vektorspeicher kann an den Thread angeschlossen sein.	No

Objekt Enum: ThreadObjectType

Wert	Beschreibung
thread	Der Typ des Thread-Objekts, der immer ist `thread`

createThreadRequest

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Nachrichten	array	Eine Liste von Nachrichten, mit denen man den Thread beginnen kann.	No
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	No
tool_resources	Objekt	Eine Sammlung von Ressourcen, die den Werkzeugen des Assistenten in diesem Thread zur Verfügung gestellt werden. Die Ressourcen sind spezifisch für die Art des Werkzeugs. Zum Beispiel benötigt das `code_interpreter` Tool eine Liste von Datei-IDs, während das `file_search` Tool eine Liste von Vektorspeicher-IDs benötigt.	No
└– code_interpreter	Objekt		No
└– file_ids	array	Eine Liste der Datei-IDs, die dem `code_interpreter` Tool zur Verfügung gestellt wurden. Es können maximal 20 Dateien mit dem Tool verknüpft sein.	No	[]
└– Dateisuche	Objekt		No
└– vector_store_ids	array	Der Vektorspeicher, der an diesen Thread angeschlossen ist. Maximal 1 Vektorspeicher kann an den Thread angeschlossen sein.	No
└– Vektorspeicher	array	Ein Helfer, um mit file_ids einen Vektorspeicher zu erstellen und an diesen Thread anzuhängen. Maximal 1 Vektorspeicher kann an den Thread angeschlossen sein.	No

modifyThreadRequest

Name	Typ	Beschreibung	Erforderlich	Vorgabe
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	No
tool_resources	Objekt	Eine Sammlung von Ressourcen, die den Werkzeugen des Assistenten in diesem Thread zur Verfügung gestellt werden. Die Ressourcen sind spezifisch für die Art des Werkzeugs. Zum Beispiel benötigt das `code_interpreter` Tool eine Liste von Datei-IDs, während das `file_search` Tool eine Liste von Vektorspeicher-IDs benötigt.	No
└– code_interpreter	Objekt		No
└– file_ids	array	Eine Liste der Datei-IDs, die dem `code_interpreter` Tool zur Verfügung gestellt wurden. Es können maximal 20 Dateien mit dem Tool verknüpft sein.	No	[]
└– Dateisuche	Objekt		No
└– vector_store_ids	array	Der Vektorspeicher, der an diesen Thread angeschlossen ist. Maximal 1 Vektorspeicher kann an den Thread angeschlossen sein.	No

deleteThreadResponse

Name	Typ	Erforderlich
gelöscht	Boolescher Wert	Ja
id	string	Ja
Objekt	string	Ja

Objekt-Enum: DeleteThreadResponseObjectState

Wert	Beschreibung
thread.deleted	Der Zustand des Delete-Thread-Antwortobjekts, der ist `thread.deleted`

listThreadsResponse

Name	Typ	Erforderlich
data	array	Ja
first_id	string	Ja
has_more	Boolescher Wert	Ja
last_id	string	Ja
Objekt	string	Ja

messageObject

Repräsentiert eine Nachricht innerhalb eines Threads.

Name	Typ	Beschreibung	Erforderlich
assistant_id	string	Falls zutreffend, die ID des Assistenten, der diese Nachricht verfasst hat.	Ja
Anhänge	array	Eine Liste der an die Nachricht angehängten Dateien und die Werkzeuge, zu denen sie hinzugefügt wurden.	Ja
abgeschlossen_am	Ganzzahl	Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem die Nachricht abgeschlossen wurde.	Ja
Inhalt	array	Der Inhalt der Nachricht besteht aus Texten und/oder Bildern.	Ja
erstellt_am	Ganzzahl	Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem die Nachricht erstellt wurde.	Ja
id	string	Der Identifikator, der in API-Endpunkten referenziert werden kann.	Ja
incomplete_at	Ganzzahl	Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, in dem die Nachricht als unvollständig markiert wurde.	Ja
incomplete_details	Objekt	Bei einer unvollständigen Nachricht gibt es Details, warum die Nachricht unvollständig ist.	Ja
└– Grund	string	Der Grund, warum die Nachricht unvollständig ist.	No
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	Ja
Objekt	string	Der Objekttyp, der immer `thread.message`ist.	Ja
Rolle	string	Die Entität, die die Botschaft erzeugt hat. Einer von `user` oder `assistant`.	Ja
run_id	string	Falls zutreffend, die ID des Laufs, der mit der Erstellung dieser Nachricht verbunden ist.	Ja
Status	string	Der Status der Nachricht, der entweder `in_progress`, `incomplete`, oder `completed`sein kann.	Ja
thread_id	string	Die Thread-ID, zu der diese Nachricht gehört.	Ja

object Enum: MessageObjectType

Wert	Beschreibung
thread.message	Der Nachrichtenobjekttyp, der ist `thread.message`

Status Enum: MessageObjectStatus

Wert	Beschreibung
in_progress
incomplete
Abgeschlossen

Rolle Enum: MessageObjectRole

Wert	Beschreibung
user
Assistent

messageDeltaObject

Repräsentiert ein Nachrichten-Delta, also alle veränderten Felder einer Nachricht während des Streamings.

Name	Typ	Beschreibung	Erforderlich
delta	Objekt	Das Delta, das die Felder enthält, die sich auf der Nachricht geändert haben.	Ja
└– Inhalt	array	Der Inhalt der Nachricht besteht aus Texten und/oder Bildern.	No
└– Rolle	string	Die Entität, die die Botschaft erzeugt hat. Einer von `user` oder `assistant`.	No
id	string	Die Identifikatorin der Nachricht, die in API-Endpunkten referenziert werden kann.	Ja
Objekt	string	Der Objekttyp, der immer `thread.message.delta`ist.	Ja

Objekt-Enum: MessageDeltaObjectType

Wert	Beschreibung
thread.message.delta

createMessageRequest

Name	Typ	Beschreibung	Erforderlich
Anhänge	array	Eine Liste der an die Nachricht angehängten Dateien und die Werkzeuge, zu denen sie hinzugefügt werden sollten.	No
Inhalt	string	Der Inhalt der Nachricht.	Ja
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	No
Rolle	string	Die Rolle der Entität, die die Botschaft erschafft. Erlaubte Werte umfassen: - `user`: Zeigt an, dass die Nachricht von einem tatsächlichen Benutzer gesendet wurde und in den meisten Fällen zur Darstellung von benutzergenerierten Nachrichten verwendet werden sollte. - `assistant`: Zeigt an, dass die Nachricht vom Assistenten generiert wurde. Verwenden Sie diesen Wert, um Nachrichten vom Assistenten in das Gespräch einzufügen.	Ja

Rollen-Enum: CreateMessageRequestRole

Wert	Beschreibung
user
Assistent

modifyMessageRequest

Name	Typ	Beschreibung	Erforderlich	Vorgabe
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	No

deleteMessageResponse

Name	Typ	Erforderlich
gelöscht	Boolescher Wert	Ja
id	string	Ja
Objekt	string	Ja

Objekt Enum: DeleteMessageResponseObject

Wert	Beschreibung
thread.message.deleted	Der Zustand des Lösch-Nachrichten-Antwortobjekts

listMessagesResponse

Name	Typ	Erforderlich
data	array	Ja
first_id	string	Ja
has_more	Boolescher Wert	Ja
last_id	string	Ja
Objekt	string	Ja

messageContentImageFileObject

Verweist auf eine Bilddatei im Inhalt einer Nachricht.

Name	Typ	Beschreibung	Erforderlich
image_file	Objekt		Ja
└– file_id	string	Die Datei-ID des Bildes im Nachrichteninhalt.	No
type	string	Immer `image_file`.	Ja

type Enum: MessageContentImageFileObjectType

Wert	Beschreibung
image_file	Der Dateityp des Nachrichteninhalts

messageContentTextObject

Der Text, der Teil einer Nachricht ist.

Name	Typ	Beschreibung	Erforderlich
Text	Objekt		Ja
└– Anmerkungen	array		No
└– Wert	string	Die Daten, aus denen der Text besteht.	No
type	string	Immer `text`.	Ja

type Enum: messageContentTextObjectType

Wert	Beschreibung
Text	Der Nachrichteninhaltstext Objekttyp

messageContentTextAnnotationsFileCitationObject

Ein Zitat in der Nachricht, das auf ein bestimmtes Zitat aus einer bestimmten Datei verweist, die mit dem Assistenten oder der Nachricht verbunden ist. Generiert, wenn der Assistent das "Abruf"-Tool zur Durchsuchung von Dateien verwendet.

Name	Typ	Beschreibung	Erforderlich
end_index	Ganzzahl		Ja
file_citation	Objekt		Ja
└– file_id	string	Die ID der spezifischen Datei, aus der der Zitat stammt.	No
start_index	Ganzzahl		Ja
Text	string	Der Text im Nachrichteninhalt, der ersetzt werden muss.	Ja
type	string	Immer `file_citation`.	Ja

type Enum: FileCitationObjectType

Wert	Beschreibung
file_citation	Der Dateizitationsobjekttyp

messageContentTextAnnotationsFilePathObject

Eine URL für die Datei, die generiert wird, wenn der Assistent das code_interpreter Tool zur Erstellung einer Datei verwendet hat.

Name	Typ	Beschreibung	Erforderlich
end_index	Ganzzahl		Ja
file_path	Objekt		Ja
└– file_id	string	Die ID der erstellten Datei.	No
start_index	Ganzzahl		Ja
Text	string	Der Text im Nachrichteninhalt, der ersetzt werden muss.	Ja
type	string	Immer `file_path`.	Ja

type Enum: FilePathObjectType

Wert	Beschreibung
file_path	Der Dateipfad-Objekttyp

messageDeltaContentImageFileObject

Verweist auf eine Bilddatei im Inhalt einer Nachricht.

Name	Typ	Beschreibung	Erforderlich
image_file	Objekt		No
└– file_id	string	Die Datei-ID des Bildes im Nachrichteninhalt.	No
index	Ganzzahl	Der Inhaltsindex in der Nachricht.	Ja
type	string	Immer `image_file`.	Ja

type Enum: MessageDeltaContentImageFileObjectType

Wert	Beschreibung
image_file

messageDeltaContentTextObject

Der Text, der Teil einer Nachricht ist.

Name	Typ	Beschreibung	Erforderlich
index	Ganzzahl	Der Inhaltsindex in der Nachricht.	Ja
Text	Objekt		No
└– Anmerkungen	array		No
└– Wert	string	Die Daten, aus denen der Text besteht.	No
type	string	Immer `text`.	Ja

type Enum: MessageDeltaContentTextObjectType

Wert	Beschreibung
Text

messageDeltaContentTextAnnotationsFileCitationObject

Ein Zitat in der Nachricht, das auf ein bestimmtes Zitat aus einer bestimmten Datei verweist, die mit dem Assistenten oder der Nachricht verbunden ist. Generiert, wenn der Assistent das "file_search"-Tool zur Durchsuchung von Dateien verwendet.

Name	Typ	Beschreibung	Erforderlich
end_index	Ganzzahl		No
file_citation	Objekt		No
└– file_id	string	Die ID der spezifischen Datei, aus der der Zitat stammt.	No
└- Zitat	string	Das konkrete Zitat in der Akte.	No
index	Ganzzahl	Der Index der Annotation im Textinhalt.	Ja
start_index	Ganzzahl		No
Text	string	Der Text im Nachrichteninhalt, der ersetzt werden muss.	No
type	string	Immer `file_citation`.	Ja

type Enum: MessageDeltaContentTextAnnotationsFileCitationObjectType

Wert	Beschreibung
file_citation

messageDeltaContentTextAnnotationsFilePathObject

Eine URL für die Datei, die generiert wird, wenn der Assistent das code_interpreter Tool zur Erstellung einer Datei verwendet hat.

Name	Typ	Beschreibung	Erforderlich
end_index	Ganzzahl		No
file_path	Objekt		No
└– file_id	string	Die ID der erstellten Datei.	No
index	Ganzzahl	Der Index der Annotation im Textinhalt.	Ja
start_index	Ganzzahl		No
Text	string	Der Text im Nachrichteninhalt, der ersetzt werden muss.	No
type	string	Immer `file_path`.	Ja

type Enum: MessageDeltaContentTextAnnotationsFilePathObjectType

Wert	Beschreibung
file_path

runStepObject

Stellt einen Schritt in der Ausführung eines Durchlaufs dar.

Name	Typ	Beschreibung	Erforderlich
assistant_id	string	Die ID des Assistenten, der mit dem Laufschritt verknüpft ist.	Ja
cancelled_at	Ganzzahl	Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem der Laufschritt abgebrochen wurde.	Ja
abgeschlossen_am	Ganzzahl	Der Unix-Zeitstempel (in Sekunden) für den Abschluss des Laufschritts.	Ja
erstellt_am	Ganzzahl	Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem der Ausführen-Schritt erstellt wurde.	Ja
abgelaufen_am	Ganzzahl	Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt des Ablaufschritts. Ein Schritt gilt als abgelaufen, wenn der Elternlauf abgelaufen ist.	Ja
failed_at	Ganzzahl	Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem der Ausführungsschritt fehlgeschlagen ist.	Ja
id	string	Die Identifikatorin des Ausführens des Schritts, die in API-Endpunkten referenziert werden kann.	Ja
last_error	Objekt	Der letzte Fehler, der mit diesem Laufschritt verbunden ist. Wird es sein `null` , wenn keine Fehler vorliegen.	Ja
└– Code	string	Einer von `server_error` oder `rate_limit_exceeded`.	No
└– Nachricht	string	Eine für Menschen lesbare Beschreibung des Fehlers.	No
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	Ja
Objekt	string	Der Objekttyp, der immer `assistant.run.step`ist.	Ja
run_id	string	Die ID des Durchlaufs, zu dem dieser Durchlaufschritt gehört.	Ja
Status	string	Der Status des Durchlaufs, der entweder `in_progress`, `cancelled`, , `failed`, `completed`oder `expired`sein kann.	Ja
step_details	runStepDetailsMessageCreationObject oder runStepDetailsToolCallsObject	Die Details des Laufschritts.	Ja
thread_id	string	Die ID der durchgeführten Threads.	Ja
type	string	Der Typ des Laufschritts, der entweder `message_creation` oder `tool_calls`sein kann.	Ja

Objekt-Enum: RunStepObjectType

Wert	Beschreibung
assistant.run.step	Der Objekttyp, der immer ist `assistant.run.step`

Typ Enum: RunStepObjectType

Wert	Beschreibung
message_creation	Der message_creation Laufschritt
tool_calls	Der tool_calls Laufschritt

Status Enum: RunStepObjectStatus

Wert	Beschreibung
in_progress	Der in_progress Run-Status
cancelled	Der Status des gestrichenen Laufs
misslungen	Der Status des gestrichenen Laufs
Abgeschlossen	Der Status des gestrichenen Laufs
Abgelaufen	Der Status des gestrichenen Laufs

runStepDeltaObject

Repräsentiert ein Laufschritt-Delta, also alle geänderten Felder auf einem Laufschritt während des Streamings.

Name	Typ	Beschreibung	Erforderlich
delta	Objekt	Das Delta, das die Felder enthält, die sich im Laufschritt geändert haben.	Ja
└– step_details	runStepDeltaStepDetailsMessageCreationObject oder runStepDeltaStepDetailsToolCallsObject	Die Details des Laufschritts.	No
id	string	Die Identifikatorin des Ausführens des Schritts, die in API-Endpunkten referenziert werden kann.	Ja
Objekt	string	Der Objekttyp, der immer `thread.run.step.delta`ist.	Ja

Objekt-Enum: RunStepDeltaObjectType

Wert	Beschreibung
thread.run.step.delta

listRunStepsResponse

Name	Typ	Erforderlich
data	array	Ja
first_id	string	Ja
has_more	Boolescher Wert	Ja
last_id	string	Ja
Objekt	string	Ja

runStepDetailsMessageCreationObject

Details zur Nachrichtenerstellung durch den Laufschritt.

Name	Typ	Beschreibung	Erforderlich
message_creation	Objekt		Ja
└– Nachrichten-ID	string	Die ID der Nachricht, die durch diesen Laufschritt erstellt wurde.	No
type	string	Immer `message_creation`.	Ja

Typ Enum: RunStepDetailsMessageCreationObjectType

Wert	Beschreibung
message_creation

runStepDeltaStepDetailsMessageCreationObject

Details zur Nachrichtenerstellung durch den Laufschritt.

Name	Typ	Beschreibung	Erforderlich
message_creation	Objekt		No
└– Nachrichten-ID	string	Die ID der Nachricht, die durch diesen Laufschritt erstellt wurde.	No
type	string	Immer `message_creation`.	Ja

Typ Enum: RunStepDeltaStepDetailsMessageCreationObjectType

Wert	Beschreibung
message_creation

runStepDetailsToolCallsObject

Details des Werkzeugaufrufs.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
tool_calls	array	Eine Reihe von Werkzeugaufrufen, an denen der Laufschritt beteiligt war. Diese können mit einer von drei Arten von Werkzeugen assoziiert werden: `code_interpreter`, `retrieval` oder `function`.	Ja
type	string	Immer `tool_calls`.	Ja

type Enum: RunStepDetailsToolCallsObjectType

Wert	Beschreibung
tool_calls

runStepDeltaStepDetailsToolCallsObject

Details des Werkzeugaufrufs.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
tool_calls	array	Eine Reihe von Werkzeugaufrufen, an denen der Laufschritt beteiligt war. Diese können mit einer von drei Arten von Werkzeugen assoziiert werden: `code_interpreter`, `file_search` oder `function`.	No
type	string	Immer `tool_calls`.	Ja

type Enum: RunStepDeltaStepDetailsToolCallsObjectType

Wert	Beschreibung
tool_calls

runStepDetailsToolCallsCodeObject

Details des Code Interpreter-Tool-Aufrufs, an dem der Ausführen-Schritt beteiligt war.

Name	Typ	Beschreibung	Erforderlich
code_interpreter	Objekt	Das Code Interpreter-Tool ruft die Definition auf.	Ja
└– Eingabe	string	Die Eingabe für den Code Interpreter-Tool-Aufruf.	No
└─ Ausgaben	array	Die Ausgaben des Code Interpreter-Tool-Aufrufs. Code Interpreter kann ein oder mehrere Elemente ausgeben, darunter Text (`logs`) oder Bilder (`image`). Jede dieser Objekte wird durch einen anderen Objekttyp dargestellt.	No
id	string	Die ID des Werkzeugrufs.	Ja
type	string	Die Art von Werkzeugruf. Das gilt immer `code_interpreter` für diese Art von Tool-Call.	Ja

type Enum: RunStepDetailsToolCallsCodeObjectType

Wert	Beschreibung
code_interpreter

runStepDeltaStepDetailsToolCallsCodeObject

Details des Code Interpreter-Tool-Aufrufs, an dem der Ausführen-Schritt beteiligt war.

Name	Typ	Beschreibung	Erforderlich
code_interpreter	Objekt	Das Code Interpreter-Tool ruft die Definition auf.	No
└– Eingabe	string	Die Eingabe für den Code Interpreter-Tool-Aufruf.	No
└─ Ausgaben	array	Die Ausgaben des Code Interpreter-Tool-Aufrufs. Code Interpreter kann ein oder mehrere Elemente ausgeben, darunter Text (`logs`) oder Bilder (`image`). Jede dieser Objekte wird durch einen anderen Objekttyp dargestellt.	No
id	string	Die ID des Werkzeugrufs.	No
index	Ganzzahl	Der Index des Werkzeugaufrufs im Werkzeug ruft das Array auf.	Ja
type	string	Die Art von Werkzeugruf. Das gilt immer `code_interpreter` für diese Art von Tool-Call.	Ja

type Enum: RunStepDeltaStepDetailsToolCallsCodeObjectType

Wert	Beschreibung
code_interpreter

runStepDetailsToolCallsCodeOutputLogsObject

Textausgabe vom Code Interpreter-Tool-Aufruf als Teil eines Run-Schritts.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
logs	string	Die Textausgabe aus dem Code Interpreter-Tool-Aufruf.	Ja
type	string	Immer `logs`.	Ja

type Enum: RunStepDetailsToolCallsCodeOutputLogsObjectType

Wert	Beschreibung
logs

runStepDeltaStepDetailsToolCallsCodeOutputLogsObject

Textausgabe vom Code Interpreter-Tool-Aufruf als Teil eines Run-Schritts.

Name	Typ	Beschreibung	Erforderlich
index	Ganzzahl	Der Index der Ausgabe im Ausgabearray.	Ja
logs	string	Die Textausgabe aus dem Code Interpreter-Tool-Aufruf.	No
type	string	Immer `logs`.	Ja

type Enum: RunStepDeltaStepDetailsToolCallsCodeOutputLogsObjectType

Wert	Beschreibung
logs

runStepDetailsToolCallsCodeOutputImageObject

Name	Typ	Beschreibung	Erforderlich
Bild	Objekt		Ja
└– file_id	string	Die Datei-ID des Bildes.	No
type	string	Immer `image`.	Ja

type Enum: RunStepDetailsToolCallsCodeOutputImageObjectType

Wert	Beschreibung
Bild

runStepDeltaStepDetailsToolCallsCodeOutputImageObject

Name	Typ	Beschreibung	Erforderlich
Bild	Objekt		No
└– file_id	string	Die Datei-ID des Bildes.	No
index	Ganzzahl	Der Index der Ausgabe im Ausgabearray.	Ja
type	string	Immer `image`.	Ja

Typ Enum: RunStepDeltaStepDetailsToolCallsCodeOutputImageObject

Wert	Beschreibung
Bild

runStepDetailsToolCallsFileSearchObject

Name	Typ	Beschreibung	Erforderlich
file_search	Objekt	Im Moment wird das immer ein leeres Objekt sein.	Ja
└- Ergebnisse	array	Die Ergebnisse der Dateisuche.	No
id	string	Die ID des Werkzeugaufrufobjekts.	Ja
type	string	Die Art von Werkzeugruf. Das gilt immer `file_search` für diese Art von Tool-Call.	Ja

Type Enum: RunStepDetailsToolCallsFileSearchObjectType

Wert	Beschreibung
file_search

runStepDetailsToolCallsFileSearchResultObject

Eine Ergebnisinstanz der Dateisuche.

Name	Typ	Beschreibung	Erforderlich
Inhalt	array	Der Inhalt des gefundenen Ergebnisses. Der Inhalt wird nur aufgenommen, wenn er über den Include-Abfrageparameter angefordert wird.	No
Datei-ID	string	Die ID der Datei, in der das Ergebnis gefunden wurde.	Ja
file_name	string	Der Name der Akte, in der dieses Ergebnis gefunden wurde.	Ja
Punktzahl	number	Das Ergebnis des Ergebnisses. Alle Werte müssen eine Gleitkommazahl zwischen 0 und 1 haben.	Ja

runStepDeltaStepDetailsToolCallsFileSearchObject

Name	Typ	Beschreibung	Erforderlich
file_search	Objekt	Im Moment wird das immer ein leeres Objekt sein.	Ja
id	string	Die ID des Werkzeugaufrufobjekts.	No
index	Ganzzahl	Der Index des Werkzeugaufrufs im Werkzeug ruft das Array auf.	Ja
type	string	Die Art von Werkzeugruf. Das gilt immer `retrieval` für diese Art von Tool-Call.	Ja

Type Enum: RunStepDeltaStepDetailsToolCallsFileSearchObjectType

Wert	Beschreibung
file_search

runStepDetailsToolCallsFunctionObject

Name	Typ	Beschreibung	Erforderlich
Funktion	Objekt	Die Definition der Funktion, die genannt wurde.	Ja
└- Argumente	string	Die Argumente wurden an die Veranstaltung weitergegeben.	No
└– Name	string	Der Name der Veranstaltung.	No
└─ Ausgabe	string	Die Ausgabe der Funktion. Dies gilt, `null` wenn die Ergebnisse noch nicht eingereicht wurden.	No
id	string	Die ID des Werkzeugaufrufobjekts.	Ja
type	string	Die Art von Werkzeugruf. Das gilt immer `function` für diese Art von Tool-Call.	Ja

type Enum: RunStepDetailsToolCallsFunctionObjectType

Wert	Beschreibung
Funktion

runStepDeltaStepDetailsToolCallsFunctionObject

Name	Typ	Beschreibung	Erforderlich
Funktion	Objekt	Die Definition der Funktion, die genannt wurde.	No
└- Argumente	string	Die Argumente wurden an die Veranstaltung weitergegeben.	No
└– Name	string	Der Name der Veranstaltung.	No
└─ Ausgabe	string	Die Ausgabe der Funktion. Dies gilt, `null` wenn die Ergebnisse noch nicht eingereicht wurden.	No
id	string	Die ID des Werkzeugaufrufobjekts.	No
index	Ganzzahl	Der Index des Werkzeugaufrufs im Werkzeug ruft das Array auf.	Ja
type	string	Die Art von Werkzeugruf. Das gilt immer `function` für diese Art von Tool-Call.	Ja

type Enum: RunStepDetailsToolCallsFunctionObjectType

Wert	Beschreibung
Funktion

vectorStoreExpirationAfter

Die Ablaufrichtlinie für einen Vektorspeicher.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Anker	string	Anker-Zeitstempel, nach dem die Ablaufrichtlinie gilt. Unterstützte Anker: `last_active_at`.	Ja
Tage	Ganzzahl	Die Anzahl der Tage nach der Ankerzeit, in der der Vektorspeicher abläuft.	Ja

Anker-Enum: VectorStoreExpirationAfterAnchor

Wert	Beschreibung
last_active_at	Der Ankerzeitstempel, nach dem die Ablaufrichtlinie gilt.

vectorStoreObject

Ein Vektorspeicher ist eine Sammlung verarbeiteter Dateien, die vom file_search Tool verwendet werden können.

Name	Typ	Beschreibung	Erforderlich
erstellt_am	Ganzzahl	Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem der Vektorspeicher erstellt wurde.	Ja
expires_after	vectorStoreExpirationAfter	Die Ablaufrichtlinie für einen Vektorspeicher.	No
läuft_ab_am	Ganzzahl	Der Unix-Zeitstempel (in Sekunden) dafür, wann der Vektorspeicher abläuft.	No
file_counts	Objekt		Ja
└– abgebrochen	Ganzzahl	Die Anzahl der gelöschten Dateien.	No
└– abgeschlossen	Ganzzahl	Die Anzahl der erfolgreich verarbeiteten Dateien.	No
└– fehlgeschlagen	Ganzzahl	Die Anzahl der Dateien, die nicht verarbeitet wurden.	No
└─ in Bearbeitung	Ganzzahl	Die Anzahl der aktuell bearbeiteten Dateien.	No
└– Gesamtsumme	Ganzzahl	Die Gesamtzahl der Dateien.	No
id	string	Der Identifikator, der in API-Endpunkten referenziert werden kann.	Ja
last_active_at	Ganzzahl	Der Unix-Zeitstempel (in Sekunden) dafür, wann der Vektorspeicher zuletzt aktiv war.	Ja
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	Ja
Name	string	Der Name des Vektorspeichers.	Ja
Objekt	enum	Der Objekttyp, der immer `vector_store`ist. Mögliche Werte: `vector_store`	Ja
Status	string	Der Status des Vektorspeichers, der entweder `expired`, `in_progress`, oder `completed`sein kann. Ein Status von `completed` zeigt an, dass der Vektorspeicher einsatzbereit ist.	Ja
usage_bytes	Ganzzahl	Die Gesamtzahl der von den Dateien im Vektorspeicher verwendeten Bytes.	Ja

Status Enum: VectorStoreObjectStatus

Wert	Beschreibung
Abgelaufen
in_progress
Abgeschlossen

createVectorStoreRequest

Name	Typ	Beschreibung	Erforderlich
chunking_strategy	autoChunkingStrategyRequestParam oder staticChunkingStrategyRequestParam	Die Chunking-Strategie, die verwendet wird, um die Datei(en) zu chunken. Wenn nicht gesetzt, werde ich die Strategie `auto` verwenden. Nur dann anwendbar, wenn `file_ids` nicht leer ist.	No
expires_after	vectorStoreExpirationAfter	Die Ablaufrichtlinie für einen Vektorspeicher.	No
Datei-IDs	array	Eine Liste von Datei-IDs, die der Vektorspeicher verwenden sollte. Nützlich für Werkzeuge wie `file_search` diese, die auf Dateien zugreifen können.	No
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	No
Name	string	Der Name des Vektorspeichers.	No

updateVectorStoreRequest

Name	Typ	Beschreibung	Erforderlich
expires_after	vectorStoreExpirationAfter	Die Ablaufrichtlinie für einen Vektorspeicher.	No
metadata	Objekt	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern. Tasten können maximal 64 Zeichen lang sein und Werte maximal 512 Zeichen.	No
Name	string	Der Name des Vektorspeichers.	No

listVectorStoresResponse

Name	Typ	Erforderlich
data	array	Ja
first_id	string	Ja
has_more	Boolescher Wert	Ja
last_id	string	Ja
Objekt	string	Ja

deleteVectorStoreResponse

Name	Typ	Erforderlich
gelöscht	Boolescher Wert	Ja
id	string	Ja
Objekt	string	Ja

Objekt Enum: DeleteVectorStoreResponseObject

Wert	Beschreibung
vector_store.deleted	Der Zustand des Delete-Vector-Store-Response-Objekts

vectorStoreFileObject

Eine Liste von Dateien, die einem Vektorspeicher zugeordnet sind.

Name	Typ	Beschreibung	Erforderlich
chunking_strategy	autoChunkingStrategyRequestParam oder staticChunkingStrategyRequestParam	Die Chunking-Strategie, die verwendet wird, um die Datei(en) zu chunken. Wenn nicht gesetzt, werde ich die Strategie `auto` verwenden. Nur dann anwendbar, wenn `file_ids` nicht leer ist.	No
erstellt_am	Ganzzahl	Der Unix-Zeitstempel (in Sekunden) für den Zeitpunkt, an dem die Vektorspeicherdatei erstellt wurde.	Ja
id	string	Der Identifikator, der in API-Endpunkten referenziert werden kann.	Ja
last_error	Objekt	Der letzte Fehler, der mit dieser Vektorspeicherdatei verbunden ist. Wird es sein `null` , wenn keine Fehler vorliegen.	Ja
└– Code	string	Eines von `server_error` oder `invalid_file` oder .`unsupported_file`	No
└– Nachricht	string	Eine für Menschen lesbare Beschreibung des Fehlers.	No
Objekt	string	Der Objekttyp, der immer `vector_store.file`ist.	Ja
Status	string	Der Status der Vektorspeicherdatei, die entweder `in_progress`, `completed`, `cancelled`, oder `failed`sein kann. Der Status `completed` zeigt an, dass die Vektorspeicherdatei einsatzbereit ist.	Ja
usage_bytes	Ganzzahl	Die Gesamtnutzung des Vektorspeichers in Bytes. Beachten Sie, dass dies sich von der ursprünglichen Dateigröße unterscheiden kann.	Ja
vector_store_id	string	Die ID des Vektorspeichers, an den die Datei angehängt ist.	Ja

Objekt-Enum: VectorStoreFileObjectType

Wert	Beschreibung
vector_store.file

Status Enum: VectorStoreFileObjectStatus

Wert	Beschreibung
in_progress
Abgeschlossen
cancelled
misslungen

otherChunkingStrategyResponseParam

Dies wird zurückgegeben, wenn die Chunking-Strategie unbekannt ist. Typischerweise liegt dies daran, dass die Datei bereits indexiert wurde, bevor das chunking_strategy Konzept in der API eingeführt wurde.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
type	string	Immer `other`.	Ja

Typ Enum: OtherChunkingStrategyResponseParamType

Wert	Beschreibung
sonstige

staticChunkingStrategyResponseParam

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Statisch	staticChunkingStrategy		Ja
type	string	Immer `static`.	Ja

Typ Enum: StaticChunkingStrategyResponseParamType

Wert	Beschreibung
Statisch

staticChunkingStrategy

Name	Typ	Beschreibung	Erforderlich	Vorgabe
chunk_overlap_tokens	Ganzzahl	Die Anzahl der Tokens, die sich zwischen den Chunks überschneiden. Der Standardwert ist `400`. Beachte, dass die Überlappung nicht die Hälfte von überschreiten `max_chunk_size_tokens`darf.	Ja
max_chunk_size_tokens	Ganzzahl	Die maximale Anzahl an Token in jedem Chunk. Der Standardwert ist `800`. Der Mindestwert ist `100` und der Maximalwert ist `4096`.	Ja

autoChunkingStrategyRequestParam

Die Standardstrategie. Diese Strategie verwendet derzeit ein max_chunk_size_tokens von 800 und chunk_overlap_tokens von 400.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
type	enum	Immer `auto`. Mögliche Werte: `auto`	Ja

staticChunkingStrategyRequestParam

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Statisch	staticChunkingStrategy		Ja
type	enum	Immer `static`. Mögliche Werte: `static`	Ja

chunkingStrategyRequestParam

Die Chunking-Strategie, die verwendet wird, um die Datei(en) zu chunken. Wenn nicht gesetzt, werde ich die Strategie auto verwenden.

Diese Komponente kann eine der folgenden sein:

autoChunkingStrategyRequestParam
staticChunkingStrategyRequestParam

createVectorStoreFileRequest

Name	Typ	Beschreibung	Erforderlich	Vorgabe
chunking_strategy	chunkingStrategyRequestParam	Die Chunking-Strategie, die verwendet wird, um die Datei(en) zu chunken. Wenn nicht gesetzt, werde ich die Strategie `auto` verwenden.	No
Datei-ID	string	Eine Datei-ID, die der Vektorspeicher verwenden sollte. Nützlich für Werkzeuge wie `file_search` diese, die auf Dateien zugreifen können.	Ja

listVectorStoreFilesResponse

Name	Typ	Erforderlich
data	array	Ja
first_id	string	Ja
has_more	Boolescher Wert	Ja
last_id	string	Ja
Objekt	string	Ja

deleteVectorStoreFileResponse

Name	Typ	Erforderlich
gelöscht	Boolescher Wert	Ja
id	string	Ja
Objekt	string	Ja

Objekt Enum: DeleteVectorStoreFileResponseObject

Wert	Beschreibung
vector_store.file.deleted

vectorStoreFileBatchObject

Eine Charge von Dateien, die an einen Vektorspeicher angehängt sind.

Name	Typ	Beschreibung	Erforderlich
erstellt_am	Ganzzahl	Der Unix-Zeitstempel (in Sekunden) für den Batch-Erstellung der Vektorspeicherdateien.	Ja
file_counts	Objekt		Ja
└– abgebrochen	Ganzzahl	Die Anzahl der gelöschten Dateien.	No
└– abgeschlossen	Ganzzahl	Die Anzahl der verarbeiteten Dateien.	No
└– fehlgeschlagen	Ganzzahl	Die Anzahl der Dateien, die nicht verarbeitet wurden.	No
└─ in Bearbeitung	Ganzzahl	Die Anzahl der aktuell bearbeiteten Dateien.	No
└– Gesamtsumme	Ganzzahl	Die Gesamtzahl der Dateien.	No
id	string	Der Identifikator, der in API-Endpunkten referenziert werden kann.	Ja
Objekt	string	Der Objekttyp, der immer `vector_store.file_batch`ist.	Ja
Status	string	Der Status des Vektorspeicher-Dateien-Batches, der entweder `in_progress`, `completed`, `cancelled` oder `failed`sein kann.	Ja
vector_store_id	string	Die ID des Vektorspeichers, an den die Datei angehängt ist.	Ja

Objekt-Enum: VectorStoreFileBatchObjectType

Wert	Beschreibung
vector_store.files_batch

Status Enum: VectorStoreFileBatchObjectStatus

Wert	Beschreibung
in_progress
Abgeschlossen
cancelled
misslungen

createVectorStoreFileBatchRequest

Name	Typ	Beschreibung	Erforderlich	Vorgabe
chunking_strategy	chunkingStrategyRequestParam	Die Chunking-Strategie, die verwendet wird, um die Datei(en) zu chunken. Wenn nicht gesetzt, werde ich die Strategie `auto` verwenden.	No
Datei-IDs	array	Eine Liste von Datei-IDs, die der Vektorspeicher verwenden sollte. Nützlich für Werkzeuge wie `file_search` diese, die auf Dateien zugreifen können.	Ja

assistantStreamEvent

Repräsentiert ein Ereignis, das beim Streamen eines Runs ausgelöst wird.

Jedes Ereignis in einem servergesendeten Ereignisstrom besitzt eine event Eigenschaft und data :

event: thread.created
data: {"id": "thread_123", "object": "thread", ...}

Wir senden Ereignisse aus, wann immer ein neues Objekt erstellt wird, in einen neuen Zustand übergeht oder in Teilen (Deltas) gestreamt wird. Zum Beispiel senden wir aus, thread.run.created wenn ein neuer Run erstellt wird, thread.run.completed wenn ein Run abgeschlossen wird und so weiter. Wenn ein Assistent während eines Durchlaufs eine Nachricht erstellt, senden wir ein thread.message.created event, ein thread.message.in_progress Ereignis, viele thread.message.delta Ereignisse und schließlich ein Ereignis thread.message.completed .

Wir können im Laufe der Zeit zusätzliche Ereignisse hinzufügen, daher empfehlen wir, unbekannte Ereignisse in Ihrem Code elegant zu behandeln.

Diese Komponente kann eine der folgenden sein:

threadStreamEvent
runStreamEvent
runStepStreamEvent
messageStreamEvent
errorEvent
doneEvent

threadStreamEvent

Diese Komponente kann eine der folgenden sein:

thread.created

Tritt auf, wenn ein neuer Thread erstellt wird.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
data	threadObject	Repräsentiert einen Thread, der Nachrichten enthält.	Ja
Ereignis	string		Ja

Daten: threadObject

Ereignis-Enum: ThreadStreamEventEnum

Wert	Beschreibung
thread.created	Das Thread-erstellte Ereignis

runStreamEvent

Diese Komponente kann eine der folgenden sein:

thread.run.created

Tritt auf, wenn ein neuer Durchlauf erstellt wird.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
data	runObject	Repräsentiert eine Ausführung, die auf einem Thread ausgeführt wird.	Ja
Ereignis	string		Ja

Daten: runObject

Ereignis-Enum: RunStreamEventCreated

Wert	Beschreibung
thread.run.created

thread.run.queued

Tritt auf, wenn ein Lauf in einen Status queued wechselt.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
data	runObject	Repräsentiert eine Ausführung, die auf einem Thread ausgeführt wird.	Ja
Ereignis	string		Ja

Daten: runObject

Ereignis-Enum: RunStreamEventQueued

Wert	Beschreibung
thread.run.queued

thread.run.in_progress

Tritt auf, wenn ein Lauf in einen Status in_progress übergeht.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
data	runObject	Repräsentiert eine Ausführung, die auf einem Thread ausgeführt wird.	Ja
Ereignis	string		Ja

Daten: runObject

Ereignis-Enum: RunStreamEventInProgress

Wert	Beschreibung
thread.run.in_progress

thread.run.requires_action

Tritt auf, wenn ein Lauf in einen Status requires_action wechselt.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
data	runObject	Repräsentiert eine Ausführung, die auf einem Thread ausgeführt wird.	Ja
Ereignis	string		Ja

Daten: runObject

Ereignis-Enum: RunStreamEventVerlangAktion

Wert	Beschreibung
thread.run.requires_action

thread.run.completed

Tritt auf, wenn ein Durchlauf abgeschlossen ist.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
data	runObject	Repräsentiert eine Ausführung, die auf einem Thread ausgeführt wird.	Ja
Ereignis	string		Ja

Daten: runObject

Ereignis-Enum: RunStreamEventAbgeschlossen

Wert	Beschreibung
thread.run.completed

thread.run.failed

Tritt auf, wenn ein Durchlauf fehlschlägt.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
data	runObject	Repräsentiert eine Ausführung, die auf einem Thread ausgeführt wird.	Ja
Ereignis	string		Ja

Daten: runObject

Ereignis-Enum: RunStreamEventFailed

Wert	Beschreibung
thread.run.failed

thread.run.cancelling

Tritt auf, wenn ein Lauf in einen Status cancelling wechselt.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
data	runObject	Repräsentiert eine Ausführung, die auf einem Thread ausgeführt wird.	Ja
Ereignis	string		Ja

Daten: runObject

Event Enum: RunStreamEventCancelling

Wert	Beschreibung
thread.run.cancelling

thread.run.cancelled

Tritt auf, wenn ein Lauf abgebrochen wird.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
data	runObject	Repräsentiert eine Ausführung, die auf einem Thread ausgeführt wird.	Ja
Ereignis	string		Ja

Daten: runObject

Veranstaltungsübersicht: RunStreamEventCancelled

Wert	Beschreibung
thread.run.cancelled

thread.run.expired

Tritt auf, wenn ein Run abläuft.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
data	runObject	Repräsentiert eine Ausführung, die auf einem Thread ausgeführt wird.	Ja
Ereignis	string		Ja

Daten: runObject

Ereignis-Enum: RunStreamEventExpired

Wert	Beschreibung
thread.run.expired

runStepStreamEvent

Diese Komponente kann eine der folgenden sein:

thread.run.step.created

Tritt auf, wenn ein Laufschritt erstellt wird.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
data	runStepObject	Stellt einen Schritt in der Ausführung eines Durchlaufs dar.	Ja
Ereignis	string		Ja

Daten: runStepObject

Event Enum: RunStepStreamEventCreated

Wert	Beschreibung
thread.run.step.created

thread.run.step.in_progress

Tritt auf, wenn ein Laufschritt in einen Zustand in_progress übergeht.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
data	runStepObject	Stellt einen Schritt in der Ausführung eines Durchlaufs dar.	Ja
Ereignis	string		Ja

Daten: runStepObject

Ereignis-Enum: RunStepStreamEventInProgress

Wert	Beschreibung
thread.run.step.in_progress

thread.run.step.delta

Tritt auf, wenn Teile eines Laufschritts gestreamt werden.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
data	runStepDeltaObject	Repräsentiert ein Laufschritt-Delta, also alle geänderten Felder auf einem Laufschritt während des Streamings.	Ja
Ereignis	string		Ja

Daten: runStepDeltaObject

Event Enum: RunStepStreamEventDelta

Wert	Beschreibung
thread.run.step.delta

thread.run.step.completed

Tritt auf, wenn ein Ausführungsschritt abgeschlossen ist.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
data	runStepObject	Stellt einen Schritt in der Ausführung eines Durchlaufs dar.	Ja
Ereignis	string		Ja

Daten: runStepObject

Ereignis-Enum: RunStepStreamEventAbgeschlossen

Wert	Beschreibung
thread.run.step.completed

thread.run.step.failed

Tritt auf, wenn ein Laufschritt fehlschlägt.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
data	runStepObject	Stellt einen Schritt in der Ausführung eines Durchlaufs dar.	Ja
Ereignis	string		Ja

Daten: runStepObject

Ereignis-Enum: RunStepStreamEventFailed

Wert	Beschreibung
thread.run.step.failed

thread.run.step.cancelled

Tritt auf, wenn ein Laufschritt abgebrochen wird.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
data	runStepObject	Stellt einen Schritt in der Ausführung eines Durchlaufs dar.	Ja
Ereignis	string		Ja

Daten: runStepObject

Event Enum: RunStepStreamEventCancelled

Wert	Beschreibung
thread.run.step.cancelled

thread.run.step.expired

Tritt auf, wenn ein Laufschritt abläuft.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
data	runStepObject	Stellt einen Schritt in der Ausführung eines Durchlaufs dar.	Ja
Ereignis	string		Ja

Daten: runStepObject

Ereignis-Enum: RunStepStreamEventExpired

Wert	Beschreibung
thread.run.step.expired

messageStreamEvent

Diese Komponente kann eine der folgenden sein:

thread.message.created

Tritt auf, wenn eine Nachricht erstellt wird.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
data	messageObject	Repräsentiert eine Nachricht innerhalb eines Threads.	Ja
Ereignis	string		Ja

Daten: messageObject

Ereignis-Enum: MessageStreamEventCreated

Wert	Beschreibung
thread.message.created

thread.message.in_progress

Tritt auf, wenn eine Nachricht in einen Zustand in_progress wechselt.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
data	messageObject	Repräsentiert eine Nachricht innerhalb eines Threads.	Ja
Ereignis	string		Ja

Daten: messageObject

Ereignis-Enum: MessageStreamEventInProgress

Wert	Beschreibung
thread.message.in_progress

thread.message.delta

Tritt auf, wenn Teile einer Nachricht gestreamt werden.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
data	messageDeltaObject	Repräsentiert ein Nachrichten-Delta, also alle veränderten Felder einer Nachricht während des Streamings.	Ja
Ereignis	string		Ja

Daten: messageDeltaObject

Ereignis-Enum: MessageStreamEventDelta

Wert	Beschreibung
thread.message.delta

thread.message.completed

Tritt auf, wenn eine Nachricht abgeschlossen ist.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
data	messageObject	Repräsentiert eine Nachricht innerhalb eines Threads.	Ja
Ereignis	string		Ja

Daten: messageObject

Ereignis-Enum: MessageStreamEventCompleted

Wert	Beschreibung
thread.message.completed

thread.message.incomplete

Tritt auf, wenn eine Nachricht endet, bevor sie abgeschlossen ist.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
data	messageObject	Repräsentiert eine Nachricht innerhalb eines Threads.	Ja
Ereignis	string		Ja

Daten: messageObject

Ereignis-Enum: MessageStreamEventIncomplete

Wert	Beschreibung
thread.message.incomplete

Anmerkung

Diese Komponente kann eine der folgenden sein:

FileCitation
UrlCitation
FilePath

Klicken Sie auf

Eine Klickaktion.

Name	Typ	Beschreibung	Erforderlich
button	enum	Zeigt an, welche Maustaste während des Klicks gedrückt wurde. Einer von , , , , `left`, oder `right`. `wheelbackforward` Mögliche Werte: `left`, `right`, `wheel`, `back`, `forward`	Ja
type	enum	Spezifiziert den Ereignistyp. Für eine Klickaktion ist diese Eigenschaft immer auf `click`gesetzt. Mögliche Werte: `click`	Ja
x	Ganzzahl	Die X-Koordinate, an der der Klick stattfand.	Ja
Y	Ganzzahl	Die y-Koordinate, an der der Klick stattfand.	Ja

CodeInterpreterFileOutput

Die Ausgabe eines Code-Interpreter-Tool-Aufrufs, der eine Datei ist.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
files	array		Ja
type	enum	Der Typ der Code-Interpreter-Datei, die ausgegeben wird. Immer `files`. Mögliche Werte: `files`	Ja

CodeInterpreterTextOutput

Die Ausgabe eines Code-Interpreter-Tool-Aufrufs, der Text ist.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
logs	string	Die Protokolle des Code-Interpreter-Tool-Aufrufs.	Ja
type	enum	Der Typ der Code-Interpreter-Textausgabe. Immer `logs`. Mögliche Werte: `logs`	Ja

CodeInterpreterTool

Ein Tool, das Code ausführt.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Datei-IDs	array	Die IDs der Dateien, auf denen der Code ausgeführt werden soll.	Ja
type	enum	Der Typ des Code-Interpreter-Tools. Immer `code_interpreter`. Mögliche Werte: `code_interpreter`	Ja

CodeInterpreterToolCall

Ein Toolaufruf, um Code auszuführen.

Name	Typ	Beschreibung	Erforderlich
code	string	Der Code zum Laufen.	Ja
id	string	Die eindeutige ID des Code-Interpreter-Tool-Aufrufs.	Ja
results	array	Die Ergebnisse des Code-Interpreter-Tool-Aufrufs.	Ja
Status	enum	Der Status des Code-Interpreter-Tool-Aufrufs. Mögliche Werte: `in_progress`, `interpreting`, `completed`	Ja
type	enum	Der Typ des Code-Interpreter-Tool-Aufrufs. Immer `code_interpreter_call`. Mögliche Werte: `code_interpreter_call`	Ja

CodeInterpreterToolOutput

Diese Komponente kann eine der folgenden sein:

CodeInterpreterTextOutput
CodeInterpreterFileOutput

ComparisonFilter

Ein Filter, der verwendet wird, um einen bestimmten Attributschlüssel mit einem bestimmten Wert zu vergleichen, indem er eine definierte Vergleichsoperation verwendet.

Name	Typ	Beschreibung	Erforderlich
Schlüssel	string	Der Schlüssel ist, den Wert zu vergleichen.	Ja
type	enum	Spezifiziert den Vergleichsoperator: `eq`, `ne`, , `gtgte`, `lt`, . `lte` - `eq`: gleich - `ne`: nicht gleich - `gt`: größer als - `gte`: größer als oder gleich - `lt`: weniger als - `lte`: weniger als oder gleich Mögliche Werte: `eq`, `ne`, , `gtgte`, `lt`,`lte`	Ja
value	String oder Number oder Boolean	Der zu vergleichende Wert mit dem Attributschlüssel; unterstützt Zeichenketten-, Zahlen- oder Boolean-Typen.	Ja

CompoundFilter

Kombinieren Sie mehrere Filter mit and oder or.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Filter	array	Ein Filter-Array zum Kombinieren. Gegenstände können `ComparisonFilter` sein oder `CompoundFilter`.	Ja
type	enum	Art der Operation: `and` oder `or`. Mögliche Werte: `and`, `or`	Ja

ComputerAction

Diese Komponente kann eine der folgenden sein:

Click
DoubleClick
Drag
KeyPress
Move
Screenshot
Scroll
Typ
Warten

ComputerScreenshotImage

Ein Computer-Screenshot-Bild, das mit dem Computerwerkzeug verwendet wird.

Name	Typ	Beschreibung	Erforderlich
Datei-ID	string	Die Identifikatorin einer hochgeladenen Datei, die den Screenshot enthält.	No
image_url	string	Die URL des Screenshots.	No
type	enum	Spezifiziert den Ereignistyp. Für einen Computerscreenshot ist diese Eigenschaft immer auf `computer_screenshot`gesetzt. Mögliche Werte: `computer_screenshot`	Ja

ComputerTool

Ein Werkzeug, das einen virtuellen Computer steuert.

Name	Typ	Beschreibung	Erforderlich
Anzeigehöhe	number	Die Höhe des Computerbildschirms.	Ja
Bildschirmbreite	number	Die Breite des Computerbildschirms.	Ja
environment	enum	Die Art von Computerumgebung, die gesteuert werden soll. Mögliche Werte: `mac`, `windows`, `ubuntu`, `browser`	Ja
type	enum	Die Art des Computerwerkzeugs. Immer `computer_use_preview`. Mögliche Werte: `computer-use-preview`	Ja

ComputerToolCall

Ein Werkzeugaufruf an ein Computerwerkzeug.

Name	Typ	Beschreibung	Erforderlich
action	ComputerAction		Ja
call_id	string	Ein Identifikator, der beim Antworten auf den Werkzeugaufruf mit Ausgabe verwendet wird.	Ja
id	string	Die eindeutige ID des Computeranrufs.	Ja
pending_safety_checks	array	Die ausstehenden Sicherheitskontrollen für den Computeranruf.	Ja
Status	enum	Der Status des Gegenstands. Einer von `in_progress`, `completed`, oder `incomplete`. Wird angezeigt, wenn Items über die API zurückgegeben werden. Mögliche Werte: `in_progress`, `completed`, `incomplete`	Ja
type	enum	Die Art des Computeranrufs. Immer `computer_call`. Mögliche Werte: `computer_call`	Ja

ComputerToolCallOutput

Die Ausgabe eines Computerwerkzeuganrufs.

Name	Typ	Beschreibung	Erforderlich
acknowledged_safety_checks	array	Die Sicherheitsprüfungen, die von der API gemeldet wurden und vom Entwickler bestätigt wurden.	No
call_id	string	Die ID des Computeraufrufs, der die Ausgabe erzeugte.	Ja
id	string	Die ID des Computerwerkzeug-Aufrufs gibt aus.	No
Ausgabe	ComputerScreenshotImage	Ein Computer-Screenshot-Bild, das mit dem Computerwerkzeug verwendet wird.	Ja
Status	enum	Der Status der Nachrichteneingabe. Einer von `in_progress`, `completed`, oder `incomplete`. Gefüllt, wenn Eingabeeinträge über die API zurückgegeben werden. Mögliche Werte: `in_progress`, `completed`, `incomplete`	No
type	enum	Der Typ des Computerwerkzeugs ruft die Ausgabe. Immer `computer_call_output`. Mögliche Werte: `computer_call_output`	Ja

ComputerToolCallOutputResource

Name	Typ	Beschreibung	Erforderlich
acknowledged_safety_checks	array	Die Sicherheitsprüfungen, die von der API gemeldet wurden und vom Entwickler bestätigt wurden.	No
call_id	string	Die ID des Computeraufrufs, der die Ausgabe erzeugte.	Ja
id	string	Die eindeutige ID des Computer-Aufrufwerkzeugs.	Ja
Ausgabe	ComputerScreenshotImage	Ein Computer-Screenshot-Bild, das mit dem Computerwerkzeug verwendet wird.	Ja
Status	enum	Der Status der Nachrichteneingabe. Einer von `in_progress`, `completed`, oder `incomplete`. Gefüllt, wenn Eingabeeinträge über die API zurückgegeben werden. Mögliche Werte: `in_progress`, `completed`, `incomplete`	No
type	enum	Der Typ des Computerwerkzeugs ruft die Ausgabe. Immer `computer_call_output`. Mögliche Werte: `computer_call_output`	Ja

ComputerToolCallSafetyCheck

Eine bevorstehende Sicherheitsüberprüfung für den Computeranruf.

Name	Typ	Beschreibung	Erforderlich
code	string	Die Art der bevorstehenden Sicherheitsüberprüfung.	Ja
id	string	Der Ausweis der ausstehenden Sicherheitskontrolle.	Ja
Nachricht	string	Details zur ausstehenden Sicherheitsprüfung.	Ja

Content

Multimodale Eingabe- und Ausgabeinhalte.

Diese Komponente kann eine der folgenden sein:

InputContent
OutputContent

Coordinate

Ein x/y-Koordinatenpaar, z. B. { x: 100, y: 200 }.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
x	Ganzzahl	Die x-Koordinate.	Ja
Y	Ganzzahl	Die y-Koordinate.	Ja

CreateModelResponseProperties

Name	Typ	Beschreibung	Erforderlich	Vorgabe
metadata	Metadata	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern und Objekte über die API oder das Dashboard abzufragen. Tasten sind Zeichenketten mit einer maximalen Länge von 64 Zeichen. Werte sind Zeichenketten mit einer maximalen Länge von 512 Zeichen.	No
Modell	string	Modell, das zur Erzeugung der Antworten verwendet wird.	No
Temperatur	number	Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen. Wir empfehlen im Allgemeinen, dies zu ändern oder `top_p` , aber nicht beides.	No	1
top_p	number	Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden. Wir empfehlen im Allgemeinen, dies zu ändern oder `temperature` , aber nicht beides.	No	1
user	string	Eine eindeutige Identifikator, die Ihren Endnutzer repräsentiert und OpenAI helfen kann, Missbrauch zu überwachen und zu erkennen. .	No

createResponse

Name	Typ	Beschreibung	Erforderlich	Vorgabe
include	array	{"$ref": "#/components/schemas/includable/description"}	No
input	Saite oder Array	Text-, Bild- oder Dateieingaben für das Modell, die zur Erzeugung einer Antwort verwendet werden.	Ja
Anweisungen	string	Fügt eine System- (oder Entwickler-) Nachricht als erstes Element im Kontext des Modells ein. Wenn man zusammen mit `previous_response_id`verwendet, werden die Anweisungen aus einer vorherigen Antwort nicht auf die nächste Antwort übernommen. Dadurch ist es einfach, System- (oder Entwickler-) Nachrichten in neuen Antworten auszutauschen.	No
max_output_tokens	Ganzzahl	Eine obere Schranke für die Anzahl der Tokens, die für eine Antwort generiert werden können, einschließlich sichtbarer Ausgabetoken und Reasoning-Tokens.	No
Parallele Werkzeugaufrufe	Boolescher Wert	Ob das Modell Werkzeugaufrufe parallel ausführen soll.	No	Richtig
previous_response_id	string	Die eindeutige ID der vorherigen Antwort auf das Modell. Nutzen Sie dies, um Gespräche mit mehreren Runden zu erstellen.	No
reasoning	Reasoning	Konfigurationsoptionen für Schlussfolgermodelle.	No
store	Boolescher Wert	Ob die generierte Modellantwort für eine spätere Abruf über die API gespeichert werden soll.	No	Richtig
stream	Boolescher Wert	Wenn auf true gesetzt, werden die Antwortdaten des Modells an den Client gestreamt, während sie mithilfe von Server-gesendeten Ereignissen generiert werden.	No	Falsch
Text	Objekt	Konfigurationsoptionen für eine Textantwort des Modells. Es können Klartext oder strukturierte JSON-Daten sein. Erfahren Sie mehr: - Texteingaben und -ausgaben - Strukturierte Ausgaben	No
└─ Format	TextResponseFormatConfiguration	Ein Objekt, das das Format angibt, das das Modell ausgeben muss. Die Konfiguration `{ "type": "json_schema" }` aktiviert strukturierte Ausgaben, die sicherstellen, dass das Modell mit dem bereitgestellten JSON-Schema übereinstimmt. Das Standardformat ist `{ "type": "text" }` ohne zusätzliche Optionen. Nicht empfohlen für GPT-4o und neuere Modelle: Einstellung aktiviert den `{ "type": "json_object" }` älteren JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültiges JSON ist. Die Verwendung `json_schema` ist bevorzugt für Modelle, die sie unterstützen.	No
tool_choice	ToolChoiceOptions oder ToolChoiceTypes oder ToolChoiceFunction	Wie das Modell auswählen sollte, welches Tool (oder welche Werkzeuge) es bei der Generierung einer Antwort verwendet. Sehen Sie sich den Parameter `tools` an, um zu sehen, welche Werkzeuge das Modell aufrufen kann.	No
tools	array	Ein Array von Werkzeugen, die das Modell aufrufen kann, während es eine Antwort erzeugt. Du kannst angeben, welches Werkzeug du verwenden sollst, indem du den Parameter `tool_choice` einlegst. Die zwei Kategorien von Werkzeugen, die Sie dem Modell bereitstellen können, sind: - Eingebaute Werkzeuge	No
truncation	enum	Die Abschneidungsstrategie, die für die Modellantwort verwendet werden soll. - `auto`: Wenn der Kontext dieser Antwort und der vorherigen die Größe des Kontextfensters des Modells übersteigt, wird das Modell die Antwort, um ins Kontextfenster zu passen, indem man Eingabepunkte mitten im Gespräch platziert. - `disabled` (Standard): Wenn eine Modellantwort die Kontextfenstergröße eines Modells überschreitet, schlägt die Anfrage mit einem Fehler von 400 fehl. Mögliche Werte: `auto`, `disabled`	No

DoubleClick

Eine Doppelklick-Aktion.

Name	Typ	Beschreibung	Erforderlich
type	enum	Spezifiziert den Ereignistyp. Für eine Doppelklickaktion ist diese Eigenschaft immer auf `double_click`gesetzt. Mögliche Werte: `double_click`	Ja
x	Ganzzahl	Die x-Koordinate, an der der Doppelklick stattfand.	Ja
Y	Ganzzahl	Die y-Koordinate, an der der Doppelklick stattfand.	Ja

Ziehen

Eine Drag-Action.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
path	array	Ein Koordinatenarray, das den Weg der Dragaktion darstellt. Koordinaten erscheinen als ein Array von Objekten, z. B.`[{ x: 100, y: 200 }, { x: 200, y: 300 }]`	Ja
type	enum	Spezifiziert den Ereignistyp. Für eine Drag-Aktion ist diese Eigenschaft immer auf `drag`gesetzt. Mögliche Werte: `drag`	Ja

EasyInputMessage

Eine Nachrichteneingabe an das Modell mit einer Rolle, die eine Instruktion angibt, die der Hierarchie folgt. Anweisungen, die mit der oder developer Rolle system gegeben werden, haben Vorrang vor den Anweisungen der jeweiligen user Rolle. Nachrichten mit der Rolle assistant werden angenommen, dass sie vom Modell in früheren Interaktionen generiert wurden.

Name	Typ	Beschreibung	Erforderlich
Inhalt	String oder InputMessageContentList	Text-, Bild- oder Audioeingaben für das Modell, die zur Erzeugung einer Antwort verwendet werden. Kann auch Antworten früherer Assistenten enthalten.	Ja
Rolle	enum	Die Rolle der Nachrichteneingabe. Einer von `user`, `assistant`, , `system`oder `developer`. Mögliche Werte: `user`, `assistant`, `system`, `developer`	Ja
type	enum	Der Typ der Nachrichteneingabe. Immer `message`. Mögliche Werte: `message`	No

FileCitation

Ein Zitat für eine Akte.

Name	Typ	Beschreibung	Erforderlich
Datei-ID	string	Die ID der Akte.	Ja
index	Ganzzahl	Der Index der Datei in der Liste der Dateien.	Ja
type	enum	Der Typ der Aktenbelegung. Immer `file_citation`. Mögliche Werte: `file_citation`	Ja

FilePath

Ein Pfad zu einer Datei.

Name	Typ	Beschreibung	Erforderlich
Datei-ID	string	Die ID der Akte.	Ja
index	Ganzzahl	Der Index der Datei in der Liste der Dateien.	Ja
type	enum	Der Typ des Dateipfads. Immer `file_path`. Mögliche Werte: `file_path`	Ja

FileSearchRanker

Der Ranker für die Dateisuche. Falls nicht angegeben, werde ich den auto Ranker verwenden.

Eigentum	Wert
Beschreibung	Der Ranker für die Dateisuche. Falls nicht angegeben, werde ich den `auto` Ranker verwenden.
Typ	string
Werte	`auto` `default_2024_08_21`

FileSearchTool

Ein Tool, das relevante Inhalte aus hochgeladenen Dateien sucht.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Filter	ComparisonFilter oder CompoundFilter	Ein Filter, der basierend auf Dateiattributen angewendet wird.	No
max_anzahl_ergebnisse	Ganzzahl	Die maximale Anzahl an Ergebnissen, die du ergeben kannst. Diese Zahl sollte zwischen 1 und 50 liegen.	No
Ranglistenoptionen	Objekt	Rangfolgeoptionen für die Suche.	No
└– Ranker	enum	Der Ranker für die Dateisuche. Mögliche Werte: `auto`, `default-2024-11-15`	No
└─ Punktschwelle	number	Die Punktschwelle für die Dateisuche, eine Zahl zwischen 0 und 1. Zahlen näher bei 1 versuchen, nur die relevantesten Ergebnisse zurückzugeben, können aber weniger Ergebnisse liefern.	No	0
type	enum	Der Typ des Dateisuchtools. Immer `file_search`. Mögliche Werte: `file_search`	Ja
vector_store_ids	array	Die IDs des Vektors, die durchsucht werden sollen, speichern.	Ja

FileSearchToolCall

Die Ergebnisse eines Dateisuchwerkzeugs aufrufen.

Name	Typ	Beschreibung	Erforderlich
id	string	Die eindeutige ID des Dateisuchwerkzeugs aufruft.	Ja
Abfragen	array	Die Abfragen wurden verwendet, um nach Dateien zu suchen.	Ja
results	array	Die Ergebnisse des Dateisuchwerkzeugs rufen auf.	No
Status	enum	Der Status des Dateisuchwerkzeugaufrufs. Einer von `in_progress`, `searching`, `incomplete` oder `failed`, Mögliche Werte: `in_progress`, `searching`, `completed`, `incomplete`, `failed`	Ja
type	enum	Der Typ des Dateisuch-Tool-Aufrufs. Immer `file_search_call`. Mögliche Werte: `file_search_call`	Ja

FunctionTool

Definiert eine Funktion in deinem eigenen Code, den das Modell aufrufen kann.

Name	Typ	Beschreibung	Erforderlich
Beschreibung	string	Eine Beschreibung der Funktion. Wird vom Modell verwendet, um zu bestimmen, ob die Funktion aufgerufen werden soll oder nicht.	No
Name	string	Der Name der Funktion, die aufgerufen werden soll.	Ja
parameters	Objekt	Ein JSON-Schema-Objekt, das die Parameter der Funktion beschreibt.	Ja
strict	Boolescher Wert	Ob eine strikte Parametervalidierung durchgesetzt werden soll. Standard.`true`	Ja
type	enum	Der Typ des Funktionswerkzeugs. Immer `function`. Mögliche Werte: `function`	Ja

FunctionToolCall

Ein Werkzeugaufruf, um eine Funktion auszuführen.

Name	Typ	Beschreibung	Erforderlich
Argumente	string	Eine JSON-Zeichenkette der Argumente, die an die Funktion übergeben werden sollen.	Ja
call_id	string	Die eindeutige ID des vom Modell generierten Funktionswerkzeugaufrufs.	Ja
id	string	Die eindeutige ID des Aufrufs des Funktionswerkzeugs.	Ja
Name	string	Der Name der zu ausführenden Funktion.	Ja
Status	enum	Der Status des Gegenstands. Einer von `in_progress`, `completed`, oder `incomplete`. Wird angezeigt, wenn Items über die API zurückgegeben werden. Mögliche Werte: `in_progress`, `completed`, `incomplete`	No
type	enum	Der Typ des Funktionswerkzeugaufrufs. Immer `function_call`. Mögliche Werte: `function_call`	Ja

FunctionToolCallOutput

Die Ausgabe eines Funktionswerkzeugaufrufs.

Name	Typ	Beschreibung	Erforderlich
call_id	string	Die eindeutige ID des vom Modell generierten Funktionswerkzeugaufrufs.	Ja
id	string	Die eindeutige ID des Aufrufs des Funktionswerkzeugs. Wird ausgefüllt, wenn dieses Element über die API zurückgegeben wird.	No
Ausgabe	string	Ein JSON-String der Ausgabe des Funktionswerkzeugaufrufs.	Ja
Status	enum	Der Status des Gegenstands. Einer von `in_progress`, `completed`, oder `incomplete`. Wird angezeigt, wenn Items über die API zurückgegeben werden. Mögliche Werte: `in_progress`, `completed`, `incomplete`	No
type	enum	Der Typ des Funktionswerkzeugs ruft die Ausgabe auf. Immer `function_call_output`. Mögliche Werte: `function_call_output`	Ja

FunctionToolCallOutputResource

Name	Typ	Beschreibung	Erforderlich
call_id	string	Die eindeutige ID des vom Modell generierten Funktionswerkzeugaufrufs.	Ja
id	string	Die eindeutige ID des Funktionsaufruf-Tool-Outputs.	Ja
Ausgabe	string	Ein JSON-String der Ausgabe des Funktionswerkzeugaufrufs.	Ja
Status	enum	Der Status des Gegenstands. Einer von `in_progress`, `completed`, oder `incomplete`. Wird angezeigt, wenn Items über die API zurückgegeben werden. Mögliche Werte: `in_progress`, `completed`, `incomplete`	No
type	enum	Der Typ des Funktionswerkzeugs ruft die Ausgabe auf. Immer `function_call_output`. Mögliche Werte: `function_call_output`	Ja

includable

Geben Sie zusätzliche Ausgabedaten an, die in die Modellantwort aufgenommen werden sollen. Derzeit unterstützte Werte sind:

file_search_call.results: Fügen Sie die Suchergebnisse des Dateisuchwerkzeugaufrufs ein.
message.input_image.image_url: Fügen Sie Bild-URLs aus der Eingabenachricht hinzu.
computer_call_output.output.image_url: Bild-URLs aus der Ausgabe des Computeraufrufs einfügen.

Eigentum	Wert
Beschreibung	Geben Sie zusätzliche Ausgabedaten an, die in die Modellantwort aufgenommen werden sollen. Derzeit unterstützte Werte sind: - `file_search_call.results`: Fügen Sie die Suchergebnisse des Dateisuchwerkzeugaufrufs ein. - `message.input_image.image_url`: Fügen Sie Bild-URLs aus der Eingabenachricht hinzu. - `computer_call_output.output.image_url`: Bild-URLs aus der Ausgabe des Computeraufrufs einfügen.
Typ	string
Werte	`file_search_call.results` `message.input_image.image_url` `computer_call_output.output.image_url`

InputAudio

Ein Audioeingang zum Modell.

Name	Typ	Beschreibung	Erforderlich
data	string	Base64-kodierte Audiodaten.	Ja
Format	enum	Das Format der Audiodaten. Derzeit unterstützte Formate sind `mp3` und `wav`. Mögliche Werte: `mp3`, `wav`	Ja
type	enum	Der Typ des Eingabeelements. Immer `input_audio`. Mögliche Werte: `input_audio`	Ja

InputContent

Diese Komponente kann eine der folgenden sein:

InputText
InputImage
InputFile

InputFile

Eine Dateieingabe für das Modell.

Name	Typ	Beschreibung	Erforderlich
file_data	string	Der Inhalt der Datei, die an das Modell gesendet werden soll.	No
Datei-ID	string	Die ID der Datei, die an das Modell gesendet werden soll.	No
filename	string	Der Name der Datei, die an das Modell gesendet werden soll.	No
type	enum	Der Typ des Eingabeelements. Immer `input_file`. Mögliche Werte: `input_file`	Ja

InputImage

Eine Bildeingabe für das Modell.

Name	Typ	Beschreibung	Erforderlich
detail	enum	Das Detailniveau des Bildes, das an das Modell gesendet werden soll. Einer von `high`, `low`, oder `auto`. Standardmäßig gilt `auto`. Mögliche Werte: `high`, `low`, `auto`	Ja
Datei-ID	string	Die ID der Datei, die an das Modell gesendet werden soll.	No
image_url	string	Die URL des Bildes, das an das Modell gesendet werden soll. Eine vollständig qualifizierte URL oder base64-kodiertes Bild in einer Daten-URL.	No
type	enum	Der Typ des Eingabeelements. Immer `input_image`. Mögliche Werte: `input_image`	Ja

InputItem

Diese Komponente kann eine der folgenden sein:

EasyInputMessage
Element
ItemReference

Eingabenachricht

Name	Typ	Beschreibung	Erforderlich
Inhalt	InputMessageContentList	Eine Liste von einem oder mehreren Eingabeelementen für das Modell, die unterschiedliche Inhalte enthalten types.	Ja
Rolle	enum	Die Rolle der Nachrichteneingabe. Einer von `user`, `system`, oder `developer`. Mögliche Werte: `user`, `system`, `developer`	Ja
Status	enum	Der Status des Artikels. Einer von `in_progress`, `completed`, oder `incomplete`. Wird angezeigt, wenn Items über die API zurückgegeben werden. Mögliche Werte: `in_progress`, `completed`, `incomplete`	No
type	enum	Der Typ der Nachrichteneingabe. Immer auf gestellt `message`. Mögliche Werte: `message`	No

InputMessageContentList

Eine Liste eines oder mehrerer Eingabeelemente für das Modell, die verschiedene Inhaltstypen enthalten.

Für diese Komponente sind keine Eigenschaften definiert.

InputMessageResource

Name	Typ	Beschreibung	Erforderlich
Inhalt	InputMessageContentList	Eine Liste von einem oder mehreren Eingabeelementen für das Modell, die unterschiedliche Inhalte enthalten types.	Ja
id	string	Die eindeutige ID der Nachrichteneingabe.	Ja
Rolle	enum	Die Rolle der Nachrichteneingabe. Einer von `user`, `system`, oder `developer`. Mögliche Werte: `user`, `system`, `developer`	Ja
Status	enum	Der Status des Artikels. Einer von `in_progress`, `completed`, oder `incomplete`. Wird angezeigt, wenn Items über die API zurückgegeben werden. Mögliche Werte: `in_progress`, `completed`, `incomplete`	No
type	enum	Der Typ der Nachrichteneingabe. Immer auf gestellt `message`. Mögliche Werte: `message`	No

InputText

Eine Texteingabe für das Modell.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Text	string	Die Texteingabe für das Modell.	Ja
type	enum	Der Typ des Eingabeelements. Immer `input_text`. Mögliche Werte: `input_text`	Ja

Element

Ein Inhaltselement wird verwendet, um eine Antwort zu erzeugen.

Diese Komponente kann eine der folgenden sein:

InputMessage
OutputMessage
FileSearchToolCall
ComputerToolCall
ComputerToolCallOutput
FunctionToolCall
FunctionToolCallOutput
ReasoningItem

ItemReference

Eine interne Kennung für ein Element zum Referenzieren.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
id	string	Die ID des Artikels, auf den man sich beziehen kann.	Ja
type	enum	Die Art des Artikels, auf den man sich beziehen sollte. Immer `item_reference`. Mögliche Werte: `item_reference`	Ja

ItemResource

Ein Inhaltselement wird verwendet, um eine Antwort zu erzeugen.

Diese Komponente kann eine der folgenden sein:

InputMessageResource
OutputMessage
FileSearchToolCall
ComputerToolCall
ComputerToolCallOutputResource
FunctionToolCall
FunctionToolCallOutputResource

KeyPress

Eine Sammlung von Tastendrücken, die das Modell ausführen möchte.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
keys	array	Die Kombination der Tasten, die das Modell anfordert, gedrückt zu werden. Dies ist ein Array von Strings, von denen jeder einen Schlüssel darstellt.	Ja
type	enum	Spezifiziert den Ereignistyp. Für eine Tastendruckaktion ist diese Eigenschaft immer auf `keypress`gesetzt. Mögliche Werte: `keypress`	Ja

Metadaten

Tasten sind Zeichenketten mit einer maximalen Länge von 64 Zeichen. Werte sind Zeichenketten mit einer maximalen Länge von 512 Zeichen.

Für diese Komponente sind keine Eigenschaften definiert.

ModelResponseProperties

Name	Typ	Beschreibung	Erforderlich	Vorgabe
metadata	Metadata	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern und Objekte über die API oder das Dashboard abzufragen. Tasten sind Zeichenketten mit einer maximalen Länge von 64 Zeichen. Werte sind Zeichenketten mit einer maximalen Länge von 512 Zeichen.	No
Modell	string	Modell, das zur Erzeugung der Antworten verwendet wird.	No
Temperatur	number	Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen. Wir empfehlen im Allgemeinen, dies zu ändern oder `top_p` , aber nicht beides.	No	1
top_p	number	Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden. Wir empfehlen im Allgemeinen, dies zu ändern oder `temperature` , aber nicht beides.	No	1
user	string	Eine eindeutige Identifikator, die Ihren Endnutzer repräsentiert und OpenAI helfen kann, Missbrauch zu überwachen und zu erkennen. .	No

Verschieben

Eine Mausbewegung.

Name	Typ	Beschreibung	Erforderlich
type	enum	Spezifiziert den Ereignistyp. Für eine Bewegungsaktion ist diese Eigenschaft immer auf `move`gesetzt. Mögliche Werte: `move`	Ja
x	Ganzzahl	Die x-Koordinate, zu der man wechseln soll.	Ja
Y	Ganzzahl	Die y-Koordinate, zu der man wechseln soll.	Ja

OutputAudio

Ein Audioausgang vom Modell.

Name	Typ	Beschreibung	Erforderlich
data	string	Base64-kodierte Audiodaten aus dem Modell.	Ja
Abschrift	string	Das Transkript der Audiodaten aus dem Modell.	Ja
type	enum	Die Art des Ausgangsaudios. Immer `output_audio`. Mögliche Werte: `output_audio`	Ja

OutputContent

Diese Komponente kann eine der folgenden sein:

OutputText
Refusal

OutputItem

Name	Typ	Beschreibung	Erforderlich
action	ComputerAction		Ja
Argumente	string	Eine JSON-Zeichenkette der Argumente, die an die Funktion übergeben werden sollen.	Ja
call_id	string	Ein Identifikator, der beim Antworten auf den Werkzeugaufruf mit Ausgabe verwendet wird.	Ja
Inhalt	array	Rationalisieren des Textinhalts.	Ja
id	string	Der eindeutige Identifikator des Argumentationsins.	Ja
Name	string	Der Name der zu ausführenden Funktion.	Ja
pending_safety_checks	array	Die ausstehenden Sicherheitskontrollen für den Computeranruf.	Ja
Abfragen	array	Die Abfragen wurden verwendet, um nach Dateien zu suchen.	Ja
results	array	Die Ergebnisse des Dateisuchwerkzeugs rufen auf.	No
Rolle	enum	Die Rolle der Ausgabenachricht. Immer `assistant`. Mögliche Werte: `assistant`	Ja
Status	enum	Der Status des Gegenstands. Einer von `in_progress`, `completed`, oder `incomplete`. Wird angezeigt, wenn Items über die API zurückgegeben werden. Mögliche Werte: `in_progress`, `completed`, `incomplete`	Ja
type	enum	Die Art des Objekts. Immer `reasoning`. Mögliche Werte: `reasoning`	Ja

OutputMessage

Eine Ausgabemeldung vom Modell.

Name	Typ	Beschreibung	Erforderlich
Inhalt	array	Der Inhalt der Ausgabebotschaft.	Ja
id	string	Die eindeutige ID der Ausgabenachricht.	Ja
Rolle	enum	Die Rolle der Ausgabenachricht. Immer `assistant`. Mögliche Werte: `assistant`	Ja
Status	enum	Der Status der Nachrichteneingabe. Einer von `in_progress`, `completed`, oder `incomplete`. Gefüllt, wenn Eingabeeinträge über die API zurückgegeben werden. Mögliche Werte: `in_progress`, `completed`, `incomplete`	Ja
type	enum	Der Typ der Ausgabenachricht. Immer `message`. Mögliche Werte: `message`	Ja

OutputText

Eine Textausgabe vom Modell.

Name	Typ	Beschreibung	Erforderlich
annotations	array	Die Annotationen der Textausgabe.	Ja
Text	string	Die Textausgabe vom Modell.	Ja
type	enum	Der Typ des Ausgabetextes. Immer `output_text`. Mögliche Werte: `output_text`	Ja

RealtimeSessionCreateRequest

Echtzeit-Konfiguration von Sitzungsobjekten.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
input_audio_format	enum	Das Format des Eingabeaudios. Optionen sind `pcm16`, `g711_ulaw`, oder `g711_alaw`. Für `pcm16`muss das Eingangsaudio 16-Bit-PCM mit einer Abtastrate von 24 kHz, Einkanal-(Mono) und Little-Endian-Byte-Ordnung sein. Mögliche Werte: `pcm16`, `g711_ulaw`, `g711_alaw`	No
input_audio_noise_reduction	Objekt	Konfiguration zur Rauschreduktion des Eingangs-Audios. Dieser kann auf `null` ausgeschaltet eingestellt werden. Rauschunterdrückung filtert Audio, der dem Eingangs-Audiopuffer hinzugefügt wird, bevor er an VAD und das Modell gesendet wird. Das Filtern des Audios kann die Genauigkeit von VAD und Kurvenerkennung verbessern (Fehlalarme reduzieren) und die Leistung modellieren, indem die Wahrnehmung des Eingabetons verbessert wird.	No
└– Typ	enum	Art der Lärmunterdrückung. `near_field` ist für nah sprechende Mikrofone wie Kopfhörer, `far_field` ist für Fernfeldmikrofone wie Laptop- oder Konferenzraummikrofone. Mögliche Werte: `near_field`, `far_field`	No
input_audio_transcription	Objekt	Die Konfiguration für die Eingangs-Audiotranskription ist standardmäßig auf aus eingestellt und kann so `null` eingestellt werden, dass sie sich nach Einschalten ausschaltet. Eingabe-Audiotranskription ist nicht native im Modell, da das Modell Audio direkt konsumiert. Die Transkription läuft asynchron über das Transkriptions-Endpunkt und sollte als Leitfaden für die Eingabe-Audioinhalte behandelt werden, statt als genau das, was das Modell gehört hat. Der Kunde kann optional die Sprache und den Prompt für die Transkription einstellen; diese bieten dem Transkriptionsdienst zusätzliche Orientierung.	No
└– Sprache	string	Die Sprache des eingegebenen Audios. Die Bereitstellung der Eingabesprache im ISO-639-1 (z. B. `en`) Format verbessert die Genauigkeit und Latenz.	No
└─ Modell	string	Das Modell für die Transkription, aktuelle Optionen sind `gpt-4o-transcribe`, `gpt-4o-mini-transcribe`, , `gpt-4o-mini-transcribe-2025-12-15`und `whisper-1`.	No
└– Eingabeaufforderung	string	Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen. Für `whisper-1`, ist der Prompt eine Liste von Schlüsselwörtern. Für `gpt-4o-transcribe` Modelle ist die Aufforderung eine Freitextzeichenkette, zum Beispiel "erwarten Sie Wörter, die mit Technologie zu tun haben".	No
Anweisungen	string	Die Standard-Systeminstruktionen (d. h. Systemnachricht) wurden vorangestellt, um Modellaufrufe zu erstellen. Dieses Feld ermöglicht es dem Client, das Modell anhand der gewünschten Antworten zu steuern. Das Modell kann zum Inhalt und Format der Antwort angewiesen werden (z. B. "sehr prägnant sein", "freundlich handeln", "hier sind Beispiele für gute Antworten") und zum Audioverhalten (z. B. "schnell sprechen", "Emotion in deine Stimme einbringen", "häufig lachen"). Die Anweisungen werden nicht garantiert vom Modell befolgt, aber sie geben dem Modell Hinweise auf das gewünschte Verhalten. Beachten Sie, dass der Server Standardbefehle setzt, die verwendet werden, wenn dieses Feld nicht gesetzt ist und zu Beginn der Sitzung im `session.created` Event sichtbar sind.	No
max_response_output_tokens	Ganzzahl oder String	Maximale Anzahl von Ausgabetoken für eine einzelne Assistentenantwort, einschließlich Werkzeugaufrufe. Geben Sie eine ganze Zahl zwischen 1 und 4096 an, um die Ausgabetoken zu begrenzen oder `inf` für die maximal verfügbaren Token für ein bestimmtes Modell. Standardmäßig gilt `inf`.	No
modalities		Die Menge der Modalitäten, mit denen das Modell antworten kann. Um Audio zu deaktivieren, setze dies auf ["text"].	No
Modell	string	Der Name der für diese Sitzung verwendeten Einsatz.	No
output_audio_format	enum	Das Format der Ausgabe des Audios. Optionen sind `pcm16`, `g711_ulaw`, oder `g711_alaw`. Für `pcm16`wird das Ausgangsaudio mit einer Frequenz von 24 kHz abgetastet. Mögliche Werte: `pcm16`, `g711_ulaw`, `g711_alaw`	No
Temperatur	number	Stichprobentemperatur für das Modell, begrenzt auf [0,6, 1,2]. Für Audiomodelle wird eine Temperatur von 0,8 für die beste Leistung sehr empfohlen.	No	0.8
tool_choice	string	Wie das Modell Werkzeuge auswählt. Optionen sind `auto`, `none`, , `required`oder geben Sie eine Funktion an.	No	auto
tools	array	Werkzeuge (Funktionen), die dem Modell zur Verfügung stehen.	No
turn_detection	Objekt	Konfiguration für Zugerkennung, entweder Server-VAD oder semantisches VAD. Dies kann auf `null` deaktiviert eingestellt werden, wobei der Client die Modellantwort manuell auslösen muss. Server-VAD bedeutet, dass das Modell den Beginn und das Ende der Sprache basierend auf der Lautstärke erkennt und am Ende der Benutzersprache antwortet. Semantisches VAD ist fortschrittlicher und verwendet ein Dreherkennungsmodell (in Verbindung mit VAD), um semantisch zu schätzen, ob der Benutzer mit dem Sprechen fertig ist, und setzt dann dynamisch eine Auszeit basierend auf dieser Wahrscheinlichkeit. Wenn zum Beispiel der User-Audio mit `uhhm`abklingt, wird das Modell eine geringe Wahrscheinlichkeit für das Ende der Zuge erzielen und länger warten, bis der Benutzer weiterspricht. Das kann für natürlichere Gespräche nützlich sein, kann aber eine höhere Latenz haben.	No
└– create_response	Boolescher Wert	Ob automatisch eine Antwort generiert werden soll, wenn ein VAD-Stopp-Event auftritt.	No	Richtig
└– Eifer	enum	Wird nur für den `semantic_vad` Modus verwendet. Die Bereitschaft des Modells zu reagieren. `low` Er wartet länger, bis der Nutzer weiterspricht, antwortet `high` schneller. `auto` ist der Standard und äquivalent zu `medium`. Mögliche Werte: `low`, `medium`, `high`, `auto`	No
└– interrupt_response	Boolescher Wert	Ob man eine laufende Antwort automatisch unterbrechen soll, die zur Standardkonversation (d. h. `conversation` von `auto`) führt, wenn ein VAD-Startereignis auftritt.	No	Richtig
└– prefix_padding_ms	Ganzzahl	Wird nur für den `server_vad` Modus verwendet. Menge an Audio, die vor der Erkennung der Sprache (in Millisekunden) durch das VAD enthalten sein sollte. Standardmäßig liegt es auf 300 ms.	No
└– Dauer_der_Stille_in_ms	Ganzzahl	Wird nur für den `server_vad` Modus verwendet. Dauer der Stille zur Erkennung des Sprachstopps (in Millisekunden). Standardmäßig 500 ms. Bei kürzeren Werten reagiert das Modell schneller, kann aber bei kurzen Pausen des Nutzers eingreifen.	No
└– Schwellenwert	number	Wird nur für den `server_vad` Modus verwendet. Aktivierungsschwelle für VAD (0,0 bis 1,0) liegt standardmäßig bei 0,5. Ein höherer Schwellenwert erfordert lauteren Ton, um das Modell zu aktivieren, und kann daher in lauten Umgebungen besser abschneiden.	No
└– Typ	enum	Art der Abzugserkennung. Mögliche Werte: `server_vad`, `semantic_vad`	No
Stimme	VoiceIdsShared		No

RealtimeSessionCreateResponse

Eine neue Echtzeit-Session-Konfiguration mit einem flüchtigen Schlüssel. Die Standard-TTL für Tasten beträgt eine Minute.

Name	Typ	Beschreibung	Erforderlich
client_secret	Objekt	Ephemeraler Schlüssel, der von der API zurückgegeben wird.	Ja
└– abläuft_am	Ganzzahl	Zeitstempel für den Ablauf des Tokens. Derzeit laufen alle Token nach einer Minute ab.	No
└– Wert	string	Ephemeraler Schlüssel, der in Client-Umgebungen zur Authentifizierung von Verbindungen zur Echtzeit-API verwendet werden kann. Verwenden Sie dies in clientseitigen Umgebungen anstelle eines Standard-API-Tokens, das nur serverseitig verwendet werden sollte.	No
input_audio_format	string	Das Format des Eingabeaudios. Optionen sind `pcm16`, `g711_ulaw`, oder `g711_alaw`.	No
input_audio_transcription	Objekt	Die Konfiguration für die Eingangs-Audiotranskription ist standardmäßig auf aus eingestellt und kann so `null` eingestellt werden, dass sie sich nach Einschalten ausschaltet. Eingabe-Audiotranskription ist nicht native im Modell, da das Modell Audio direkt konsumiert. Die Transkription läuft asynchron über Whisper und sollte als grobe Anleitung betrachtet werden, statt als die vom Modell verstandene Darstellung.	No
└─ Modell	string	Das für die Transkription `whisper-1` verwendete Modell ist das einzige derzeit unterstützte Modell.	No
Anweisungen	string	Die Standard-Systeminstruktionen (d. h. Systemnachricht) wurden vorangestellt, um Modellaufrufe zu erstellen. Dieses Feld ermöglicht es dem Client, das Modell anhand der gewünschten Antworten zu steuern. Das Modell kann in Bezug auf Antwortinhalte und -format (z. B. "sehr knapp sein", "freundlich handeln", "hier sind Beispiele guter Antworten") und auf Audioverhalten (z. B. "schnell sprechen", "Emotion in deine Stimme einbringen", "häufig lachen"). Die Anweisungen werden nicht garantiert vom Modell befolgt, aber sie geben dem Modell Hinweise auf das gewünschte Verhalten. Beachten Sie, dass der Server Standardbefehle setzt, die verwendet werden, wenn dieses Feld nicht gesetzt ist und zu Beginn der Sitzung im `session.created` Event sichtbar sind.	No
max_response_output_tokens	Ganzzahl oder String	Maximale Anzahl von Ausgabetoken für eine einzelne Assistentenantwort, einschließlich Werkzeugaufrufe. Geben Sie eine ganze Zahl zwischen 1 und 4096 an, um die Ausgabetoken zu begrenzen oder `inf` für die maximal verfügbaren Token für ein bestimmtes Modell. Standardmäßig gilt `inf`.	No
modalities		Die Menge der Modalitäten, mit denen das Modell antworten kann. Um Audio zu deaktivieren, setze dies auf ["text"].	No
output_audio_format	string	Das Format der Ausgabe des Audios. Optionen sind `pcm16`, `g711_ulaw`, oder `g711_alaw`.	No
Temperatur	number	Stichprobentemperatur für das Modell, begrenzt auf [0,6, 1,2]. Standardmäßig auf 0,8 eingestellt.	No
tool_choice	string	Wie das Modell Werkzeuge auswählt. Optionen sind `auto`, `none`, , `required`oder geben Sie eine Funktion an.	No
tools	array	Werkzeuge (Funktionen), die dem Modell zur Verfügung stehen.	No
turn_detection	Objekt	Konfiguration für Abbiegungserkennung. Kann auf Schalten eingestellt `null` werden. Server-VAD bedeutet, dass das Modell den Beginn und das Ende der Sprache basierend auf der Lautstärke erkennt und am Ende der Benutzersprache antwortet.	No
└– prefix_padding_ms	Ganzzahl	Menge an Audio, die vor der Erkennung der Sprache (in Millisekunden) durch das VAD enthalten sein sollte. Standardmäßig liegt es auf 300 ms.	No
└– Dauer_der_Stille_in_ms	Ganzzahl	Dauer der Stille zur Erkennung des Sprachstopps (in Millisekunden). Standardmäßig 500 ms. Bei kürzeren Werten reagiert das Modell schneller, kann aber bei kurzen Pausen des Nutzers eingreifen.	No
└– Schwellenwert	number	Aktivierungsschwelle für VAD (0,0 bis 1,0) liegt standardmäßig bei 0,5. Ein höherer Schwellenwert erfordert lauteren Ton, um das Modell zu aktivieren, und kann daher in lauten Umgebungen besser abschneiden.	No
└– Typ	string	Die Art der Abzugserkennung wird derzeit nur `server_vad` unterstützt.	No
Stimme	VoiceIdsShared		No

RealtimeTranscriptionSessionCreateRequest

Echtzeit-Konfiguration von Transkriptionssitzungsobjekten.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
include	array	Die Sammlung von Elementen, die in die Transkription aufgenommen werden sollten. Derzeit verfügbare Artikel sind: - `item.input_audio_transcription.logprobs`	No
input_audio_format	enum	Das Format des Eingabeaudios. Optionen sind `pcm16`, `g711_ulaw`, oder `g711_alaw`. Für `pcm16`muss das Eingangsaudio 16-Bit-PCM mit einer Abtastrate von 24 kHz, Einkanal-(Mono) und Little-Endian-Byte-Ordnung sein. Mögliche Werte: `pcm16`, `g711_ulaw`, `g711_alaw`	No
input_audio_noise_reduction	Objekt	Konfiguration zur Rauschreduktion des Eingangs-Audios. Dieser kann auf `null` ausgeschaltet eingestellt werden. Rauschunterdrückung filtert Audio, der dem Eingangs-Audiopuffer hinzugefügt wird, bevor er an VAD und das Modell gesendet wird. Das Filtern des Audios kann die Genauigkeit von VAD und Kurvenerkennung verbessern (Fehlalarme reduzieren) und die Leistung modellieren, indem die Wahrnehmung des Eingabetons verbessert wird.	No
└– Typ	enum	Art der Lärmunterdrückung. `near_field` ist für nah sprechende Mikrofone wie Kopfhörer, `far_field` ist für Fernfeldmikrofone wie Laptop- oder Konferenzraummikrofone. Mögliche Werte: `near_field`, `far_field`	No
input_audio_transcription	Objekt	Konfiguration für Eingabe-Audio-Transkription. Der Kunde kann optional die Sprache und den Prompt für die Transkription einstellen; diese bieten dem Transkriptionsdienst zusätzliche Orientierung.	No
└– Sprache	string	Die Sprache des eingegebenen Audios. Die Bereitstellung der Eingabesprache im ISO-639-1 (z. B. `en`) Format verbessert die Genauigkeit und Latenz.	No
└─ Modell	enum	Das Modell für die Transkription, aktuelle Optionen sind `gpt-4o-transcribe`, `gpt-4o-transcribe-diarize`, , `gpt-4o-mini-transcribe`, `gpt-4o-mini-transcribe-2025-12-15`und `whisper-1`. Mögliche Werte: `gpt-4o-transcribe`, `gpt-4o-transcribe-diarize`, `gpt-4o-mini-transcribe`, `gpt-4o-mini-transcribe-2025-12-15`, `whisper-1`	No
└– Eingabeaufforderung	string	Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen. Für `whisper-1`, ist der Prompt eine Liste von Schlüsselwörtern. Für `gpt-4o-transcribe` Modelle ist die Aufforderung eine Freitextzeichenkette, zum Beispiel "erwarten Sie Wörter, die mit Technologie zu tun haben".	No
modalities		Die Menge der Modalitäten, mit denen das Modell antworten kann. Um Audio zu deaktivieren, setze dies auf ["text"].	No
turn_detection	Objekt	Konfiguration für Zugerkennung, entweder Server-VAD oder semantisches VAD. Dies kann auf `null` deaktiviert eingestellt werden, wobei der Client die Modellantwort manuell auslösen muss. Server-VAD bedeutet, dass das Modell den Beginn und das Ende der Sprache basierend auf der Lautstärke erkennt und am Ende der Benutzersprache antwortet. Semantisches VAD ist fortschrittlicher und verwendet ein Dreherkennungsmodell (in Verbindung mit VAD), um semantisch zu schätzen, ob der Benutzer mit dem Sprechen fertig ist, und setzt dann dynamisch eine Auszeit basierend auf dieser Wahrscheinlichkeit. Wenn zum Beispiel der User-Audio mit `uhhm`abklingt, wird das Modell eine geringe Wahrscheinlichkeit für das Ende der Zuge erzielen und länger warten, bis der Benutzer weiterspricht. Das kann für natürlichere Gespräche nützlich sein, kann aber eine höhere Latenz haben.	No
└– create_response	Boolescher Wert	Ob automatisch eine Antwort generiert werden soll, wenn ein VAD-Stopp-Event auftritt. Für Transkriptionssitzungen nicht verfügbar.	No	Richtig
└– Eifer	enum	Wird nur für den `semantic_vad` Modus verwendet. Die Bereitschaft des Modells zu reagieren. `low` Er wartet länger, bis der Nutzer weiterspricht, antwortet `high` schneller. `auto` ist der Standard und äquivalent zu `medium`. Mögliche Werte: `low`, `medium`, `high`, `auto`	No
└– interrupt_response	Boolescher Wert	Ob man eine laufende Antwort automatisch unterbrechen soll, die zur Standardkonversation (d. h. `conversation` von `auto`) führt, wenn ein VAD-Startereignis auftritt. Für Transkriptionssitzungen nicht verfügbar.	No	Richtig
└– prefix_padding_ms	Ganzzahl	Wird nur für den `server_vad` Modus verwendet. Menge an Audio, die vor der Erkennung der Sprache (in Millisekunden) durch das VAD enthalten sein sollte. Standardmäßig liegt es auf 300 ms.	No
└– Dauer_der_Stille_in_ms	Ganzzahl	Wird nur für den `server_vad` Modus verwendet. Dauer der Stille zur Erkennung des Sprachstopps (in Millisekunden). Standardmäßig 500 ms. Bei kürzeren Werten reagiert das Modell schneller, kann aber bei kurzen Pausen des Nutzers eingreifen.	No
└– Schwellenwert	number	Wird nur für den `server_vad` Modus verwendet. Aktivierungsschwelle für VAD (0,0 bis 1,0) liegt standardmäßig bei 0,5. Ein höherer Schwellenwert erfordert lauteren Ton, um das Modell zu aktivieren, und kann daher in lauten Umgebungen besser abschneiden.	No
└– Typ	enum	Art der Abzugserkennung. Mögliche Werte: `server_vad`, `semantic_vad`	No

RealtimeTranscriptionSessionCreateResponse

Eine neue Echtzeit-Transkriptionssession-Konfiguration.

Wenn eine Sitzung auf dem Server über die REST-API erstellt wird, enthält das Sitzungsobjekt auch einen ephemeren Schlüssel. Die Standard-TTL für Tasten beträgt eine Minute. Diese Eigenschaft ist nicht vorhanden, wenn eine Sitzung über die WebSocket-API aktualisiert wird.

Name	Typ	Beschreibung	Erforderlich
client_secret	Objekt	Ephemeraler Schlüssel, der von der API zurückgegeben wird. Nur vorhanden, wenn die Sitzung auf dem Server über die REST-API erstellt wird.	Ja
└– abläuft_am	Ganzzahl	Zeitstempel für den Ablauf des Tokens. Derzeit laufen alle Token nach einer Minute ab.	No
└– Wert	string	Ephemeraler Schlüssel, der in Client-Umgebungen zur Authentifizierung von Verbindungen zur Echtzeit-API verwendet werden kann. Verwenden Sie dies in clientseitigen Umgebungen anstelle eines Standard-API-Tokens, das nur serverseitig verwendet werden sollte.	No
input_audio_format	string	Das Format des Eingabeaudios. Optionen sind `pcm16`, `g711_ulaw`, oder `g711_alaw`.	No
input_audio_transcription	Objekt	Konfiguration des Transkriptionsmodells.	No
└– Sprache	string	Die Sprache des eingegebenen Audios. Die Bereitstellung der Eingabesprache im ISO-639-1 (z. B. `en`) Format verbessert die Genauigkeit und Latenz.	No
└─ Modell	enum	Das Modell für die Transkription. Kann , `gpt-4o-transcribe`, `gpt-4o-mini-transcribe`, oder `gpt-4o-mini-transcribe-2025-12-15`sein`whisper-1`. Mögliche Werte: `gpt-4o-transcribe`, `gpt-4o-mini-transcribe`, `gpt-4o-mini-transcribe-2025-12-15`, `whisper-1`	No
└– Eingabeaufforderung	string	Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Audiosegment fortzusetzen. Der Prompt sollte mit der Audiosprache übereinstimmen.	No
modalities		Die Menge der Modalitäten, mit denen das Modell antworten kann. Um Audio zu deaktivieren, setze dies auf ["text"].	No
turn_detection	Objekt	Konfiguration für Abbiegungserkennung. Kann auf Schalten eingestellt `null` werden. Server-VAD bedeutet, dass das Modell den Beginn und das Ende der Sprache basierend auf der Lautstärke erkennt und am Ende der Benutzersprache antwortet.	No
└– prefix_padding_ms	Ganzzahl	Menge an Audio, die vor der Erkennung der Sprache (in Millisekunden) durch das VAD enthalten sein sollte. Standardmäßig liegt es auf 300 ms.	No
└– Dauer_der_Stille_in_ms	Ganzzahl	Dauer der Stille zur Erkennung des Sprachstopps (in Millisekunden). Standardmäßig 500 ms. Bei kürzeren Werten reagiert das Modell schneller, kann aber bei kurzen Pausen des Nutzers eingreifen.	No
└– Schwellenwert	number	Aktivierungsschwelle für VAD (0,0 bis 1,0) liegt standardmäßig bei 0,5. Ein höherer Schwellenwert erfordert lauteren Ton, um das Modell zu aktivieren, und kann daher in lauten Umgebungen besser abschneiden.	No
└– Typ	string	Die Art der Abzugserkennung wird derzeit nur `server_vad` unterstützt.	No

Argumentation

Konfigurationsoptionen für Schlussfolgermodelle.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
effort	ReasoningEffort	Begrenzt den Aufwand beim Schließen bei Denkmustern. Derzeit unterstützte Werte sind `low`, `medium`, und `high`. Eine Reduzierung des Schlussarbeitsaufwands kann zu schnelleren Antworten und weniger Token beim Schließen in einer Antwort führen.	Ja	medium
summary	enum	Eine Zusammenfassung der vom Modell durchgeführten Argumentation. Dies kann nützlich sein, um das Debuggen zu debuggen und den Schlussfolgerungsprozess des Modells zu verstehen. Einer von `concise` oder `detailed`. Mögliche Werte: `concise`, `detailed`	No

ReasoningItem

Eine Beschreibung der Denkkette, die ein Denkmodell bei der Erzeugung einer Antwort verwendet.

Name	Typ	Beschreibung	Erforderlich
Inhalt	array	Rationalisieren des Textinhalts.	Ja
id	string	Der eindeutige Identifikator des Argumentationsins.	Ja
Status	enum	Der Status des Gegenstands. Einer von `in_progress`, `completed`, oder `incomplete`. Wird angezeigt, wenn Items über die API zurückgegeben werden. Mögliche Werte: `in_progress`, `completed`, `incomplete`	No
type	enum	Die Art des Objekts. Immer `reasoning`. Mögliche Werte: `reasoning`	Ja

Refusal

Eine Ablehnung des Models.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Weigerung	string	Die Erklärung zur Ablehnung aus dem Modell.	Ja
type	enum	Die Art der Ablehnung. Immer `refusal`. Mögliche Werte: `refusal`	Ja

response

Name	Typ	Beschreibung	Erforderlich	Vorgabe
erstellt_am	number	Unix-Zeitstempel (in Sekunden) des Zeitpunktes, an dem diese Antwort erstellt wurde.	Ja
Fehler	ResponseError	Ein Fehlerobjekt wurde zurückgegeben, wenn das Modell keine Antwort generieren konnte.	Ja
id	string	Eindeutige Kennung für diese Antwort.	Ja
incomplete_details	Objekt	Details dazu, warum die Antwort unvollständig ist.	Ja
└– Grund	enum	Der Grund, warum die Antwort unvollständig ist. Mögliche Werte: `max_output_tokens`, `content_filter`	No
Anweisungen	string	Fügt eine System- (oder Entwickler-) Nachricht als erstes Element im Kontext des Modells ein. Wenn man zusammen mit `previous_response_id`verwendet, werden die Anweisungen aus einer vorherigen Antwort nicht auf die nächste Antwort übernommen. Dadurch ist es einfach, System- (oder Entwickler-) Nachrichten in neuen Antworten auszutauschen.	Ja
max_output_tokens	Ganzzahl	Eine obere Obergrenze für die Anzahl der Tokens, die für eine Antwort generiert werden können, einschließlich sichtbarer Ausgabetoken und des Gesprächszustands.	No
metadata	Metadata	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern und Objekte über die API oder das Dashboard abzufragen. Tasten sind Zeichenketten mit einer maximalen Länge von 64 Zeichen. Werte sind Zeichenketten mit einer maximalen Länge von 512 Zeichen.	Ja
Modell	string	Modell, das zur Erzeugung der Antworten verwendet wird.	Ja
Objekt	enum	Der Objekttyp dieser Ressource – immer auf gesetzt `response`. Mögliche Werte: `response`	Ja
Ausgabe	array	Ein Array von Inhaltselementen, die vom Modell generiert werden. - Die Länge und Reihenfolge der Elemente im `output` Array hängt von der Antwort des Modells ab. - Anstatt auf das erste Element im `output` Array zuzugreifen und anzunehmen, dass es sich um eine `assistant` Nachricht mit dem vom Modell generierten Inhalt handelt, könntest du die `output_text` Eigenschaft verwenden, wo es in SDKs unterstützt wird.	Ja
output_text	string	SDK-only Convenience-Eigenschaft, die die aggregierten Textausgaben aller `output_text` Elemente im Array `output` enthält, falls welche vorhanden sind. Unterstützt in den Python- und JavaScript-SDKs.	No
Parallele Werkzeugaufrufe	Boolescher Wert	Ob das Modell Werkzeugaufrufe parallel ausführen soll.	Ja	Richtig
previous_response_id	string	Die eindeutige ID der vorherigen Antwort auf das Modell. Nutzen Sie dies, um Gespräche mit mehreren Runden zu erstellen.	No
reasoning	Reasoning	Konfigurationsoptionen für Schlussfolgermodelle.	No
Status	enum	Der Status der Reaktionsgenerierung. Einer von `completed`, `failed`, , `in_progress`oder `incomplete`. Mögliche Werte: `completed`, `failed`, `in_progress`, `incomplete`	No
Temperatur	number	Welche Sampling-Temperatur soll verwendet werden, zwischen 0 und 2. Höhere Werte wie 0,8 machen die Ausgabe zufälliger, während niedrigere Werte wie 0,2 sie fokussierter und deterministischer machen. Wir empfehlen im Allgemeinen, dies zu ändern oder `top_p` , aber nicht beides.	Ja	1
Text	Objekt	Konfigurationsoptionen für eine Textantwort des Modells. Es können Klartext oder strukturierte JSON-Daten sein. Erfahren Sie mehr: - Texteingaben und -ausgaben - Strukturierte Ausgaben	No
└─ Format	TextResponseFormatConfiguration	Ein Objekt, das das Format angibt, das das Modell ausgeben muss. Die Konfiguration `{ "type": "json_schema" }` aktiviert strukturierte Ausgaben, die sicherstellen, dass das Modell mit dem bereitgestellten JSON-Schema übereinstimmt. Das Standardformat ist `{ "type": "text" }` ohne zusätzliche Optionen. Nicht empfohlen für GPT-4o und neuere Modelle: Einstellung aktiviert den `{ "type": "json_object" }` älteren JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültiges JSON ist. Die Verwendung `json_schema` ist bevorzugt für Modelle, die sie unterstützen.	No
tool_choice	ToolChoiceOptions oder ToolChoiceTypes oder ToolChoiceFunction	Wie das Modell auswählen sollte, welches Tool (oder welche Werkzeuge) es bei der Generierung einer Antwort verwendet. Sehen Sie sich den Parameter `tools` an, um zu sehen, welche Werkzeuge das Modell aufrufen kann.	Ja
tools	array	Ein Array von Werkzeugen, die das Modell aufrufen kann, während es eine Antwort erzeugt. Du kannst angeben, welches Werkzeug du verwenden sollst, indem du den Parameter `tool_choice` einlegst. Die zwei Kategorien von Werkzeugen, die Sie dem Modell bereitstellen können, sind: - Eingebaute Werkzeuge	Ja
top_p	number	Eine Alternative zur Sampling mit Temperatur, genannt Nucleus-Sampling, bei der das Modell die Ergebnisse der Token mit top_p Wahrscheinlichkeitsmasse betrachtet. 0,1 bedeutet also, dass nur die Token der Top 10% Wahrscheinlichkeitsmasse berücksichtigt werden. Wir empfehlen im Allgemeinen, dies zu ändern oder `temperature` , aber nicht beides.	Ja	1
truncation	enum	Die Abschneidungsstrategie, die für die Modellantwort verwendet werden soll. - `auto`: Wenn der Kontext dieser und der vorherigen Antwort die Größe des Kontextfensters des Modells übersteigt, wird das Modell die Antwort kürzen, um zum Kontextfenster zu passen, indem es Eingabepunkte mitten im Gespräch platziert. - `disabled` (Standard): Wenn eine Modellantwort die Kontextfenstergröße eines Modells überschreitet, schlägt die Anfrage mit einem Fehler von 400 fehl. Mögliche Werte: `auto`, `disabled`	No
Nutzung	ResponseUsage	Repräsentiert Details zur Tokennutzung, einschließlich Eingabetoken, Ausgabetoken, einer Aufschlüsselung der Ausgabetoken und der insgesamt verwendeten Tokens.	No
user	string	Eine eindeutige Identifikator, die Ihren Endnutzer repräsentiert und OpenAI helfen kann, Missbrauch zu überwachen und zu erkennen. .	No

ResponseAudioDeltaEvent

Ausgesendet, wenn eine teilweise Audioreaktion vorhanden ist.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
delta	string	Ein Teil von Base64-codierten Antwort-Audiobytes.	Ja
type	enum	Die Art der Veranstaltung. Immer `response.audio.delta`. Mögliche Werte: `response.audio.delta`	Ja

ResponseAudioDoneEvent

Ausgesendet, wenn die Audioantwort abgeschlossen ist.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
type	enum	Die Art der Veranstaltung. Immer `response.audio.done`. Mögliche Werte: `response.audio.done`	Ja

ResponseAudioTranscriptDeltaEvent

Es wird ausgesendet, wenn ein Teilabschrift des Audios vorhanden ist.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
delta	string	Das teilweise Transkript der Audioantwort.	Ja
type	enum	Die Art der Veranstaltung. Immer `response.audio.transcript.delta`. Mögliche Werte: `response.audio.transcript.delta`	Ja

ResponseAudioTranscriptDoneEvent

Gesendet, wenn das vollständige Audio-Transkript fertiggestellt ist.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
type	enum	Die Art der Veranstaltung. Immer `response.audio.transcript.done`. Mögliche Werte: `response.audio.transcript.done`	Ja

ResponseCodeInterpreterCallCodeDeltaEvent

Es wird ausgesendet, wenn ein teilweiser Codeschnipsel vom Code-Interpreter hinzugefügt wird.

Name	Typ	Beschreibung	Erforderlich
delta	string	Der teilweise Codeschnipsel, der vom Code-Interpreter hinzugefügt wurde.	Ja
output_index	Ganzzahl	Der Index des Ausgabeelements, das der Code-Interpreter aufruft, befindet sich in Bearbeitung.	Ja
type	enum	Die Art der Veranstaltung. Immer `response.code_interpreter_call.code.delta`. Mögliche Werte: `response.code_interpreter_call.code.delta`	Ja

ResponseCodeInterpreterCallCodeDoneEvent

Gesendet, wenn die Code-Snippet-Ausgabe vom Code-Interpreter finalisiert wird.

Name	Typ	Beschreibung	Erforderlich
code	string	Das letzte Codeschnipsel, das vom Code-Interpreter ausgegeben wird.	Ja
output_index	Ganzzahl	Der Index des Ausgabeelements, das der Code-Interpreter aufruft, befindet sich in Bearbeitung.	Ja
type	enum	Die Art der Veranstaltung. Immer `response.code_interpreter_call.code.done`. Mögliche Werte: `response.code_interpreter_call.code.done`	Ja

ResponseCodeInterpreterCallCompletedEvent

Gesendet, wenn der Code-Interpreter-Aufruf abgeschlossen ist.

Name	Typ	Beschreibung	Erforderlich
code_interpreter_call	CodeInterpreterToolCall	Ein Toolaufruf, um Code auszuführen.	Ja
output_index	Ganzzahl	Der Index des Ausgabeelements, das der Code-Interpreter aufruft, befindet sich in Bearbeitung.	Ja
type	enum	Die Art der Veranstaltung. Immer `response.code_interpreter_call.completed`. Mögliche Werte: `response.code_interpreter_call.completed`	Ja

ResponseCodeInterpreterCallInProgressEvent

Gesendet, wenn ein Code-Interpreter-Aufruf läuft.

Name	Typ	Beschreibung	Erforderlich
code_interpreter_call	CodeInterpreterToolCall	Ein Toolaufruf, um Code auszuführen.	Ja
output_index	Ganzzahl	Der Index des Ausgabeelements, das der Code-Interpreter aufruft, befindet sich in Bearbeitung.	Ja
type	enum	Die Art der Veranstaltung. Immer `response.code_interpreter_call.in_progress`. Mögliche Werte: `response.code_interpreter_call.in_progress`	Ja

ResponseCodeInterpreterCallInterpretingEvent

Es wird ausgesendet, wenn der Code-Interpreter aktiv den Codeausschnitt interpretiert.

Name	Typ	Beschreibung	Erforderlich
code_interpreter_call	CodeInterpreterToolCall	Ein Toolaufruf, um Code auszuführen.	Ja
output_index	Ganzzahl	Der Index des Ausgabeelements, das der Code-Interpreter aufruft, befindet sich in Bearbeitung.	Ja
type	enum	Die Art der Veranstaltung. Immer `response.code_interpreter_call.interpreting`. Mögliche Werte: `response.code_interpreter_call.interpreting`	Ja

ResponseCompletedEvent

Emittiert, wenn die Modellantwort abgeschlossen ist.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
response	response		Ja
type	enum	Die Art der Veranstaltung. Immer `response.completed`. Mögliche Werte: `response.completed`	Ja

ResponseContentPartAddedEvent

Emittiert, wenn ein neuer Inhaltsteil hinzugefügt wird.

Name	Typ	Beschreibung	Erforderlich
content_index	Ganzzahl	Der Index des Inhalts, der hinzugefügt wurde.	Ja
item_id	string	Die ID des Ausgabeelements, zu dem der Inhaltsteil hinzugefügt wurde.	Ja
output_index	Ganzzahl	Der Index des Ausgabeelements, zu dem der Inhaltsteil hinzugefügt wurde.	Ja
part	OutputContent		Ja
type	enum	Die Art der Veranstaltung. Immer `response.content_part.added`. Mögliche Werte: `response.content_part.added`	Ja

ResponseContentPartDoneEvent

Emittiert, wenn ein Inhaltsteil fertig ist.

Name	Typ	Beschreibung	Erforderlich
content_index	Ganzzahl	Der Index des Inhalts, der erledigt wird.	Ja
item_id	string	Die ID des Ausgabeelements, zu dem der Inhaltsteil hinzugefügt wurde.	Ja
output_index	Ganzzahl	Der Index des Ausgabeelements, zu dem der Inhaltsteil hinzugefügt wurde.	Ja
part	OutputContent		Ja
type	enum	Die Art der Veranstaltung. Immer `response.content_part.done`. Mögliche Werte: `response.content_part.done`	Ja

ResponseCreatedEvent

Ein Ereignis, das ausgelöst wird, wenn eine Antwort erstellt wird.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
response	response		Ja
type	enum	Die Art der Veranstaltung. Immer `response.created`. Mögliche Werte: `response.created`	Ja

ResponseError

Ein Fehlerobjekt wurde zurückgegeben, wenn das Modell keine Antwort generieren konnte.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
code	ResponseErrorCode	Der Fehlercode für die Antwort.	Ja
Nachricht	string	Eine für Menschen lesbare Beschreibung des Fehlers.	Ja

ResponseErrorCode

Der Fehlercode für die Antwort.

Eigentum	Wert
Beschreibung	Der Fehlercode für die Antwort.
Typ	string
Werte	`server_error` `rate_limit_exceeded` `invalid_prompt` `vector_store_timeout` `invalid_image` `invalid_image_format` `invalid_base64_image` `invalid_image_url` `image_too_large` `image_too_small` `image_parse_error` `image_content_policy_violation` `invalid_image_mode` `image_file_too_large` `unsupported_image_media_type` `empty_image_file` `failed_to_download_image` `image_file_not_found`

ResponseErrorEvent

Es wird ausgesendet, wenn ein Fehler auftritt.

Name	Typ	Beschreibung	Erforderlich
code	string	Der Fehlercode.	Ja
Nachricht	string	Die Fehlermeldung.	Ja
param	string	Der Fehlerparameter.	Ja
type	enum	Die Art der Veranstaltung. Immer `error`. Mögliche Werte: `error`	Ja

ResponseFailedEvent

Ein Ereignis, das ausgelöst wird, wenn eine Antwort fehlschlägt.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
response	response		Ja
type	enum	Die Art der Veranstaltung. Immer `response.failed`. Mögliche Werte: `response.failed`	Ja

ResponseFileSearchCallCompletedEvent

Gesendet, wenn ein Dateisuchaufruf abgeschlossen ist (Ergebnisse gefunden).

Name	Typ	Beschreibung	Erforderlich
item_id	string	Die ID des Ausgabeelements, das der Dateisuchaufruf aufruft, wird initiiert.	Ja
output_index	Ganzzahl	Der Index des Ausgabeelements, den der Dateisuchaufruf aufruft, wird initiiert.	Ja
type	enum	Die Art der Veranstaltung. Immer `response.file_search_call.completed`. Mögliche Werte: `response.file_search_call.completed`	Ja

ResponseFileSearchCallInProgressEvent

Gesendet, wenn ein Dateisuchaufruf eingeleitet wird.

Name	Typ	Beschreibung	Erforderlich
item_id	string	Die ID des Ausgabeelements, das der Dateisuchaufruf aufruft, wird initiiert.	Ja
output_index	Ganzzahl	Der Index des Ausgabeelements, den der Dateisuchaufruf aufruft, wird initiiert.	Ja
type	enum	Die Art der Veranstaltung. Immer `response.file_search_call.in_progress`. Mögliche Werte: `response.file_search_call.in_progress`	Ja

ResponseFileSearchCallSearchingEvent

Gesendet, wenn eine Dateisuche gerade gesucht wird.

Name	Typ	Beschreibung	Erforderlich
item_id	string	Die ID des Ausgabeelements, das der Dateisuchaufruf aufruft, wird initiiert.	Ja
output_index	Ganzzahl	Der Index des Ausgabeelements, das die Dateisuche aufruft.	Ja
type	enum	Die Art der Veranstaltung. Immer `response.file_search_call.searching`. Mögliche Werte: `response.file_search_call.searching`	Ja

ResponseFunctionCallArgumentsDeltaEvent

Emittiert, wenn es eine partielle Funktionsaufruf-Delta gibt.

Name	Typ	Beschreibung	Erforderlich
delta	string	Die Funktionsaufruf-Argumente delta, die hinzugefügt wird.	Ja
item_id	string	Die ID des Ausgabeelements, zu dem die Funktionsaufruf-Argumente deltan, wird hinzugefügt.	Ja
output_index	Ganzzahl	Der Index des Ausgabeelements, zu dem die Funktionsaufruf-Argumente delta hinzugefügt werden.	Ja
type	enum	Die Art der Veranstaltung. Immer `response.function_call_arguments.delta`. Mögliche Werte: `response.function_call_arguments.delta`	Ja

ResponseFunctionCallArgumentsDoneEvent

Emittiert, wenn Funktionsaufruf-Argumente finalisiert werden.

Name	Typ	Beschreibung	Erforderlich
Argumente	string	Die Funktionsaufruf-Argumente.	Ja
item_id	string	Der Ausweis des Gegenstands.	Ja
output_index	Ganzzahl	Der Index des Ausgangselements.	Ja
type	enum	Mögliche Werte: `response.function_call_arguments.done`	Ja

ResponseInProgressEvent

Ausgestrahlt, wenn die Antwort läuft.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
response	response		Ja
type	enum	Die Art der Veranstaltung. Immer `response.in_progress`. Mögliche Werte: `response.in_progress`	Ja

ResponseIncompleteEvent

Ein Ereignis, das ausgelöst wird, wenn eine Antwort als unvollständig endet.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
response	response		Ja
type	enum	Die Art der Veranstaltung. Immer `response.incomplete`. Mögliche Werte: `response.incomplete`	Ja

responseItemList

Eine Liste von Response-Punkten.

Name	Typ	Beschreibung	Erforderlich
data	array	Eine Liste der Elemente, die zur Erzeugung dieser Antwort verwendet wurden.	Ja
first_id	string	Die ID des ersten Punkts auf der Liste.	Ja
has_more	Boolescher Wert	Ob es noch mehr Gegenstände gibt.	Ja
last_id	string	Die ID des letzten Punkts auf der Liste.	Ja
Objekt	enum	Die Art des zurückgegebenen Objekts muss sein `list`. Mögliche Werte: `list`	Ja

ResponseModalities

Ausgabetypen, die das Modell generieren soll. Die meisten Modelle sind in der Lage, Text zu generieren, was standardmäßig ist:

["text"]

Das gpt-4o-audio-preview Modell kann auch zur Audioerzeugung verwendet werden. Um zu verlangen, dass dieses Modell sowohl Text- als auch Audioantworten erzeugt, können Sie verwenden:

["text", "audio"]

Für diese Komponente sind keine Eigenschaften definiert.

ResponseModalitiesTextOnly

Ausgabetypen, die das Modell generieren soll. Die meisten Modelle sind in der Lage, Text zu generieren, was standardmäßig ist:

["text"]

Diese API wird bald weitere Ausgabemodalitäten unterstützen, einschließlich Audio und Bilder.

Für diese Komponente sind keine Eigenschaften definiert.

ResponseOutputItemAddedEvent

Emittiert, wenn ein neues Ausgangselement hinzugefügt wird.

Name	Typ	Beschreibung	Erforderlich
item	OutputItem		Ja
output_index	Ganzzahl	Der Index des hinzugefügten Output-Elements.	Ja
type	enum	Die Art der Veranstaltung. Immer `response.output_item.added`. Mögliche Werte: `response.output_item.added`	Ja

ResponseOutputItemDoneEvent

Emittiert, wenn ein Ausgabepunkt als erledigt markiert wird.

Name	Typ	Beschreibung	Erforderlich
item	OutputItem		Ja
output_index	Ganzzahl	Der Index des als erledigten Ausgabepunkt markierten.	Ja
type	enum	Die Art der Veranstaltung. Immer `response.output_item.done`. Mögliche Werte: `response.output_item.done`	Ja

ResponseProperties

Name	Typ	Beschreibung	Erforderlich
Anweisungen	string	Fügt eine System- (oder Entwickler-) Nachricht als erstes Element im Kontext des Modells ein. Wenn man zusammen mit `previous_response_id`verwendet, werden die Anweisungen aus einer vorherigen Antwort nicht auf die nächste Antwort übernommen. Dadurch ist es einfach, System- (oder Entwickler-) Nachrichten in neuen Antworten auszutauschen.	No
max_output_tokens	Ganzzahl	Eine obere Obergrenze für die Anzahl der Tokens, die für eine Antwort generiert werden können, einschließlich sichtbarer Ausgabetoken und des Gesprächszustands.	No
previous_response_id	string	Die eindeutige ID der vorherigen Antwort auf das Modell. Nutzen Sie dies, um Gespräche mit mehreren Runden zu erstellen.	No
reasoning	Reasoning	Konfigurationsoptionen für Schlussfolgermodelle.	No
Text	Objekt	Konfigurationsoptionen für eine Textantwort des Modells. Es können Klartext oder strukturierte JSON-Daten sein. Erfahren Sie mehr: - Texteingaben und -ausgaben - Strukturierte Ausgaben	No
└─ Format	TextResponseFormatConfiguration	Ein Objekt, das das Format angibt, das das Modell ausgeben muss. Die Konfiguration `{ "type": "json_schema" }` aktiviert strukturierte Ausgaben, die sicherstellen, dass das Modell mit dem bereitgestellten JSON-Schema übereinstimmt. Das Standardformat ist `{ "type": "text" }` ohne zusätzliche Optionen. Nicht empfohlen für GPT-4o und neuere Modelle: Einstellung aktiviert den `{ "type": "json_object" }` älteren JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültiges JSON ist. Die Verwendung `json_schema` ist bevorzugt für Modelle, die sie unterstützen.	No
tool_choice	ToolChoiceOptions oder ToolChoiceTypes oder ToolChoiceFunction	Wie das Modell auswählen sollte, welches Tool (oder welche Werkzeuge) es bei der Generierung einer Antwort verwendet. Sehen Sie sich den Parameter `tools` an, um zu sehen, welche Werkzeuge das Modell aufrufen kann.	No
tools	array	Ein Array von Werkzeugen, die das Modell aufrufen kann, während es eine Antwort erzeugt. Du kannst angeben, welches Werkzeug du verwenden sollst, indem du den Parameter `tool_choice` einlegst. Die zwei Kategorien von Werkzeugen, die Sie dem Modell bereitstellen können, sind: - Eingebaute Werkzeuge	No
truncation	enum	Die Abschneidungsstrategie, die für die Modellantwort verwendet werden soll. - `auto`: Wenn der Kontext dieser und der vorherigen Antwort die Größe des Kontextfensters des Modells übersteigt, wird das Modell die Antwort kürzen, um zum Kontextfenster zu passen, indem es Eingabepunkte mitten im Gespräch platziert. - `disabled` (Standard): Wenn eine Modellantwort die Kontextfenstergröße eines Modells überschreitet, schlägt die Anfrage mit einem Fehler von 400 fehl. Mögliche Werte: `auto`, `disabled`	No

ResponseRefusalDeltaEvent

Gesendet, wenn eine teilweise Ablehnung vorliegt.

Name	Typ	Beschreibung	Erforderlich
content_index	Ganzzahl	Der Index des Inhaltsteils, zu dem der Ablehnungstext hinzugefügt wird.	Ja
delta	string	Der Ablehnungstext, der hinzugefügt wird.	Ja
item_id	string	Die ID des Ausgabeelements, zu dem der Ablehnungstext hinzugefügt wird.	Ja
output_index	Ganzzahl	Der Index des Ausgabeelements, zu dem der Ablehnungstext hinzugefügt wird.	Ja
type	enum	Die Art der Veranstaltung. Immer `response.refusal.delta`. Mögliche Werte: `response.refusal.delta`	Ja

ResponseRefusalDoneEvent

Gesendet, wenn der Ablehnungstext finalisiert ist.

Name	Typ	Beschreibung	Erforderlich
content_index	Ganzzahl	Der Index des Inhalts teilt, dass der Ablehnungstext finalisiert ist.	Ja
item_id	string	Die ID des Ausgabeelements, in dem der Ablehnungstext steht, wird finalisiert.	Ja
output_index	Ganzzahl	Der Index des Ausgabeelements, dass der Ablehnungstext abgeschlossen ist.	Ja
Weigerung	string	Die Ablehnungsnachricht, die finalisiert ist.	Ja
type	enum	Die Art der Veranstaltung. Immer `response.refusal.done`. Mögliche Werte: `response.refusal.done`	Ja

responseStreamEvent

Name	Typ	Beschreibung	Erforderlich
Anmerkung	Annotation		Ja
annotation_index	Ganzzahl	Der Index der hinzugefügten Anmerkung.	Ja
Argumente	string	Die Funktionsaufruf-Argumente.	Ja
code	string	Der Fehlercode.	Ja
code_interpreter_call	CodeInterpreterToolCall	Ein Toolaufruf, um Code auszuführen.	Ja
content_index	Ganzzahl	Der Index des Inhalts teilt, dass der Textinhalt finalisiert ist.	Ja
delta	string	Das Textdelta, das hinzugefügt wurde.	Ja
item	OutputItem	Der Ausgabepunkt, der als erledigt markiert wurde.	Ja
item_id	string	Die ID des Ausgabeelements, in dem der Textinhalt festgelegt ist, ist finalisiert.	Ja
Nachricht	string	Die Fehlermeldung.	Ja
output_index	Ganzzahl	Der Index des Ausgabeelements, in dem der Textinhalt festgelegt ist, wird finalisiert.	Ja
param	string	Der Fehlerparameter.	Ja
part	OutputContent	Der Inhaltsteil, der erledigt ist.	Ja
Weigerung	string	Die Ablehnungsnachricht, die finalisiert ist.	Ja
response	response	Die Antwort, die unvollständig war.	Ja
Text	string	Der Textinhalt, der finalisiert ist.	Ja
type	enum	Die Art der Veranstaltung. Immer `response.output_text.done`. Mögliche Werte: `response.output_text.done`	Ja

ResponseTextAnnotationDeltaEvent

Emittiert, wenn eine Textannotation hinzugefügt wird.

Name	Typ	Beschreibung	Erforderlich
Anmerkung	Annotation		Ja
annotation_index	Ganzzahl	Der Index der hinzugefügten Anmerkung.	Ja
content_index	Ganzzahl	Der Index des Inhaltsteils, zu dem die Textannotation hinzugefügt wurde.	Ja
item_id	string	Die ID des Ausgabeelements, zu dem die Textannotation hinzugefügt wurde.	Ja
output_index	Ganzzahl	Der Index des Ausgabeelements, zu dem die Textannotation hinzugefügt wurde.	Ja
type	enum	Die Art der Veranstaltung. Immer `response.output_text.annotation.added`. Mögliche Werte: `response.output_text.annotation.added`	Ja

ResponseTextDeltaEvent

Es wird ausgesendet, wenn ein zusätzliches Text-Delta vorhanden ist.

Name	Typ	Beschreibung	Erforderlich
content_index	Ganzzahl	Der Index des Inhalts, zu dem das Textdelta hinzugefügt wurde.	Ja
delta	string	Das Textdelta, das hinzugefügt wurde.	Ja
item_id	string	Die ID des Ausgabeelements, zu dem das Textdelta hinzugefügt wurde.	Ja
output_index	Ganzzahl	Der Index des Ausgabeelements, zu dem das Textdelta hinzugefügt wurde.	Ja
type	enum	Die Art der Veranstaltung. Immer `response.output_text.delta`. Mögliche Werte: `response.output_text.delta`	Ja

ResponseTextDoneEvent

Gesendet, wenn der Textinhalt finalisiert ist.

Name	Typ	Beschreibung	Erforderlich
content_index	Ganzzahl	Der Index des Inhalts teilt, dass der Textinhalt finalisiert ist.	Ja
item_id	string	Die ID des Ausgabeelements, in dem der Textinhalt festgelegt ist, ist finalisiert.	Ja
output_index	Ganzzahl	Der Index des Ausgabeelements, in dem der Textinhalt festgelegt ist, wird finalisiert.	Ja
Text	string	Der Textinhalt, der finalisiert ist.	Ja
type	enum	Die Art der Veranstaltung. Immer `response.output_text.done`. Mögliche Werte: `response.output_text.done`	Ja

ResponseUsage

Repräsentiert Details zur Tokennutzung, einschließlich Eingabetoken, Ausgabetoken, einer Aufschlüsselung der Ausgabetoken und der insgesamt verwendeten Tokens.

Name	Typ	Beschreibung	Erforderlich
input_tokens	Ganzzahl	Die Anzahl der Eingabetoken.	Ja
output_tokens	Ganzzahl	Die Anzahl der Ausgabetoken.	Ja
output_tokens_details	Objekt	Eine detaillierte Aufschlüsselung der Ausgabetoken.	Ja
└– reasoning_tokens	Ganzzahl	Die Anzahl der Vernunft-Tokens.	No
Gesamtanzahl Tokens	Ganzzahl	Die Gesamtzahl der verwendeten Token.	Ja

Screenshot

Eine Screenshot-Aktion.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
type	enum	Spezifiziert den Ereignistyp. Für eine Screenshot-Aktion wird diese Eigenschaft immer auf `screenshot`gesetzt. Mögliche Werte: `screenshot`	Ja

Scroll

Eine Scroll-Aktion.

Name	Typ	Beschreibung	Erforderlich
scroll_x	Ganzzahl	Die horizontale Scrolldistanz.	Ja
scroll_y	Ganzzahl	Die vertikale Scrolldistanz.	Ja
type	enum	Spezifiziert den Ereignistyp. Für eine Scrollaktion ist diese Eigenschaft immer auf `scroll`gesetzt. Mögliche Werte: `scroll`	Ja
x	Ganzzahl	Die x-Koordinate, an der die Schriftrolle stattfand.	Ja
Y	Ganzzahl	Die y-Koordinate, an der die Schriftrolle stattfand.	Ja

StopConfiguration

Bis zu 4 Sequenzen, bei denen die API aufhört, weitere Token zu generieren. Der zurückgegebene Text enthält die Stoppfolge nicht.

Diese Komponente kann eine der folgenden sein:

TextResponseFormatConfiguration

Ein Objekt, das das Format angibt, das das Modell ausgeben muss.

Die Konfiguration { "type": "json_schema" } aktiviert strukturierte Ausgaben, die sicherstellen, dass das Modell mit Ihrem bereitgestellten JSON-Schema übereinstimmt.

Das Standardformat ist { "type": "text" } ohne zusätzliche Optionen.

Nicht empfohlen für GPT-4o und neuere Modelle:

Einstellung aktiviert den { "type": "json_object" } älteren JSON-Modus, der sicherstellt, dass die vom Modell erzeugte Nachricht gültiges JSON ist. Die Verwendung json_schema ist bevorzugt für Modelle, die sie unterstützen.

Diese Komponente kann eine der folgenden sein:

ResponseFormatText
TextResponseFormatJsonSchema
ResponseFormatJsonObject

TextResponseFormatJsonSchema

JSON-Schema-Antwortformat. Wird verwendet, um strukturierte JSON-Antworten zu generieren. Erfahren Sie mehr über strukturierte Ausgaben.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Beschreibung	string	Eine Beschreibung, wofür das Antwortformat dient, verwendet vom Modell zur Bestimmung der Antwort im Format.	No
Name	string	Der Name des Antwortformats. Muss a-z, A-Z, 0-9 sein oder Unterstriche und Striche enthalten, mit einer maximalen Länge von 64.	No
schema	ResponseFormatJsonSchemaSchema	Das Schema für das Antwortformat, beschrieben als JSON-Schema-Objekt.	Ja
strict	Boolescher Wert	Ob strikte Schema-Compliance bei der Erzeugung der Ausgabe aktiviert werden soll. Setzt es auf wahr, folgt das Modell immer dem exakt im Feld `schema` definierten Schema. Nur eine Teilmenge des JSON-Schemas wird unterstützt, wenn `strict` .`true`	No	Falsch
type	enum	Die Art des zu definierenden Antwortformats. Immer `json_schema`. Mögliche Werte: `json_schema`	Ja

Werkzeug

Diese Komponente kann eine der folgenden sein:

FileSearchTool
FunctionTool
ComputerTool

ToolChoiceFunction

Verwenden Sie diese Option, um das Modell zu zwingen, eine bestimmte Funktion aufzurufen.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Name	string	Der Name der Funktion, die aufgerufen werden soll.	Ja
type	enum	Für Funktionsaufrufe ist der Typ immer `function`. Mögliche Werte: `function`	Ja

ToolChoiceOptions

Kontrolliert, welches (falls vorhandenes) Werkzeug vom Modell aufgerufen wird.

none Das bedeutet, dass das Modell kein Tool aufruft, sondern stattdessen eine Nachricht generiert.

auto das bedeutet, dass das Modell zwischen der Generierung einer Nachricht oder dem Aufrufen eines oder mehrerer Werkzeuge wählen kann.

required das bedeutet, dass das Modell ein oder mehrere Werkzeuge aufrufen muss.

Eigentum	Wert
Beschreibung	Kontrolliert, welches (falls vorhandenes) Werkzeug vom Modell aufgerufen wird. `none` Das bedeutet, dass das Modell kein Tool aufruft, sondern stattdessen eine Nachricht generiert. `auto` das bedeutet, dass das Modell zwischen der Generierung einer Nachricht oder dem Aufrufen eines oder mehrerer Werkzeuge wählen kann. `required` das bedeutet, dass das Modell ein oder mehrere Werkzeuge aufrufen muss.
Typ	string
Werte	`none` `auto` `required`

ToolChoiceTypes

Zeigt an, dass das Modell ein eingebautes Tool verwenden sollte, um eine Antwort zu generieren.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
type	enum	Welche Art von gehostetem Tool das Modell verwenden sollte. Erlaubte Werte sind: - `file_search` - `computer_use_preview` Mögliche Werte: `file_search`, `computer_use_preview`	Ja

Typ

Eine Aktion, um Text einzutippen.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Text	string	Der Text zum Tippen.	Ja
type	enum	Spezifiziert den Ereignistyp. Für eine Typaktion ist diese Eigenschaft immer auf `type`gesetzt. Mögliche Werte: `type`	Ja

UpdateVectorStoreFileAttributesRequest

Name	Typ	Beschreibung	Erforderlich	Vorgabe
attributes	VectorStoreFileAttributes	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern und Objekte über die API oder das Dashboard abzufragen. Tasten sind Zeichenketten mit einer maximalen Länge von 64 Zeichen. Werte sind Zeichenketten mit einer maximalen Länge von 512 Zeichen, Booleans oder Zahlen.	Ja

UrlCitation

Ein Zitat für eine Webressource, die zur Erstellung einer Modellantwort verwendet wird.

Name	Typ	Beschreibung	Erforderlich
end_index	Ganzzahl	Der Index des letzten Zeichens der URL-Zitation in der Nachricht.	Ja
start_index	Ganzzahl	Der Index des ersten Zeichens der URL-Zitation in der Nachricht.	Ja
title	string	Der Titel der Webressource.	Ja
type	enum	Der Typ der URL-Zitate. Immer `url_citation`. Mögliche Werte: `url_citation`	Ja
url	string	Die URL der Webressource.	Ja

VectorStoreFileAttributes

Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern und Objekte über die API oder das Dashboard abzufragen. Tasten sind Zeichenketten mit einer maximalen Länge von 64 Zeichen. Werte sind Zeichenketten mit einer maximalen Länge von 512 Zeichen, Booleans oder Zahlen.

Für diese Komponente sind keine Eigenschaften definiert.

VectorStoreFileContentResponse

Repräsentiert den geparsten Inhalt einer Vektorspeicherdatei.

Name	Typ	Beschreibung	Erforderlich
data	array	Den Inhalt der Datei analysiert.	Ja
has_more	Boolescher Wert	Zeigt an, ob es weitere Inhaltsseiten zu holen gibt.	Ja
next_page	string	Das Token für die nächste Seite, falls vorhanden.	Ja
Objekt	enum	Der Objekttyp, der immer ist `vector_store.file_content.page` Mögliche Werte: `vector_store.file_content.page`	Ja

VectorStoreSearchRequest

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Filter	ComparisonFilter oder CompoundFilter	Ein Filter, der basierend auf Dateiattributen angewendet wird.	No
max_anzahl_ergebnisse	Ganzzahl	Die maximale Anzahl an Ergebnissen, die du ergeben kannst. Diese Zahl sollte zwischen 1 und 50 liegen.	No	10
Anfrage	Saite oder Array	Eine Abfragefolge für eine Suche	Ja
Ranglistenoptionen	Objekt	Rangfolgeoptionen für die Suche.	No
└– Ranker	enum	Mögliche Werte: `auto`, `default-2024-11-15`	No
└─ Punktschwelle	number		No	0
rewrite_query	Boolescher Wert	Ob die natürliche Sprachanfrage für die Vektorsuche umgeschrieben werden soll.	No	Falsch

VectorStoreSearchResultContentObject

Name	Typ	Beschreibung	Erforderlich	Vorgabe
Text	string	Der Textinhalt wurde von der Suche zurückgegeben.	Ja
type	enum	Die Art des Inhalts. Mögliche Werte: `text`	Ja

VectorStoreSearchResultItem

Name	Typ	Beschreibung	Erforderlich
attributes	VectorStoreFileAttributes	Menge von 16 Schlüssel-Wert-Paaren, die an ein Objekt angehängt werden können. Dies kann nützlich sein, um zusätzliche Informationen über das Objekt in einem strukturierten Format zu speichern und Objekte über die API oder das Dashboard abzufragen. Tasten sind Zeichenketten mit einer maximalen Länge von 64 Zeichen. Werte sind Zeichenketten mit einer maximalen Länge von 512 Zeichen, Booleans oder Zahlen.	Ja
Inhalt	array	Inhaltsabschnitte aus der Datei.	Ja
Datei-ID	string	Die ID der Vektorspeicherdatei.	Ja
filename	string	Der Name der Vektorspeicherdatei.	Ja
Punktzahl	number	Der Ähnlichkeitswert für das Ergebnis.	Ja

VectorStoreSearchResultsPage

Name	Typ	Beschreibung	Erforderlich
data	array	Die Liste der Suchergebnis-Elemente.	Ja
has_more	Boolescher Wert	Zeigt an, ob es noch mehr Ergebnisse zu holen gibt.	Ja
next_page	string	Das Token für die nächste Seite, falls vorhanden.	Ja
Objekt	enum	Der Objekttyp, der immer ist `vector_store.search_results.page` Mögliche Werte: `vector_store.search_results.page`	Ja
search_query	array		Ja

VoiceIdsShared

Für diese Komponente sind keine Eigenschaften definiert.

Wait

Eine Warteaktion.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
type	enum	Spezifiziert den Ereignistyp. Für eine Warteaktion wird diese Eigenschaft immer auf `wait`gesetzt. Mögliche Werte: `wait`	Ja

ReasoningEffort

Begrenzt den Aufwand beim Schließen bei Denkmustern. Derzeit unterstützte Werte sind low, medium, und high. Eine Reduzierung des Schlussarbeitsaufwands kann zu schnelleren Antworten und weniger Token beim Schließen in einer Antwort führen.

Eigentum	Wert
Beschreibung	Begrenzt den Aufwand beim Schließen bei Denkmustern. Derzeit unterstützte Werte sind `low`, `medium`, und `high`. Eine Reduzierung des Schlussarbeitsaufwands kann zu schnelleren Antworten und weniger Token beim Schließen in einer Antwort führen.
Typ	string
Vorgabe	medium
Werte	`low` `medium` `high`

errorEvent

Tritt auf, wenn ein Fehler auftritt. Das kann durch einen internen Serverfehler oder eine Auszeit passieren.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
data	error		Ja
Ereignis	string		Ja

Event Enum: ErrorEventEnum

Wert	Beschreibung
Fehler

doneEvent

Tritt auf, wenn ein Stream endet.

Name	Typ	Beschreibung	Erforderlich	Vorgabe
data	string		Ja
Ereignis	string		Ja

Event Enum: DoneEventEnum

Wert	Beschreibung
Fertig

Data Enum: DoneEventDataEnum

Wert	Beschreibung
[DONE]

Nächste Schritte

Lerne mehr über Modelle und Feinabstimmung mit der REST-API. Erfahren Sie mehr über die zugrundeliegenden Modelle, die Azure OpenAI antreiben.

Feedback

War diese Seite hilfreich?

Last updated on 2026-05-20