Azure OpenAI i Microsoft Foundry Models REST API-referens (klassisk)

Visar för närvarande:Foundry-portalversion - (klassisk)Växla till version för den nya Foundry-portalen

Note

Länkar i den här artikeln kan öppna innehåll i den nya Microsoft Foundry-dokumentationen i stället för den foundry-dokumentation (klassisk) som du visar nu.

Denna artikel ger detaljer om slutpunkterna för REST API för Azure OpenAI.

API-specifikationer

Hantering och interaktion med Azure OpenAI-modeller och resurser är uppdelad över tre huvudsakliga API-ytor:

  • Kontrollplan
  • Dataplan – författarskap
  • Dataplan – inferens

Varje API-yta/specifikation kapslar in en annan uppsättning Azure OpenAI-funktioner. Varje API har sin egen unika uppsättning förhandsvisningar och stabila/allmänt tillgängliga (GA) API-releaser. Förhandsvisningar följer för närvarande en månatlig rytm.

Viktigt!

Det finns nu ett nytt API för förhandsgranskningsinferens. Läs mer i vår guide för API-livscykeln.

API Senaste förhandsvisningen Senaste GA-utgåvan Specifications Description
Kontrollplan 2025-07-01-preview 2025-06-01 Spec-filer Kontrollplanets API används för operationer som att skapa resurser, modellutrullning och andra högre nivåuppgifter inom resurshantering. Kontrollplanet styr också vad som är möjligt att göra med funktioner som Azure Resource Manager, Bicep, Terraform och Azure CLI.
Dataplanet v1 preview v1 Spec-filer Data plane API styr inferens- och författaroperationer.

Authentication

Azure OpenAI erbjuder två metoder för autentisering. Du kan använda antingen API-nycklar eller Microsoft Entra ID.

  • API-nyckelautentisering: För denna typ av autentisering måste alla API-förfrågningar inkludera API-nyckeln i api-key HTTP-headern. Quickstart ger vägledning för hur man gör samtal med denna typ av autentisering.

  • Microsoft Entra ID autentisering: Du kan autentisera ett API-anrop med en Microsoft Entra-token. Autentiseringstoken ingår i en förfrågan som Authorization header. Den givna token måste föregås av Bearer, till exempel Bearer YOUR_AUTH_TOKEN. Du kan läsa vår guide om autentisera med Microsoft Entra ID.

REST API-versionshantering

Tjänste-API:erna versioneras med hjälp av frågeparametern api-version . Alla versioner följer YYYY-MM-DD datumstrukturen. Ett exempel:

POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/chat/completions?api-version=2024-06-01

Dataplansinferens

Resten av artikeln täcker GA:s version av Azure OpenAI:s specifikation för dataplansinferens, 2024-10-21.

Om du letar efter dokumentation om den senaste förhandsversionen av API:et läser du det senaste api:et för förhandsversion av dataplanets slutsatsdragning.

Avslutningar

POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2024-10-21

Skapar en komplettering för den tillhandahållna prompten, parametrarna och den valda modellen.

URI parametrar

Name I Obligatoriskt Type Description
slutpunkt path Ja string
url
Stödd Azure OpenAI-endpoints (protokoll och värdnamn, till exempel: https://aoairesource.openai.azure.com. Byt ut "aoairesource" mot ditt Azure OpenAI-resursnamn). https://{your-resource-name}.openai.azure.com
driftsättnings-id path Ja string Distributions-ID för modellen som distribuerades.
api-version Fråga Ja string API-version

Begärandehuvud

Name Obligatoriskt Type Description
API-nyckel True string Tillhandahåll Azure OpenAI API-nyckel här

Begärandekropp

Innehållstyp: program/json

Name Type Description Obligatoriskt Standardinställning
prompt Sträng eller array Prompten/promptarna för att generera kompletteringar för, kodade som en sträng, array av strängar, array av tokens eller array av token-arrayer.

Observera att <|endoftext|> är dokumentseparatorn som modellen ser under träningen, så om en prompt inte anges kommer modellen att generera som om det vore från början av ett nytt dokument.
Ja
bäst_av integer Genererar best_of fullbordanden serversidan och returnerar "bäst" (den med högst loggsannolikhet per token). Resultaten kan inte strömmas.

När den används med nstyr den best_of antalet kandidatfullbordaner och n specificerar hur många som ska returneras – best_of måste vara större än n.

Notera: Eftersom denna parameter genererar många kompletteringar kan den snabbt förbruka din tokenkvot. Använd noggrant och se till att du har rimliga inställningar för max_tokens och stop.
No 1
echo boolean Echo tillbaka prompten utöver slutförandet
No Falsk
frekvensstraff number Siffran mellan -2,0 och 2,0. Positiva värden straffar nya tokens baserat på deras befintliga frekvens i texten hittills, vilket minskar modellens sannolikhet att upprepa samma rad ordagrant.
No 0
logit_bias object Ändra sannolikheten för att specificerade tokens ska dyka upp i slutförandet.

Accepterar ett JSON-objekt som mappar tokens (specificerade av deras token-ID i GPT-tokenizern) till ett associerat biasvärde från -100 till 100. Matematiskt läggs biasen till de logits som genereras av modellen före urvalet. Den exakta effekten varierar mellan modell, men värden mellan -1 och 1 bör minska eller öka sannolikheten för urval; Värden som -100 eller 100 bör leda till avstängning eller exklusivt val av relevant token.

Som exempel kan du passa {"50256": -100} för att förhindra <att |endoftext|> token genereras.
No Ingen
logprobs integer Inkludera logsannolikheterna på de logprobs mest sannolika utdatatokenen, samt de valda tokens. Till exempel, om logprobs är 5, kommer API:et att returnera en lista över de fem mest sannolika tokens. API:et kommer alltid att returnera den provtagna token, logprob så det kan finnas upp till element logprobs+1 i svaret.

Maxvärdet för logprobs är 5.
No Ingen
maximalt antal token integer Det maximala antalet tokens som kan genereras i slutförandet.

Token-antalet för din prompt plus max_tokens får inte överstiga modellens kontextlängd.
No 16
n integer Hur många kompletteringar som ska genereras för varje prompt.

Notera: Eftersom denna parameter genererar många kompletteringar kan den snabbt förbruka din tokenkvot. Använd noggrant och se till att du har rimliga inställningar för max_tokens och stop.
No 1
presence_penalty number Siffran mellan -2,0 och 2,0. Positiva värden straffar nya tokens baserat på om de hittills förekommer i texten, vilket ökar modellens sannolikhet att tala om nya ämnen.
No 0
seed integer Om det specificeras kommer vårt system att göra sitt bästa för att provta deterministiskt, så att upprepade förfrågningar med samma seed och parametrar ska ge samma resultat.

Determinism är inte garanterad, och du bör använda responsparametern system_fingerprint för att övervaka förändringar i backend.
No
stop Sträng eller array Upp till fyra sekvenser där API:et slutar generera ytterligare tokens. Den returnerade texten kommer inte att innehålla stoppsekvensen.
No
stream boolean Om man ska streama tillbaka delvis framsteg. Om de är satta skickas tokens som data-enbart serverskickade händelser när de blir tillgängliga, och strömmen avslutas med ett data: [DONE] meddelande. No Falsk
Suffix string Suffixet som kommer efter att den insatta texten har slutförts.

Denna parameter stöds endast för gpt-3.5-turbo-instruct.
No Ingen
Temperatur number Vilken provtagningstemperatur ska användas, mellan 0 och 2. Högre värden som 0,8 gör resultatet mer slumpmässigt, medan lägre värden som 0,2 gör det mer fokuserat och deterministiskt.

Vi rekommenderar generellt att ändra detta eller top_p båda.
No 1
top_p number Ett alternativ till provtagning med temperatur, kallat kärnprovtagning, där modellen beaktar resultaten från tokens med top_p sannolikhetsmassa. Så 0,1 betyder att endast tokens som utgör de 10 främsta% sannolikhetsmassan beaktas.

Vi rekommenderar generellt att ändra detta eller temperature båda.
No 1
user string En unik identifierare som representerar din slutanvändare, vilket kan hjälpa till att övervaka och upptäcka missbruk.
No

Responses

Statuskod: 200

Beskrivning: OK

Innehållstyp Type Beskrivning
application/json createCompletionResponse Representerar ett fullbordandesvar från API:et. Observera: både de strömmade och icke-strömmade svarsobjekten har samma form (till skillnad från chattändpunkten).

Statuskod: standard

Beskrivning: Tjänsten är inte tillgänglig

Innehållstyp Type Beskrivning
application/json errorResponse

Examples

Example

Skapar en komplettering för den tillhandahållna prompten, parametrarna och den valda modellen.

POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2024-10-21

{
 "prompt": [
  "tell me a joke about mango"
 ],
 "max_tokens": 32,
 "temperature": 1.0,
 "n": 1
}

Svar: Statuskod: 200

{
  "body": {
    "id": "cmpl-7QmVI15qgYVllxK0FtxVGG6ywfzaq",
    "created": 1686617332,
    "choices": [
      {
        "text": "es\n\nWhat do you call a mango who's in charge?\n\nThe head mango.",
        "index": 0,
        "finish_reason": "stop",
        "logprobs": null
      }
    ],
    "usage": {
      "completion_tokens": 20,
      "prompt_tokens": 6,
      "total_tokens": 26
    }
  }
}

Inbäddningar

POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2024-10-21

Få en vektorrepresentation av en given input som enkelt kan konsumeras av maskininlärningsmodeller och algoritmer.

URI parametrar

Name I Obligatoriskt Type Description
slutpunkt path Ja string
url
Stödd Azure OpenAI-endpoints (protokoll och värdnamn, till exempel: https://aoairesource.openai.azure.com. Byt ut "aoairesource" mot ditt Azure OpenAI-resursnamn). https://{your-resource-name}.openai.azure.com
driftsättnings-id path Ja string
api-version Fråga Ja string API-version

Begärandehuvud

Name Obligatoriskt Type Description
API-nyckel True string Tillhandahåll Azure OpenAI API-nyckel här

Begärandekropp

Innehållstyp: program/json

Name Type Description Obligatoriskt Standardinställning
input Sträng eller array Mata in text för att bädda in, kodad som en sträng eller array av tokens. För att bädda in flera indata i en enda förfrågan, skicka en array av strängar eller en array av tokenarrayer. Inmatningen får inte överstiga maxantalet inmatningstoken för modellen (8 192 tokens för text-embedding-ada-002), får inte vara en tom sträng, och varje array måste vara 2 048 dimensioner eller mindre. Förutom gränsen för token per indata framtvingar alla inbäddningsmodeller högst 300 000 token som summeras för alla indata i en enda begäran. Ja
user string En unik identifierare som representerar din slutanvändare, vilket kan hjälpa till att övervaka och upptäcka missbruk. No
inmatningstyp string Inmatningstyp av inbäddningssökning att använda No
encoding_format string Formatet för att returnera inbäddningarna. Det kan vara antingen float eller base64. Går som standard till float. No
dimensioner integer Antalet dimensioner som de resulterande utdatainbäddningarna bör ha. Endast stödd i text-embedding-3 och senare modeller. No

Responses

Name Type Description Obligatoriskt Standardinställning
object string Ja
model string Ja
data array Ja
användning object Ja

Egenskaper för användning

prompt_tokens

Name Type Description Standardinställning
prompt_tokens integer

total_tokens

Name Type Description Standardinställning
total_tokens integer

Statuskod: 200

Beskrivning: OK

Innehållstyp Type Beskrivning
application/json object

Examples

Example

Returnera embeddingarna för en given prompt.

POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2024-10-21

{
 "input": [
  "this is a test"
 ]
}

Svar: Statuskod: 200

{
  "body": {
    "data": [
      {
        "index": 0,
        "embedding": [
          -0.012838088,
          -0.007421397,
          -0.017617522,
          -0.028278312,
          -0.018666342,
          0.01737855,
          -0.01821495,
          -0.006950092,
          -0.009937238,
          -0.038580645,
          0.010674067,
          0.02412286,
          -0.013647936,
          0.013189907,
          0.0021125758,
          0.012406612,
          0.020790534,
          0.00074595667,
          0.008397198,
          -0.00535031,
          0.008968075,
          0.014351576,
          -0.014086051,
          0.015055214,
          -0.022211088,
          -0.025198232,
          0.0065186154,
          -0.036350243,
          0.009180495,
          -0.009698266,
          0.009446018,
          -0.008463579,
          -0.0040426035,
          -0.03443847,
          -0.00091273896,
          -0.0019217303,
          0.002349888,
          -0.021560553,
          0.016515596,
          -0.015572986,
          0.0038666942,
          -8.432463e-05
        ]
      }
    ],
    "usage": {
      "prompt_tokens": 4,
      "total_tokens": 4
    }
  }
}

Chatten har slutförts

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21

Skapar en komplettering för chattmeddelandet

URI parametrar

Name I Obligatoriskt Type Description
slutpunkt path Ja string
url
Stödd Azure OpenAI-endpoints (protokoll och värdnamn, till exempel: https://aoairesource.openai.azure.com. Byt ut "aoairesource" mot ditt Azure OpenAI-resursnamn). https://{your-resource-name}.openai.azure.com
driftsättnings-id path Ja string Distributions-ID för modellen som distribuerades.
api-version Fråga Ja string API-version

Begärandehuvud

Name Obligatoriskt Type Description
API-nyckel True string Tillhandahåll Azure OpenAI API-nyckel här

Begärandekropp

Innehållstyp: program/json

Name Type Description Obligatoriskt Standardinställning
Temperatur number Vilken provtagningstemperatur ska användas, mellan 0 och 2. Högre värden som 0,8 gör resultatet mer slumpmässigt, medan lägre värden som 0,2 gör det mer fokuserat och deterministiskt.

Vi rekommenderar generellt att ändra detta eller top_p båda.
No 1
top_p number Ett alternativ till provtagning med temperatur, kallat kärnprovtagning, där modellen beaktar resultaten från tokens med top_p sannolikhetsmassa. Så 0,1 betyder att endast tokens som utgör de 10 främsta% sannolikhetsmassan beaktas.

Vi rekommenderar generellt att ändra detta eller temperature båda.
No 1
stream boolean Om det är inställt skickas delvisa meddelandedeltas, som i ChatGPT. Tokens kommer att skickas som data-only serverskickade händelser när de blir tillgängliga, och strömmen avslutas med ett data: [DONE] meddelande. No Falsk
stop Sträng eller array Upp till fyra sekvenser där API:et slutar generera ytterligare tokens.
No
maximalt antal token integer Det maximala antalet tokens som kan genereras i chatten.

Den totala längden på inmatningstokens och genererade tokens begränsas av modellens kontextlängd.
No
max_completion_tokens integer En övre gräns för antalet tokens som kan genereras för en fullbordan, inklusive synliga utdatatokens och resonemangstokens. No
presence_penalty number Siffran mellan -2,0 och 2,0. Positiva värden straffar nya tokens baserat på om de hittills förekommer i texten, vilket ökar modellens sannolikhet att tala om nya ämnen.
No 0
frekvensstraff number Siffran mellan -2,0 och 2,0. Positiva värden straffar nya tokens baserat på deras befintliga frekvens i texten hittills, vilket minskar modellens sannolikhet att upprepa samma rad ordagrant.
No 0
logit_bias object Ändra sannolikheten för att specificerade tokens ska dyka upp i slutförandet.

Accepterar ett JSON-objekt som mappar tokens (specificerade av deras token-ID i tokenizern) till ett associerat biasvärde från -100 till 100. Matematiskt läggs biasen till de logits som genereras av modellen före urvalet. Den exakta effekten varierar mellan modell, men värden mellan -1 och 1 bör minska eller öka sannolikheten för urval; Värden som -100 eller 100 bör leda till avstängning eller exklusivt val av relevant token.
No Ingen
user string En unik identifierare som representerar din slutanvändare, vilket kan hjälpa till att övervaka och upptäcka missbruk.
No
messages array En lista med meddelanden som utgör konversationen hittills. Ja
data_sources array Konfigurationsposterna för Azure OpenAI-chatttillägg som använder dem.
Denna tilläggsspecifikation är endast kompatibel med Azure OpenAI.
No
logprobs boolean Om man ska returnera loggsannolikheter för utdatatokens eller inte. Om sann, returnerar logsannolikheterna för varje utdata som returnerats i av contentmessage. No Falsk
top_logprobs integer Ett heltal mellan 0 och 20 som anger antalet mest sannolika tokens att returnera vid varje tokenposition, var och en med tillhörande log-sannolikhet. logprobs måste sättas till true om denna parameter används. No
n integer Hur många chattfullbordandeval som ska genereras för varje inmatningsmeddelande. Observera att du debiteras baserat på antalet genererade tokens i alla val. Se n till att 1 minimera kostnaderna. No 1
parallella verktygsanrop ParallelToolCalls Om man ska aktivera parallell funktionsanrop under verktygsanvändning. No True
svarsformat ResponseFormatText eller ResponseFormatJsonObject eller ResponseFormatJsonSchema Ett objekt som specificerar formatet som modellen måste ge utmatning. Kompatibel med GPT-4o, GPT-4o mini, GPT-4 Turbo och alla GPT-3.5 Turbo-modeller nyare än gpt-3.5-turbo-1106.

Att sätta på { "type": "json_schema", "json_schema": {...} } aktiverar strukturerade utdata som garanterar att modellen kommer att matcha ditt tillhandahållna JSON-schema.

Att sätta på { "type": "json_object" } aktiverar JSON-läge, vilket garanterar att meddelandet som modellen genererar är giltigt JSON.

Viktigt: när du använder JSON-läge måste du också instruera modellen att själv producera JSON via ett system- eller användarmeddelande. Utan detta kan modellen generera en oändlig ström av whitespace tills genereringen når tokengränsen, vilket resulterar i en långvarig och till synes "fastkilad" förfrågan. Observera också att meddelandeinnehållet kan vara delvis avskuret om finish_reason="length", vilket indikerar att genereringen överskridits max_tokens eller att konversationen överskred maxkontextlängden.
No
seed integer Denna funktion är i beta.
Om det specificeras kommer vårt system att göra sitt bästa för att provta deterministiskt, så att upprepade förfrågningar med samma seed och parametrar ska ge samma resultat.
Determinism är inte garanterad, och du bör använda responsparametern system_fingerprint för att övervaka förändringar i backend.
No
tools array En lista över verktyg som modellen kan anropa. För närvarande stöds endast funktioner som verktyg. Använd detta för att tillhandahålla en lista över funktioner som modellen kan generera JSON-indata för. Maximalt 128 funktioner stöds.
No
tool_choice chatCompletionToolChoiceOption Styr vilket (om något) verktyg som anropas av modellen. none Det betyder att modellen inte anropar något verktyg utan istället genererar ett meddelande. auto Det innebär att modellen kan välja mellan att generera ett meddelande eller att anropa ett eller flera verktyg. required betyder att modellen måste anropa ett eller flera verktyg. Att specificera ett visst verktyg via {"type": "function", "function": {"name": "my_function"}} tvingar modellen att anropa det verktyget. none är standarden när inga verktyg finns. auto är standarden om verktyg finns. No
function_call sträng eller chatCompletionFunctionCallOption Föråldrad till förmån för tool_choice.

Styr vilken (om någon) funktion som anropas av modellen.
none betyder att modellen inte anropar en funktion utan istället genererar ett meddelande.
auto innebär att modellen kan välja mellan att generera ett meddelande eller anropa en funktion.
Att specificera en viss funktion via {"name": "my_function"} tvingar modellen att anropa den funktionen.

none är standarden när inga funktioner finns. auto är standard om funktioner finns.
No
functions array Föråldrad till förmån för tools.

En lista över funktioner som modellen kan generera JSON-indata för.
No

Responses

Statuskod: 200

Beskrivning: OK

Innehållstyp Type Beskrivning
application/json createChatCompletionResponse eller createChatCompletionStreamResponse

Statuskod: standard

Beskrivning: Tjänsten är inte tillgänglig

Innehållstyp Type Beskrivning
application/json errorResponse

Examples

Example

Skapar en komplettering för den tillhandahållna prompten, parametrarna och den valda modellen.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21

{
 "messages": [
  {
   "role": "system",
   "content": "you are a helpful assistant that talks like a pirate"
  },
  {
   "role": "user",
   "content": "can you tell me how to care for a parrot?"
  }
 ]
}

Svar: Statuskod: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Ahoy matey! So ye be wantin' to care for a fine squawkin' parrot, eh? Well, shiver me timbers, let ol' Cap'n Assistant share some wisdom with ye! Here be the steps to keepin' yer parrot happy 'n healthy:\n\n1. Secure a sturdy cage: Yer parrot be needin' a comfortable place to lay anchor! Be sure ye get a sturdy cage, at least double the size of the bird's wingspan, with enough space to spread their wings, yarrrr!\n\n2. Perches 'n toys: Aye, parrots need perches of different sizes, shapes, 'n textures to keep their feet healthy. Also, a few toys be helpin' to keep them entertained 'n their minds stimulated, arrrh!\n\n3. Proper grub: Feed yer feathered friend a balanced diet of high-quality pellets, fruits, 'n veggies to keep 'em strong 'n healthy. Give 'em fresh water every day, or ye\u00e2\u20ac\u2122ll have a scurvy bird on yer hands!\n\n4. Cleanliness: Swab their cage deck! Clean their cage on a regular basis: fresh water 'n food daily, the floor every couple of days, 'n a thorough scrubbing ev'ry few weeks, so the bird be livin' in a tidy haven, arrhh!\n\n5. Socialize 'n train: Parrots be a sociable lot, arrr! Exercise 'n interact with 'em daily to create a bond 'n maintain their mental 'n physical health. Train 'em with positive reinforcement, treat 'em kindly, yarrr!\n\n6. Proper rest: Yer parrot be needin' \u00e2\u20ac\u2122bout 10-12 hours o' sleep each night. Cover their cage 'n let them slumber in a dim, quiet quarter for a proper night's rest, ye scallywag!\n\n7. Keep a weather eye open for illness: Birds be hidin' their ailments, arrr! Be watchful for signs of sickness, such as lethargy, loss of appetite, puffin' up, or change in droppings, and make haste to a vet if need be.\n\n8. Provide fresh air 'n avoid toxins: Parrots be sensitive to draft and pollutants. Keep yer quarters well ventilated, but no drafts, arrr! Be mindful of toxins like Teflon fumes, candles, or air fresheners.\n\nSo there ye have it, me hearty! With proper care 'n commitment, yer parrot will be squawkin' \"Yo-ho-ho\" for many years to come! Good luck, sailor, and may the wind be at yer back!"
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Skapar en komplettering baserad på Azure Search-data och systemtilldelad hanterad identitet.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_search",
   "parameters": {
    "endpoint": "https://your-search-endpoint.search.windows.net/",
    "index_name": "{index name}",
    "authentication": {
     "type": "system_assigned_managed_identity"
    }
   }
  }
 ]
}

Svar: Statuskod: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Skapar en komplettering baserad på Azure Search-vektordata, tidigare assistentmeddelande och användartilldelad hanterad identitet.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a cat?"
  },
  {
   "role": "assistant",
   "content": "Content of the completion [doc1].",
   "context": {
    "intent": "cat care"
   }
  },
  {
   "role": "user",
   "content": "how about dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_search",
   "parameters": {
    "endpoint": "https://your-search-endpoint.search.windows.net/",
    "authentication": {
     "type": "user_assigned_managed_identity",
     "managed_identity_resource_id": "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{resource-name}"
    },
    "index_name": "{index name}",
    "query_type": "vector",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "in_scope": true,
    "top_n_documents": 5,
    "strictness": 3,
    "role_information": "You are an AI assistant that helps people find information.",
    "fields_mapping": {
     "content_fields_separator": "\\n",
     "content_fields": [
      "content"
     ],
     "filepath_field": "filepath",
     "title_field": "title",
     "url_field": "url",
     "vector_fields": [
      "contentvector"
     ]
    }
   }
  }
 ]
}

Svar: Statuskod: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content 2.",
                "title": "Citation Title 2",
                "filepath": "contoso2.txt",
                "url": "https://contoso.blob.windows.net/container/contoso2.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Skapar en komplettering för den medföljande Azure Cosmos DB.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_cosmos_db",
   "parameters": {
    "authentication": {
     "type": "connection_string",
     "connection_string": "mongodb+srv://rawantest:{password}$@{cluster-name}.mongocluster.cosmos.azure.com/?tls=true&authMechanism=SCRAM-SHA-256&retrywrites=false&maxIdleTimeMS=120000"
    },
    "database_name": "vectordb",
    "container_name": "azuredocs",
    "index_name": "azuredocindex",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "fields_mapping": {
     "content_fields": [
      "content"
     ],
     "vector_fields": [
      "contentvector"
     ]
    }
   }
  }
 ]
}

Svar: Statuskod: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Transkriptioner - Skapa

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21

Transkriberar ljudet till inmatningsspråket.

URI parametrar

Name I Obligatoriskt Type Description
slutpunkt path Ja string
url
Stödd Azure OpenAI-endpoints (protokoll och värdnamn, till exempel: https://aoairesource.openai.azure.com. Byt ut "aoairesource" mot ditt Azure OpenAI-resursnamn). https://{your-resource-name}.openai.azure.com
driftsättnings-id path Ja string Distributions-ID för tal-till-text-modellen.

För information om stödda modeller, se [/azure/ai-foundry/openai/concepts/models#audio-models].
api-version Fråga Ja string API-version

Begärandehuvud

Name Obligatoriskt Type Description
API-nyckel True string Tillhandahåll Azure OpenAI API-nyckel här

Begärandekropp

Innehållstyp: flera delar/formulärdata

Name Type Description Obligatoriskt Standardinställning
fil string Ljudfilobjektet att transkribera. Ja
prompt string En valfri text för att styra modellens stil eller fortsätta ett tidigare ljudsegment. Prompten ska matcha ljudspråket. No
svarsformat audioResponseFormat Definierar formatet på utdatan. No
Temperatur number Provtagningstemperaturen, mellan 0 och 1. Högre värden som 0,8 gör resultatet mer slumpmässigt, medan lägre värden som 0,2 gör det mer fokuserat och deterministiskt. Om den sätts till 0 kommer modellen att använda logaritmisk sannolikhet för att automatiskt öka temperaturen tills vissa tröskelvärden nås. No 0
language string Språket för inmatningsljudet. Att tillhandahålla inmatningsspråket i ISO-639-1-format kommer att förbättra noggrannhet och latens. No

Responses

Statuskod: 200

Beskrivning: OK

Innehållstyp Type Beskrivning
application/json audioResponse eller audioVerboseResponse
text/plain string Transkriberad text i utdataformatet (när response_format var text, vtt eller srt).

Examples

Example

Får transkriberad text och tillhörande metadata från tillhandahållen talad ljuddata.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21

Svar: Statuskod: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Example

Får transkriberad text och tillhörande metadata från tillhandahållen talad ljuddata.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Svar: Statuskod: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Översättningar - Skapa

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21

Transkriberar och översätter inmatat ljud till engelsk text.

URI parametrar

Name I Obligatoriskt Type Description
slutpunkt path Ja string
url
Stödd Azure OpenAI-endpoints (protokoll och värdnamn, till exempel: https://aoairesource.openai.azure.com. Byt ut "aoairesource" mot ditt Azure OpenAI-resursnamn). https://{your-resource-name}.openai.azure.com
driftsättnings-id path Ja string Distributions-ID för den whisper-modell som distribuerades.

För information om stödda modeller, se [/azure/ai-foundry/openai/concepts/models#audio-models].
api-version Fråga Ja string API-version

Begärandehuvud

Name Obligatoriskt Type Description
API-nyckel True string Tillhandahåll Azure OpenAI API-nyckel här

Begärandekropp

Innehållstyp: flera delar/formulärdata

Name Type Description Obligatoriskt Standardinställning
fil string Ljudfilen att översätta. Ja
prompt string En valfri text för att styra modellens stil eller fortsätta ett tidigare ljudsegment. Uppgiften ska vara på engelska. No
svarsformat audioResponseFormat Definierar formatet på utdatan. No
Temperatur number Provtagningstemperaturen, mellan 0 och 1. Högre värden som 0,8 gör resultatet mer slumpmässigt, medan lägre värden som 0,2 gör det mer fokuserat och deterministiskt. Om den sätts till 0 kommer modellen att använda logaritmisk sannolikhet för att automatiskt öka temperaturen tills vissa tröskelvärden nås. No 0

Responses

Statuskod: 200

Beskrivning: OK

Innehållstyp Type Beskrivning
application/json audioResponse eller audioVerboseResponse
text/plain string Transkriberad text i utdataformatet (när response_format var text, vtt eller srt).

Examples

Example

Hämtar engelskspråkig transkriberad text och tillhörande metadata från tillhandahållen talad ljuddata.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Svar: Statuskod: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Example

Hämtar engelskspråkig transkriberad text och tillhörande metadata från tillhandahållen talad ljuddata.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Svar: Statuskod: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Bildgenerering

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2024-10-21

Genererar en batch bilder från en texttext på en given dall-e-modelldistribution

URI parametrar

Name I Obligatoriskt Type Description
slutpunkt path Ja string
url
Stödd Azure OpenAI-endpoints (protokoll och värdnamn, till exempel: https://aoairesource.openai.azure.com. Byt ut "aoairesource" mot ditt Azure OpenAI-resursnamn). https://{your-resource-name}.openai.azure.com
driftsättnings-id path Ja string Distributions-ID för dall-e-modellen som distribuerades.
api-version Fråga Ja string API-version

Begärandehuvud

Name Obligatoriskt Type Description
API-nyckel True string Tillhandahåll Azure OpenAI API-nyckel här

Begärandekropp

Innehållstyp: program/json

Name Type Description Obligatoriskt Standardinställning
prompt string En textbeskrivning av den önskade bilden/bilderna. Den maximala längden är 4 000 tecken. Ja
n integer Antalet bilder som ska genereras. No 1
size imageSize Storleken på de genererade bilderna. No 1024x1024
svarsformat imagesResponseFormat Formatet i vilket de genererade bilderna returneras. No url
user string En unik identifierare som representerar din slutanvändare, vilket kan hjälpa till att övervaka och upptäcka missbruk. No
kvalitet imageQuality Bildkvaliteten som kommer att genereras. No standard
Stil imageStyle Stilen på de genererade bilderna. No Levande

Responses

Statuskod: 200

Beskrivning: Ok

Innehållstyp Type Beskrivning
application/json generateImagesResponse

Statuskod: standard

Beskrivning: Ett fel uppstod.

Innehållstyp Type Beskrivning
application/json dalleErrorResponse

Examples

Example

Skapar bilder med en prompt.

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2024-10-21

{
 "prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
 "n": 1,
 "style": "natural",
 "quality": "standard"
}

Svar: Statuskod: 200

{
  "body": {
    "created": 1698342300,
    "data": [
      {
        "revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
        "prompt_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          },
          "profanity": {
            "detected": false,
            "filtered": false
          }
        },
        "url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
        "content_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          }
        }
      }
    ]
  }
}

Components

errorResponse

Name Type Description Obligatoriskt Standardinställning
fel error No

errorBase

Name Type Description Obligatoriskt Standardinställning
kod string No
message string No

fel

Name Type Description Obligatoriskt Standardinställning
Param string No
type string No
inner_error innerError Inre fel med ytterligare detaljer. No

innerError

Inre fel med ytterligare detaljer.

Name Type Description Obligatoriskt Standardinställning
kod innerErrorCode Felkoder för det inre felobjektet. No
content_filter_results contentFilterPromptResults Information om innehållsfiltreringskategorin (hat, sexuell, våld, self_harm), om den har upptäckts, samt allvarlighetsgraden (very_low, låg, medel, hög skala som avgör intensiteten och risknivån för skadligt innehåll) och om den har filtrerats eller inte. Information om jailbreak-innehåll och svordomar, om det har upptäckts och om det har filtrerats eller inte. Och information om kundblocklistan, om den har filtrerats och dess ID. No

innerErrorCode

Felkoder för det inre felobjektet.

Beskrivning: Felkoder för det inre felobjektet.

Typ: sträng

Standard:

Enumnamn: InnerErrorCode

Uppräkningsvärden:

Value Description
Ansvarsfull AI-policyöverträdelser Prompten bröt mot en av fler regler för innehållsfilter.

dalleErrorResponse

Name Type Description Obligatoriskt Standardinställning
fel dalleError No

dalleError

Name Type Description Obligatoriskt Standardinställning
Param string No
type string No
inner_error dalleInnerError Inre fel med ytterligare detaljer. No

dalleInnerError

Inre fel med ytterligare detaljer.

Name Type Description Obligatoriskt Standardinställning
kod innerErrorCode Felkoder för det inre felobjektet. No
content_filter_results dalleFilterResults Information om innehållsfiltreringskategorin (hat, sexuell, våld, self_harm), om den har upptäckts, samt allvarlighetsgraden (very_low, låg, medel, hög skala som avgör intensiteten och risknivån för skadligt innehåll) och om den har filtrerats eller inte. Information om jailbreak-innehåll och svordomar, om det har upptäckts och om det har filtrerats eller inte. Och information om kundblocklistan, om den har filtrerats och dess ID. No
Omarbetad uppmaning string Prompten som användes för att generera bilden, om det fanns någon revidering av prompten. No

Resultat av Innehållsfilterbas

Name Type Description Obligatoriskt Standardinställning
Filtrerade boolean Ja

innehållsfilterallvarlighetsresultat

Name Type Description Obligatoriskt Standardinställning
Filtrerade boolean Ja
severity string No

Resultat för innehållsfilter upptäckt

Name Type Description Obligatoriskt Standardinställning
Filtrerade boolean Ja
Upptäckt boolean No

innehållsfilter upptäckt med citeringsresultat

Name Type Description Obligatoriskt Standardinställning
Citat object No

Egenskaper för citering

URL

Name Type Description Standardinställning
URL string

license

Name Type Description Standardinställning
license string

innehållFilterResultatBas

Information om innehållet filtreringsresultat.

Name Type Description Obligatoriskt Standardinställning
Sexuella innehållsfilterAlvarlighetsResultat No
Våld innehållsfilterAlvarlighetsResultat No
Hatar innehållsfilterAlvarlighetsResultat No
self_harm innehållsfilterAlvarlighetsResultat No
Svordomar innehållsfilterdetekteratresultat No
fel errorBase No

contentFilterPromptResults

Information om innehållsfiltreringskategorin (hat, sexuell, våld, self_harm), om den har upptäckts, samt allvarlighetsgraden (very_low, låg, medel, hög skala som avgör intensiteten och risknivån för skadligt innehåll) och om den har filtrerats eller inte. Information om jailbreak-innehåll och svordomar, om det har upptäckts och om det har filtrerats eller inte. Och information om kundblocklistan, om den har filtrerats och dess ID.

Name Type Description Obligatoriskt Standardinställning
Sexuella innehållsfilterAlvarlighetsResultat No
Våld innehållsfilterAlvarlighetsResultat No
Hatar innehållsfilterAlvarlighetsResultat No
self_harm innehållsfilterAlvarlighetsResultat No
Svordomar innehållsfilterdetekteratresultat No
fel errorBase No
Jailbreak innehållsfilterdetekteratresultat No

resultatFörInnehållsfilterVal

Information om innehållsfiltreringskategorin (hat, sexuell, våld, self_harm), om den har upptäckts, samt allvarlighetsgraden (very_low, låg, medel, hög skala som avgör intensiteten och risknivån för skadligt innehåll) och om den har filtrerats eller inte. Information om tredjepartstext och svordomar, om det har upptäckts och om det har filtrerats eller inte. Och information om kundblocklistan, om den har filtrerats och dess ID.

Name Type Description Obligatoriskt Standardinställning
Sexuella innehållsfilterAlvarlighetsResultat No
Våld innehållsfilterAlvarlighetsResultat No
Hatar innehållsfilterAlvarlighetsResultat No
self_harm innehållsfilterAlvarlighetsResultat No
Svordomar innehållsfilterdetekteratresultat No
fel errorBase No
protected_material_text innehållsfilterdetekteratresultat No
protected_material_code innehållsfilter upptäckt med citeringsresultat No

uppmaningsfilterresultat

Innehållsfiltrering resulterar för en enda prompt i förfrågan.

Name Type Description Obligatoriskt Standardinställning
prompt_index integer No
content_filter_results contentFilterPromptResults Information om innehållsfiltreringskategorin (hat, sexuell, våld, self_harm), om den har upptäckts, samt allvarlighetsgraden (very_low, låg, medel, hög skala som avgör intensiteten och risknivån för skadligt innehåll) och om den har filtrerats eller inte. Information om jailbreak-innehåll och svordomar, om det har upptäckts och om det har filtrerats eller inte. Och information om kundblocklistan, om den har filtrerats och dess ID. No

uppmaningsfilterresultat

Innehållsfiltrering ger noll eller fler promptar i förfrågan. I en streamingförfrågan kan resultaten för olika prompts komma vid olika tidpunkter eller i olika ordning.

Inga egenskaper definierade för denna komponent.

dalle innehållsfilterresultat

Information om innehållet filtreringsresultat.

Name Type Description Obligatoriskt Standardinställning
Sexuella innehållsfilterAlvarlighetsResultat No
Våld innehållsfilterAlvarlighetsResultat No
Hatar innehållsfilterAlvarlighetsResultat No
self_harm innehållsfilterAlvarlighetsResultat No

dalleFilterResults

Information om innehållsfiltreringskategorin (hat, sexuell, våld, self_harm), om den har upptäckts, samt allvarlighetsgraden (very_low, låg, medel, hög skala som avgör intensiteten och risknivån för skadligt innehåll) och om den har filtrerats eller inte. Information om jailbreak-innehåll och svordomar, om det har upptäckts och om det har filtrerats eller inte. Och information om kundblocklistan, om den har filtrerats och dess ID.

Name Type Description Obligatoriskt Standardinställning
Sexuella innehållsfilterAlvarlighetsResultat No
Våld innehållsfilterAlvarlighetsResultat No
Hatar innehållsfilterAlvarlighetsResultat No
self_harm innehållsfilterAlvarlighetsResultat No
Svordomar innehållsfilterdetekteratresultat No
Jailbreak innehållsfilterdetekteratresultat No

chatCompletionsRequestCommon

Name Type Description Obligatoriskt Standardinställning
Temperatur number Vilken provtagningstemperatur ska användas, mellan 0 och 2. Högre värden som 0,8 gör resultatet mer slumpmässigt, medan lägre värden som 0,2 gör det mer fokuserat och deterministiskt.
Vi rekommenderar generellt att ändra detta eller top_p båda.
No 1
top_p number Ett alternativ till provtagning med temperatur, kallat kärnprovtagning, där modellen beaktar resultaten från tokens med top_p sannolikhetsmassa. Så 0,1 betyder att endast tokens som utgör de 10 främsta% sannolikhetsmassan beaktas.
Vi rekommenderar generellt att ändra detta eller temperature båda.
No 1
stream boolean Om det är inställt skickas delvisa meddelandedeltas, som i ChatGPT. Tokens kommer att skickas som data-only serverskickade händelser när de blir tillgängliga, och strömmen avslutas med ett data: [DONE] meddelande. No Falsk
stop Sträng eller array Upp till fyra sekvenser där API:et slutar generera ytterligare tokens. No
maximalt antal token integer Det maximala antalet tokens tillät det genererade svaret. Som standard kommer antalet tokens modellen kan returnera vara (4096 - prompt-tokens). Detta värde är nu föråldrat till förmån för max_completion_tokens, och är inte kompatibelt med O1-seriens modeller. No 4096
max_completion_tokens integer En övre gräns för antalet tokens som kan genereras för en fullbordan, inklusive synliga utdatatokens och resonemangstokens. No
presence_penalty number Siffran mellan -2,0 och 2,0. Positiva värden straffar nya tokens baserat på om de hittills förekommer i texten, vilket ökar modellens sannolikhet att tala om nya ämnen. No 0
frekvensstraff number Siffran mellan -2,0 och 2,0. Positiva värden straffar nya tokens baserat på deras befintliga frekvens i texten hittills, vilket minskar modellens sannolikhet att upprepa samma rad ordagrant. No 0
logit_bias object Ändra sannolikheten för att specificerade tokens ska dyka upp i slutförandet. Accepterar ett json-objekt som mappar tokens (specificerat av deras token-ID i tokenizern) till ett associerat biasvärde från -100 till 100. Matematiskt läggs biasen till de logits som genereras av modellen före urvalet. Den exakta effekten varierar mellan modell, men värden mellan -1 och 1 bör minska eller öka sannolikheten för urval; Värden som -100 eller 100 bör leda till avstängning eller exklusivt val av relevant token. No
user string En unik identifierare som representerar din slutanvändare, vilket kan hjälpa Azure OpenAI att övervaka och upptäcka missbruk. No

skapaFärdigställandebegäran

Name Type Description Obligatoriskt Standardinställning
prompt Sträng eller array Prompten/promptarna för att generera kompletteringar för, kodade som en sträng, array av strängar, array av tokens eller array av token-arrayer.

Observera att <|endoftext|> är dokumentseparatorn som modellen ser under träningen, så om en prompt inte anges kommer modellen att generera som om det vore från början av ett nytt dokument.
Ja
bäst_av integer Genererar best_of fullbordanden serversidan och returnerar "bäst" (den med högst loggsannolikhet per token). Resultaten kan inte strömmas.

När den används med nstyr den best_of antalet kandidatfullbordaner och n specificerar hur många som ska returneras – best_of måste vara större än n.

Notera: Eftersom denna parameter genererar många kompletteringar kan den snabbt förbruka din tokenkvot. Använd noggrant och se till att du har rimliga inställningar för max_tokens och stop.
No 1
echo boolean Echo tillbaka prompten utöver slutförandet
No Falsk
frekvensstraff number Siffran mellan -2,0 och 2,0. Positiva värden straffar nya tokens baserat på deras befintliga frekvens i texten hittills, vilket minskar modellens sannolikhet att upprepa samma rad ordagrant.
No 0
logit_bias object Ändra sannolikheten för att specificerade tokens ska dyka upp i slutförandet.

Accepterar ett JSON-objekt som mappar tokens (specificerade av deras token-ID i GPT-tokenizern) till ett associerat biasvärde från -100 till 100. Matematiskt läggs biasen till de logits som genereras av modellen före urvalet. Den exakta effekten varierar mellan modell, men värden mellan -1 och 1 bör minska eller öka sannolikheten för urval; Värden som -100 eller 100 bör leda till avstängning eller exklusivt val av relevant token.

Som exempel kan du passa {"50256": -100} för att förhindra <att |endoftext|> token genereras.
No Ingen
logprobs integer Inkludera logsannolikheterna på de logprobs mest sannolika utdatatokenen, samt de valda tokens. Till exempel, om logprobs är 5, kommer API:et att returnera en lista över de fem mest sannolika tokens. API:et kommer alltid att returnera den provtagna token, logprob så det kan finnas upp till element logprobs+1 i svaret.

Maxvärdet för logprobs är 5.
No Ingen
maximalt antal token integer Det maximala antalet tokens som kan genereras i slutförandet.

Token-antalet för din prompt plus max_tokens får inte överstiga modellens kontextlängd.
No 16
n integer Hur många kompletteringar som ska genereras för varje prompt.

Notera: Eftersom denna parameter genererar många kompletteringar kan den snabbt förbruka din tokenkvot. Använd noggrant och se till att du har rimliga inställningar för max_tokens och stop.
No 1
presence_penalty number Siffran mellan -2,0 och 2,0. Positiva värden straffar nya tokens baserat på om de hittills förekommer i texten, vilket ökar modellens sannolikhet att tala om nya ämnen.
No 0
seed integer Om det specificeras kommer vårt system att göra sitt bästa för att provta deterministiskt, så att upprepade förfrågningar med samma seed och parametrar ska ge samma resultat.

Determinism är inte garanterad, och du bör använda responsparametern system_fingerprint för att övervaka förändringar i backend.
No
stop Sträng eller array Upp till fyra sekvenser där API:et slutar generera ytterligare tokens. Den returnerade texten kommer inte att innehålla stoppsekvensen.
No
stream boolean Om man ska streama tillbaka delvis framsteg. Om de är satta skickas tokens som data-enbart serverskickade händelser när de blir tillgängliga, och strömmen avslutas med ett data: [DONE] meddelande. No Falsk
Suffix string Suffixet som kommer efter att den insatta texten har slutförts.

Denna parameter stöds endast för gpt-3.5-turbo-instruct.
No Ingen
Temperatur number Vilken provtagningstemperatur ska användas, mellan 0 och 2. Högre värden som 0,8 gör resultatet mer slumpmässigt, medan lägre värden som 0,2 gör det mer fokuserat och deterministiskt.

Vi rekommenderar generellt att ändra detta eller top_p båda.
No 1
top_p number Ett alternativ till provtagning med temperatur, kallat kärnprovtagning, där modellen beaktar resultaten från tokens med top_p sannolikhetsmassa. Så 0,1 betyder att endast tokens som utgör de 10 främsta% sannolikhetsmassan beaktas.

Vi rekommenderar generellt att ändra detta eller temperature båda.
No 1
user string En unik identifierare som representerar din slutanvändare, vilket kan hjälpa till att övervaka och upptäcka missbruk.
No

createCompletionResponse

Representerar ett fullbordandesvar från API:et. Observera: både de strömmade och icke-strömmade svarsobjekten har samma form (till skillnad från chattändpunkten).

Name Type Description Obligatoriskt Standardinställning
id string En unik identifierare för fullföljelsen. Ja
Val array Listan över kompletteringsval som modellen genererade för inmatningsprompten. Ja
Skapad integer Unix-tidsstämpeln (i sekunder) för när fullbordandet skapades. Ja
model string Modellen som används för fullbordan. Ja
prompt_filter_results promptFilterResults Innehållsfiltrering ger noll eller fler promptar i förfrågan. I en streamingförfrågan kan resultaten för olika prompts komma vid olika tidpunkter eller i olika ordning. No
system_fingerprint string Detta fingeravtryck representerar backend-konfigurationen som modellen körs med.

Kan användas tillsammans med begäranparametern seed för att förstå när backend-ändringar har gjorts som kan påverka determinismen.
No
object enum Objekttypen, som alltid är "text_completion"
Möjliga värden: text_completion
Ja
användning slutanvändning Användningsstatistik för förfrågan om fullbordan. No

SkapaChattSlutförandeBegäran

Name Type Description Obligatoriskt Standardinställning
Temperatur number Vilken provtagningstemperatur ska användas, mellan 0 och 2. Högre värden som 0,8 gör resultatet mer slumpmässigt, medan lägre värden som 0,2 gör det mer fokuserat och deterministiskt.

Vi rekommenderar generellt att ändra detta eller top_p båda.
No 1
top_p number Ett alternativ till provtagning med temperatur, kallat kärnprovtagning, där modellen beaktar resultaten från tokens med top_p sannolikhetsmassa. Så 0,1 betyder att endast tokens som utgör de 10 främsta% sannolikhetsmassan beaktas.

Vi rekommenderar generellt att ändra detta eller temperature båda.
No 1
stream boolean Om det är inställt skickas delvisa meddelandedeltas, som i ChatGPT. Tokens kommer att skickas som data-only serverskickade händelser när de blir tillgängliga, och strömmen avslutas med ett data: [DONE] meddelande. No Falsk
stop Sträng eller array Upp till fyra sekvenser där API:et slutar generera ytterligare tokens.
No
maximalt antal token integer Det maximala antalet tokens som kan genereras i chatten.

Den totala längden på inmatningstokens och genererade tokens begränsas av modellens kontextlängd.
No
max_completion_tokens integer En övre gräns för antalet tokens som kan genereras för en fullbordan, inklusive synliga utdatatokens och resonemangstokens. No
presence_penalty number Siffran mellan -2,0 och 2,0. Positiva värden straffar nya tokens baserat på om de hittills förekommer i texten, vilket ökar modellens sannolikhet att tala om nya ämnen.
No 0
frekvensstraff number Siffran mellan -2,0 och 2,0. Positiva värden straffar nya tokens baserat på deras befintliga frekvens i texten hittills, vilket minskar modellens sannolikhet att upprepa samma rad ordagrant.
No 0
logit_bias object Ändra sannolikheten för att specificerade tokens ska dyka upp i slutförandet.

Accepterar ett JSON-objekt som mappar tokens (specificerade av deras token-ID i tokenizern) till ett associerat biasvärde från -100 till 100. Matematiskt läggs biasen till de logits som genereras av modellen före urvalet. Den exakta effekten varierar mellan modell, men värden mellan -1 och 1 bör minska eller öka sannolikheten för urval; Värden som -100 eller 100 bör leda till avstängning eller exklusivt val av relevant token.
No Ingen
user string En unik identifierare som representerar din slutanvändare, vilket kan hjälpa till att övervaka och upptäcka missbruk.
No
messages array En lista med meddelanden som utgör konversationen hittills. Ja
data_sources array Konfigurationsposterna för Azure OpenAI-chatttillägg som använder dem.
Denna tilläggsspecifikation är endast kompatibel med Azure OpenAI.
No
logprobs boolean Om man ska returnera loggsannolikheter för utdatatokens eller inte. Om sann, returnerar logsannolikheterna för varje utdata som returnerats i av contentmessage. No Falsk
top_logprobs integer Ett heltal mellan 0 och 20 som anger antalet mest sannolika tokens att returnera vid varje tokenposition, var och en med tillhörande log-sannolikhet. logprobs måste sättas till true om denna parameter används. No
n integer Hur många chattfullbordandeval som ska genereras för varje inmatningsmeddelande. Observera att du debiteras baserat på antalet genererade tokens i alla val. Se n till att 1 minimera kostnaderna. No 1
parallella verktygsanrop ParallelToolCalls Om man ska aktivera parallell funktionsanrop under verktygsanvändning. No True
svarsformat ResponseFormatText eller ResponseFormatJsonObject eller ResponseFormatJsonSchema Ett objekt som specificerar formatet som modellen måste ge utmatning. Kompatibel med GPT-4o, GPT-4o mini, GPT-4 Turbo och alla GPT-3.5 Turbo-modeller nyare än gpt-3.5-turbo-1106.

Att sätta på { "type": "json_schema", "json_schema": {...} } aktiverar strukturerade utdata som garanterar att modellen kommer att matcha ditt tillhandahållna JSON-schema.

Att sätta på { "type": "json_object" } aktiverar JSON-läge, vilket garanterar att meddelandet som modellen genererar är giltigt JSON.

Viktigt: när du använder JSON-läge måste du också instruera modellen att själv producera JSON via ett system- eller användarmeddelande. Utan detta kan modellen generera en oändlig ström av whitespace tills genereringen når tokengränsen, vilket resulterar i en långvarig och till synes "fastkilad" förfrågan. Observera också att meddelandeinnehållet kan vara delvis avskuret om finish_reason="length", vilket indikerar att genereringen överskridits max_tokens eller att konversationen överskred maxkontextlängden.
No
seed integer Denna funktion är i beta.
Om det specificeras kommer vårt system att göra sitt bästa för att provta deterministiskt, så att upprepade förfrågningar med samma seed och parametrar ska ge samma resultat.
Determinism är inte garanterad, och du bör använda responsparametern system_fingerprint för att övervaka förändringar i backend.
No
tools array En lista över verktyg som modellen kan anropa. För närvarande stöds endast funktioner som verktyg. Använd detta för att tillhandahålla en lista över funktioner som modellen kan generera JSON-indata för. Maximalt 128 funktioner stöds.
No
tool_choice chatCompletionToolChoiceOption Styr vilket (om något) verktyg som anropas av modellen. none Det betyder att modellen inte anropar något verktyg utan istället genererar ett meddelande. auto Det innebär att modellen kan välja mellan att generera ett meddelande eller att anropa ett eller flera verktyg. required betyder att modellen måste anropa ett eller flera verktyg. Att specificera ett visst verktyg via {"type": "function", "function": {"name": "my_function"}} tvingar modellen att anropa det verktyget. none är standarden när inga verktyg finns. auto är standarden om verktyg finns. No
function_call sträng eller chatCompletionFunctionCallOption Föråldrad till förmån för tool_choice.

Styr vilken (om någon) funktion som anropas av modellen.
none betyder att modellen inte anropar en funktion utan istället genererar ett meddelande.
auto innebär att modellen kan välja mellan att generera ett meddelande eller anropa en funktion.
Att specificera en viss funktion via {"name": "my_function"} tvingar modellen att anropa den funktionen.

none är standarden när inga funktioner finns. auto är standard om funktioner finns.
No
functions array Föråldrad till förmån för tools.

En lista över funktioner som modellen kan generera JSON-indata för.
No

chattavslutningsfunktioner

Name Type Description Obligatoriskt Standardinställning
description string En beskrivning av vad funktionen gör, använd av modellen för att välja när och hur funktionen ska anropas. No
name string Namnet på funktionen som ska anropas. Måste vara a-z, A-Z, 0-9, eller innehålla understreck och streck, med en maximal längd på 64. Ja
parameters FunctionParameters De parametrar som funktionen accepterar, beskrivs som ett JSON-schemaobjekt. Se guiden för exempel och JSON Schema-referensen för dokumentation om formatet.

Att parameters utelämna definierar en funktion med en tom parameterlista.
No

chattkompletteringsfunktionanropsalternativ

Att specificera en viss funktion via {"name": "my_function"} tvingar modellen att anropa den funktionen.

Name Type Description Obligatoriskt Standardinställning
name string Namnet på funktionen att anropa. Ja

förfrågningsmeddelande för chattkomplettering

Denna komponent kan vara en av följande:

chatCompletionRequestSystemMessage

Name Type Description Obligatoriskt Standardinställning
innehåll Sträng eller array Innehållet i systemmeddelandet. Ja
Roll enum Meddelandeförfattarens roll, i detta fall system.
Möjliga värden: system
Ja
name string Ett valfritt namn för deltagaren. Tillhandahåller modellinformation för att skilja deltagare i samma roll. No

chatCompletionRequestUserMessage

Name Type Description Obligatoriskt Standardinställning
innehåll Sträng eller array Innehållet i användarmeddelandet.
Ja
Roll enum Meddelandeförfattarens roll, i detta fall user.
Möjliga värden: användare.
Ja
name string Ett valfritt namn för deltagaren. Tillhandahåller modellinformation för att skilja deltagare i samma roll. No

chatCompletionRequestAssistantMessage

Name Type Description Obligatoriskt Standardinställning
innehåll Sträng eller array Innehållet i assistentmeddelandet. Obligatoriskt om tool_calls inte eller function_call är specificerat.
No
vägran string Avslagsmeddelandet från assistenten. No
Roll enum Meddelandeförfattarens roll, i detta fall assistant.
Möjliga värden: assistent
Ja
name string Ett valfritt namn för deltagaren. Tillhandahåller modellinformation för att skilja deltagare i samma roll. No
tool_calls chatCompletionMessageToolCalls Verktygsanropen som genereras av modellen, såsom funktionsanrop. No
function_call object Föråldrad och ersatt av tool_calls. Namnet och argumenten för en funktion som ska anropas, som genereras av modellen. No

Egenskaper för function_call

arguments

Name Type Description Standardinställning
arguments string Argumenten för att anropa funktionen med, som genereras av modellen i JSON-format. Observera att modellen inte alltid genererar giltig JSON, och kan generera parametrar som inte definieras av ditt funktionsschema. Validera argumenten i din kod innan du anropar din funktion.

name

Name Type Description Standardinställning
name string Namnet på funktionen att anropa.

chatCompletionRequestToolMessage

Name Type Description Obligatoriskt Standardinställning
Roll enum Meddelandeförfattarens roll, i detta fall tool.
Möjliga värden: verktyg
Ja
innehåll Sträng eller array Innehållet i verktygsmeddelandet. Ja
tool_call_id string Verktygssamtal som detta meddelande svarar på. Ja

chatCompletionRequestFunctionMessage

Name Type Description Obligatoriskt Standardinställning
Roll enum Meddelandeförfattarens roll, i detta fall function.
Möjliga värden: funktion
Ja
innehåll string Innehållet i funktionsmeddelandet. Ja
name string Namnet på funktionen att anropa. Ja

chat-komplettering-begäran-systemmeddelande-innehållsdel

Denna komponent kan vara en av följande:

chattSlutförandeBegäranAnvändarMeddelandeInnehållsDel

Denna komponent kan vara en av följande:

chatkompletteringBegäranAssistentMeddelandeInnehållDel

Denna komponent kan vara en av följande:

Meddelandeinnehållsdel för verktygsförfrågan om chattkomplettering

Denna komponent kan vara en av följande:

chatCompletionRequestMessageContentPartText

Name Type Description Obligatoriskt Standardinställning
type enum Typen av innehållsdelen.
Möjliga värden: text
Ja
text string Textinnehållet. Ja

chatCompletionRequestMessageContentPartImage

Name Type Description Obligatoriskt Standardinställning
type enum Typen av innehållsdelen.
Möjliga värden: image_url
Ja
image_url object Ja

Egenskaper för image_url

url

Name Type Description Standardinställning
url string Antingen en URL till bilden eller base64-kodade bilddata.

detail

Name Type Description Standardinställning
detail string Specificerar detaljnivån på bilden. Läs mer i Vision-guiden. bil

chatCompletionRequestMessageContentPartRefusal

Name Type Description Obligatoriskt Standardinställning
type enum Typen av innehållsdelen.
Möjliga värden: vägran
Ja
vägran string Avvisningsmeddelandet som genereras av modellen. Ja

azurechattilläggskonfiguration

En representation av konfigurationsdata för en enda Azure OpenAI-chatttillägg. Detta kommer att användas av en chattkompletteringsförfrågan som bör använda Azure OpenAI-chatttillägg för att förstärka svarsbeteendet. Användningen av denna konfiguration är endast kompatibel med Azure OpenAI.

Name Type Description Obligatoriskt Standardinställning
type azureChatExtensionType En representation av konfigurationsdata för en enda Azure OpenAI-chatttillägg. Detta kommer att användas av en chatt
kompletteringar kräver att ska använda Azure OpenAI-chatttillägg för att förstärka svarsbeteendet.
Användningen av denna konfiguration är endast kompatibel med Azure OpenAI.
Ja

azureChatExtensionType

En representation av konfigurationsdata för en enda Azure OpenAI-chatttillägg. Detta kommer att användas av en chattkompletteringsförfrågan som bör använda Azure OpenAI-chatttillägg för att förstärka svarsbeteendet. Användningen av denna konfiguration är endast kompatibel med Azure OpenAI.

Description: En representation av konfigurationsdata för en enda Azure OpenAI-chatttillägg. Detta kommer att användas av en chattkompletteringsförfrågan som bör använda Azure OpenAI-chatttillägg för att förstärka svarsbeteendet. Användningen av denna konfiguration är endast kompatibel med Azure OpenAI.

Typ: sträng

Standard:

Uppräkningsnamn: AzureChatExtensionType

Uppräkningsvärden:

Value Description
azure_search Representerar användningen av Azure Search som en Azure OpenAI-chatttillägg.
Azure Cosmos DB Representerar användningen av Azure Cosmos DB som en Azure OpenAI chatttillägg.

AzureSearch-chattilläggskonfiguration

En specifik representation av konfigurerbara alternativ för Azure Search när man använder det som en Azure OpenAI-chatttillägg.

Name Type Description Obligatoriskt Standardinställning
type azureChatExtensionType En representation av konfigurationsdata för en enda Azure OpenAI-chatttillägg. Detta kommer att användas av en chatt
kompletteringar kräver att ska använda Azure OpenAI-chatttillägg för att förstärka svarsbeteendet.
Användningen av denna konfiguration är endast kompatibel med Azure OpenAI.
Ja
parameters azureSearchChatExtensionParameters Parametrar för Azure Search när de används som en Azure OpenAI-chatttillägg. No

azureSearchChatExtensionParameters

Parametrar för Azure Search när de används som en Azure OpenAI-chatttillägg.

Name Type Description Obligatoriskt Standardinställning
authentication onYourDataApiNyckelautentiseringOptions eller onYourDataSystemAssignedManagedIdentityAuthenticationOptions eller onYourDataUserAssignedManagedIdentityAuthenticationOptions eller onYourDataUserAssignedManagedIdentityAuthenticationOptions Ja
topp_n_dokument integer Det konfigurerade översta antalet dokument att använda för den konfigurerade frågan. No
inom ramen boolean Om frågor bör begränsas till användning av indexerad data. No
strikthet integer Den konfigurerade striktheten i sökrelevansfiltreringen. Ju högre strikthet, desto högre precision men lägre minne av svaret. No
role_information string Ge modellen instruktioner om hur den ska bete sig och vilken kontext den ska referera till när den genererar ett svar. Du kan beskriva assistentens personlighet och berätta hur svaren ska formateras. Det finns en gräns på 100 tokens för den, och den räknas mot den totala tokengränsen. No
slutpunkt string Den absoluta slutpunktsvägen för Azure Search-resursen att använda. Ja
indexnamn string Namnet på indexet som ska användas som tillgängligt i den refererade Azure Search-resursen. Ja
fältkartläggning alternativ för mappning av fält i Azure-sökindex Valfria inställningar för att styra hur fält bearbetas när man använder en konfigurerad Azure Search-resurs. No
frågetyp azureSearchQueryType Den typ av Azure Search-sökning som ska utföras när den används som en Azure OpenAI-chatttillägg. No
semantisk_konfiguration string Den ytterligare semantiska konfigurationen för frågan. No
filter string Sökfilter. No
inbäddningsberoende onYourDataEndpointVectorizationSource eller onYourDataDeploymentNameVectorizationSource No

alternativ för mappning av fält i Azure-sökindex

Valfria inställningar för att styra hur fält bearbetas när man använder en konfigurerad Azure Search-resurs.

Name Type Description Obligatoriskt Standardinställning
titel_fält string Namnet på indexfältet som ska användas som titel. No
url-fält string Namnet på indexfältet som ska användas som URL. No
filväg_fält string Namnet på indexfältet som ska användas som filsökväg. No
innehållsfält array Namnen på indexfält som bör behandlas som innehåll. No
fältskiljare_innehåll string Det separatormönster som innehållsfälten bör använda. No
vektorfält array Namnen på fält som representerar vektordata. No

azureSökfrågetyp

Den typ av Azure Search-sökning som ska utföras när den används som en Azure OpenAI-chatttillägg.

Description: Den typ av Azure Search-sökningssökning som ska utföras när den används som en Azure OpenAI-chatttillägg.

Typ: sträng

Standard:

Uppräkningsnamn: AzureSearchQueryType

Uppräkningsvärden:

Value Description
simple Representerar standard, enkel frågeparsern.
semantisk Representerar den semantiska frågeparsern för avancerad semantisk modellering.
vektor Representerar vektorsökning över beräknad data.
vektor_enkel_hybrid Representerar en kombination av den enkla frågestrategin med vektordata.
vektor_semantisk_hybrid Representerar en kombination av semantisk sökning och vektordatafrågor.

azureCosmosDBChatExtensionConfiguration

En specifik representation av konfigurerbara alternativ för Azure Cosmos DB när man använder det som en Azure OpenAI-chatttillägg.

Name Type Description Obligatoriskt Standardinställning
type azureChatExtensionType En representation av konfigurationsdata för en enda Azure OpenAI-chatttillägg. Detta kommer att användas av en chatt
kompletteringar kräver att ska använda Azure OpenAI-chatttillägg för att förstärka svarsbeteendet.
Användningen av denna konfiguration är endast kompatibel med Azure OpenAI.
Ja
parameters azureCosmosDBChatExtensionParameters Parametrar att använda när man konfigurerar Azure OpenAI On Your Data chat-tillägg när man använder Azure Cosmos DB för
MongoDB vCore.
No

azureCosmosDBChatExtensionParameters

Parametrar att använda när man konfigurerar Azure OpenAI On Your Data chatttillägg när man använder Azure Cosmos DB för MongoDB vCore.

Name Type Description Obligatoriskt Standardinställning
authentication påDinDataAnslutningssträngAutentiseringsalternativ Autentiseringsalternativen för Azure OpenAI On Your Data när man använder en reťazec pripojenia. Ja
topp_n_dokument integer Det konfigurerade översta antalet dokument att använda för den konfigurerade frågan. No
inom ramen boolean Om frågor bör begränsas till användning av indexerad data. No
strikthet integer Den konfigurerade striktheten i sökrelevansfiltreringen. Ju högre strikthet, desto högre precision men lägre minne av svaret. No
role_information string Ge modellen instruktioner om hur den ska bete sig och vilken kontext den ska referera till när den genererar ett svar. Du kan beskriva assistentens personlighet och berätta hur svaren ska formateras. Det finns en gräns på 100 tokens för den, och den räknas mot den totala tokengränsen. No
databasnamn string Namnet på MongoDB vCore-databasen för användning med Azure Cosmos DB. Ja
container_name string Namnet på Azure Cosmos DB resource container. Ja
indexnamn string MongoDB vCore-indexnamnet för användning med Azure Cosmos DB. Ja
fältkartläggning azureCosmosDBFieldMappingOptions Valfria inställningar för att styra hur fält bearbetas när man använder en konfigurerad Azure Cosmos DB-resurs. Ja
inbäddningsberoende onYourDataEndpointVectorizationSource eller onYourDataDeploymentNameVectorizationSource Ja

azureCosmosDBFieldMappingOptions

Valfria inställningar för att styra hur fält bearbetas när man använder en konfigurerad Azure Cosmos DB-resurs.

Name Type Description Obligatoriskt Standardinställning
titel_fält string Namnet på indexfältet som ska användas som titel. No
url-fält string Namnet på indexfältet som ska användas som URL. No
filväg_fält string Namnet på indexfältet som ska användas som filsökväg. No
innehållsfält array Namnen på indexfält som bör behandlas som innehåll. Ja
fältskiljare_innehåll string Det separatormönster som innehållsfälten bör använda. No
vektorfält array Namnen på fält som representerar vektordata. Ja

dinaDataAutentiseringsalternativ

Autentiseringsalternativen för Azure OpenAI On Your Data.

Name Type Description Obligatoriskt Standardinställning
type påDinDataAutentiseringstyp De autentiseringstyper som stöds med Azure OpenAI On Your Data. Ja

påDinDataAutentiseringstyp

De autentiseringstyper som stöds med Azure OpenAI On Your Data.

Beskrivning: De autentiseringstyper som stöds med Azure OpenAI On Your Data.

Typ: sträng

Standard:

Enum-namn: OnYourDataAuthenticationType

Uppräkningsvärden:

Value Description
API-nyckel Autentisering via API-nyckel.
connection_string Autentisering via reťazec pripojenia.
systemtilldelad hanterad identitet Autentisering via systemtilldelad hanterad identitet.
användartilldelad hanterad identitet Autentisering via användartilldelad hanterad identitet.

onYourDataApiNyckelAutentiseringsalternativ

Autentiseringsalternativen för Azure OpenAI på dina data när du använder en API-nyckel.

Name Type Description Obligatoriskt Standardinställning
type påDinDataAutentiseringstyp De autentiseringstyper som stöds med Azure OpenAI On Your Data. Ja
nyckel string API-nyckeln att använda för autentisering. No

påDinDataAnslutningssträngAutentiseringsalternativ

Autentiseringsalternativen för Azure OpenAI On Your Data när man använder en reťazec pripojenia.

Name Type Description Obligatoriskt Standardinställning
type påDinDataAutentiseringstyp De autentiseringstyper som stöds med Azure OpenAI On Your Data. Ja
connection_string string reťazec pripojenia som ska användas för autentisering. No

alternativ för autentisering av tilldelad hanterad identitet i datorsystemet

Autentiseringsalternativen för Azure OpenAI på dina data när du använder en systemtilldelad hanterad identitet.

Name Type Description Obligatoriskt Standardinställning
type påDinDataAutentiseringstyp De autentiseringstyper som stöds med Azure OpenAI On Your Data. Ja

onYourDataUserAssignedManagedIdentityAuthenticationOptions

Autentiseringsalternativen för Azure OpenAI On Your Data när man använder en användartilldelad hanterad identitet.

Name Type Description Obligatoriskt Standardinställning
type påDinDataAutentiseringstyp De autentiseringstyper som stöds med Azure OpenAI On Your Data. Ja
managed_identity_resource_id string Resurs-ID:t för den användartilldelade hanterade identiteten att använda för autentisering. No

onDinDataVektoriseringKälla

En abstrakt representation av en vektoriseringskällkod för Azure OpenAI On Your Data med vektorsökning.

Name Type Description Obligatoriskt Standardinställning
type omDinDataVektoriseringKällaTyp Representerar de tillgängliga källor som Azure OpenAI On Your Data kan använda för att konfigurera vektorisering av data för användning med
vektorsökning.
Ja

påDinDatavektoriseringsKälltyp

Representerar de tillgängliga källor som Azure OpenAI On Your Data kan använda för att konfigurera vektorisering av data för användning med vektorsökning.

Description: Representerar de tillgängliga källorna Azure OpenAI On Your Data kan använda för att konfigurera vektorisering av data för användning med
vektorsökning.

Typ: sträng

Standard:

Enum-namn: OnYourDataVectorizationSourceType

Uppräkningsvärden:

Value Description
slutpunkt Representerar vektorisering utförd av offentliga tjänsteanrop till en Azure OpenAI-inbäddningsmodell.
distributionsnamn Representerar ett Ada-modell-distributionsnamn att använda. Denna modelldistribution måste finnas i samma Azure OpenAI-resurs, men
On Your Data kommer att använda denna modelldistribution via ett internt anrop istället för ett publikt, vilket möjliggör vektor
Sök även i privata nätverk.

onYourDataDeploymentNameVectorizationSource

Detaljerna i en vektoriseringskälla, som används av Azure OpenAI On Your Data vid tillämpning av vektorsökning, som baseras på ett internt inbäddningsmodell-distributionsnamn i samma Azure OpenAI-resurs.

Name Type Description Obligatoriskt Standardinställning
type omDinDataVektoriseringKällaTyp Representerar de tillgängliga källor som Azure OpenAI On Your Data kan använda för att konfigurera vektorisering av data för användning med
vektorsökning.
Ja
distributionsnamn string Specificerar namnet på modellutplaceringen som ska användas för vektorisering. Denna modelldistribution måste ske i samma Azure OpenAI-resurs, men On Your Data kommer att använda denna modelldistribution via ett internt anrop istället för ett publikt, vilket möjliggör vektorsökning även i privata nätverk. No

onYourDataEndpointVectorizationSource

Detaljerna i en vektoriseringskälla, som används av Azure OpenAI On Your Data vid tillämpning av vektorsökning, som baseras på ett offentligt Azure OpenAI-slutpunktsanrop för inbäddningar.

Name Type Description Obligatoriskt Standardinställning
type omDinDataVektoriseringKällaTyp Representerar de tillgängliga källor som Azure OpenAI On Your Data kan använda för att konfigurera vektorisering av data för användning med
vektorsökning.
Ja
authentication onYourDataApiNyckelAutentiseringsalternativ Autentiseringsalternativen för Azure OpenAI på dina data när du använder en API-nyckel. No
slutpunkt string Specificerar slutpunkten som ska användas för vektorisering. Denna endpoint måste finnas i samma Azure OpenAI-resurs, men On Your Data kommer att använda denna endpoint via ett internt anrop istället för ett offentligt, vilket möjliggör vektorsökning även i privata nätverk. No

Azure-chatförlängningsmeddelandesammanhang

En representation av den ytterligare kontextinformation som finns tillgänglig när Azure OpenAI-chatttillägg är involverade i genereringen av ett motsvarande svar på chattkompletteringar. Denna kontextinformation fylls endast i när man använder en Azure OpenAI-förfrågan konfigurerad för att använda en matchande tillägg.

Name Type Description Obligatoriskt Standardinställning
Citat array Resultatet av datakällshämtning, som används för att generera assistentmeddelandet i svaret. No
avsikt string Den upptäckta avsikten från chatthistoriken användes för att föra vidare till nästa tur för att föra över kontexten. No

Citat

Källhänvisningsinformation för ett svar på chattfullföljningar.

Name Type Description Obligatoriskt Standardinställning
innehåll string Innehållet i citatet. Ja
titel string Titeln på motiveringen. No
url string URL:en till citatet. No
filväg string Filvägen för källhänvisningen. No
chunk_id string Bit-ID:t i boten. No

verktygsanrop för meddelandeavslutning

Name Type Description Obligatoriskt Standardinställning
id string ID:t på verktygsanropet. Ja
type verktygsanropstyp Typen av verktygskall, i detta fall function. Ja
function object Funktionen som modellen kallade på. Ja

Egenskaper för funktion

name

Name Type Description Standardinställning
name string Namnet på funktionen att anropa.

arguments

Name Type Description Standardinställning
arguments string Argumenten för att anropa funktionen med, som genereras av modellen i JSON-format. Observera att modellen inte alltid genererar giltig JSON, och kan generera parametrar som inte definieras av ditt funktionsschema. Validera argumenten i din kod innan du anropar din funktion.

verktygsanropstyp

Typen av verktygskall, i detta fall function.

Beskrivning: Typen av verktygsanrop, i detta fall function.

Typ: sträng

Standard:

Enum-namn: ToolCallType

Uppräkningsvärden:

Value Description
function Verktygsanropstypen är funktion.

chattavslutningsförfråganmeddelandeverktyg

Name Type Description Obligatoriskt Standardinställning
tool_call_id string Verktygssamtal som detta meddelande svarar på. No
innehåll string Innehållet i meddelandet. No

chatCompletionRequestMessageFunction

Name Type Description Obligatoriskt Standardinställning
Roll enum Meddelandeförfattarens roll, i detta fall function.
Möjliga värden: funktion
No
name string Innehållet i meddelandet. No
innehåll string Innehållet i meddelandet. No

createChatCompletionResponse (skapaChatCompletionRespons)

Representerar ett chattfullbordandesvar som returneras av modellen, baserat på den tillhandahållna indatan.

Name Type Description Obligatoriskt Standardinställning
id string En unik identifierare för chattens fullföljelse. Ja
prompt_filter_results promptFilterResults Innehållsfiltrering ger noll eller fler promptar i förfrågan. I en streamingförfrågan kan resultaten för olika prompts komma vid olika tidpunkter eller i olika ordning. No
Val array En lista med chattfullföljandealternativ. Kan vara mer än ett om n är större än 1. Ja
Skapad integer Unix-tidsstämpeln (i sekunder) för när chatten slutfördes skapades. Ja
model string Modellen som används för chattfullföljandet. Ja
system_fingerprint string Detta fingeravtryck representerar backend-konfigurationen som modellen körs med.

Kan användas tillsammans med begäranparametern seed för att förstå när backend-ändringar har gjorts som kan påverka determinismen.
No
object enum Objekttypen, som alltid chat.completionär .
Möjliga värden: chat.completion
Ja
användning slutanvändning Användningsstatistik för förfrågan om fullbordan. No

createChatCompletionStreamResponse

Representerar en strömmad del av ett chattfullbordande svar som returneras av modellen, baserat på den tillhandahållna inmatningen.

Name Type Description Obligatoriskt Standardinställning
id string En unik identifierare för chattens fullföljelse. Varje chunk har samma ID. Ja
Val array En lista med chattfullföljandealternativ. Kan innehålla mer än ett element om n är större än 1.
Ja
Skapad integer Unix-tidsstämpeln (i sekunder) för när chatten slutfördes skapades. Varje chunk har samma tidsstämpel. Ja
model string Modellen för att generera fullbordan. Ja
system_fingerprint string Detta fingeravtryck representerar backend-konfigurationen som modellen körs med.
Kan användas tillsammans med begäranparametern seed för att förstå när backend-ändringar har gjorts som kan påverka determinismen.
No
object enum Objekttypen, som alltid chat.completion.chunkär .
Möjliga värden: chat.completion.chunk
Ja

chatCompletionStreamResponseDelta

En chattfullbordandedelta som genereras av strömmade modellsvar.

Name Type Description Obligatoriskt Standardinställning
innehåll string Innehållet i meddelandet i biten. No
function_call object Föråldrad och ersatt av tool_calls. Namnet och argumenten för en funktion som ska anropas, som genereras av modellen. No
tool_calls array No
Roll enum Författarens roll för detta meddelande.
Möjliga värden: system, användare, assistent, verktyg
No
vägran string Avvisningsmeddelandet som genereras av modellen. No

Egenskaper för function_call

arguments

Name Type Description Standardinställning
arguments string Argumenten för att anropa funktionen med, som genereras av modellen i JSON-format. Observera att modellen inte alltid genererar giltig JSON, och kan generera parametrar som inte definieras av ditt funktionsschema. Validera argumenten i din kod innan du anropar din funktion.

name

Name Type Description Standardinställning
name string Namnet på funktionen att anropa.

Meddelandeverktyg för chattfullständighetssamtalstycke

Name Type Description Obligatoriskt Standardinställning
index integer Ja
id string ID:t på verktygsanropet. No
type enum Typen av verktyg. För närvarande stöds endast function det.
Möjliga värden: funktion
No
function object No

Egenskaper för funktion

name

Name Type Description Standardinställning
name string Namnet på funktionen att anropa.

arguments

Name Type Description Standardinställning
arguments string Argumenten för att anropa funktionen med, som genereras av modellen i JSON-format. Observera att modellen inte alltid genererar giltig JSON, och kan generera parametrar som inte definieras av ditt funktionsschema. Validera argumenten i din kod innan du anropar din funktion.

chatCompletionStreamOptions

Alternativ för streaming-respons. Ställ in detta först när du sätter stream: true.

Name Type Description Obligatoriskt Standardinställning
include_usage boolean Om det är satt kommer en extra chunk att strömmas innan meddelandet data: [DONE] . Fältet usage i denna chunk visar tokenanvändningsstatistiken för hela förfrågan, och choices fältet kommer alltid att vara en tom array. Alla andra chunks kommer också att inkludera ett usage fält, men med ett nollvärde.
No

chatCompletionChoiceLogProbs

Logga sannolikhetsinformation för valet.

Name Type Description Obligatoriskt Standardinställning
innehåll array En lista över meddelandeinnehållstokens med loggsannolikhetsinformation. Ja
vägran array En lista över meddelandeavvisningstoken med loggsannolikhetsinformation. No

chatCompletionTokenLogprob

Name Type Description Obligatoriskt Standardinställning
Token string Tokenen. Ja
logprob number Logsannolikheten för denna token. Ja
bytes array En lista över heltal som representerar UTF-8 bytes-representationen av token. Användbart i fall där tecken representeras av flera tokens och deras byterepresentationer måste kombineras för att generera korrekt textrepresentation. Det kan vara det null om det inte finns någon byterepresentation för token. Ja
top_logprobs array Lista över de mest sannolika tokens och deras logaritmiska sannolikhet, vid denna tokenposition. I sällsynta fall kan det vara färre än det begärda antalet returnerade top_logprobs . Ja

chatslutförandemeddelande

Ett meddelande om chattkomplettering genererat av modellen.

Name Type Description Obligatoriskt Standardinställning
Roll chatCompletionResponseMessageRole Författarens roll för svarsmeddelandet. Ja
vägran string Avvisningsmeddelandet som genereras av modellen. Ja
innehåll string Innehållet i meddelandet. Ja
tool_calls array Verktygsanropen som genereras av modellen, såsom funktionsanrop. No
function_call chatCompletionFunctionCall Föråldrad och ersatt av tool_calls. Namnet och argumenten för en funktion som ska anropas, som genereras av modellen. No
context azureChatExtensionsMessageContext En representation av den ytterligare kontextinformation som finns tillgänglig när Azure OpenAI-chatttillägg används
i genereringen av ett motsvarande svar på chattfullföljningar. Denna kontextinformation fylls endast i när
med en Azure OpenAI-förfrågan konfigurerad för att använda en matchande tillägg.
No

chattSlutförandeSvarMeddelandeRoll

Författarens roll för svarsmeddelandet.

Beskrivning: Författarens roll för svarsmeddelandet.

Typ: sträng

Standard:

Uppräkningsvärden:

  • Assistent

chatCompletionToolChoiceOption

Styr vilket (om något) verktyg som anropas av modellen. none Det betyder att modellen inte anropar något verktyg utan istället genererar ett meddelande. auto Det innebär att modellen kan välja mellan att generera ett meddelande eller att anropa ett eller flera verktyg. required betyder att modellen måste anropa ett eller flera verktyg. Att specificera ett visst verktyg via {"type": "function", "function": {"name": "my_function"}} tvingar modellen att anropa det verktyget. none är standarden när inga verktyg finns. auto är standarden om verktyg finns.

Denna komponent kan vara en av följande:

chatCompletionNamedToolChoice

Specificerar ett verktyg som modellen ska använda. Använd för att tvinga modellen att anropa en specifik funktion.

Name Type Description Obligatoriskt Standardinställning
type enum Typen av verktyg. För närvarande stöds endast function det.
Möjliga värden: funktion
Ja
function object Ja

Egenskaper för funktion

name

Name Type Description Standardinställning
name string Namnet på funktionen att anropa.

ParallelToolCalls

Om man ska aktivera parallell funktionsanrop under verktygsanvändning.

Inga egenskaper definierade för denna komponent.

chattKompletteringsmeddelandeVerktygSamtal

Verktygsanropen som genereras av modellen, såsom funktionsanrop.

Inga egenskaper definierade för denna komponent.

chatCompletionFunctionCall

Föråldrad och ersatt av tool_calls. Namnet och argumenten för en funktion som ska anropas, som genereras av modellen.

Name Type Description Obligatoriskt Standardinställning
name string Namnet på funktionen att anropa. Ja
arguments string Argumenten för att anropa funktionen med, som genereras av modellen i JSON-format. Observera att modellen inte alltid genererar giltig JSON, och kan generera parametrar som inte definieras av ditt funktionsschema. Validera argumenten i din kod innan du anropar din funktion. Ja

slutanvändning

Användningsstatistik för förfrågan om fullbordan.

Name Type Description Obligatoriskt Standardinställning
prompt_tokens integer Antal tokens i prompten. Ja
completion_tokens integer Antal tokens i den genererade fullföljandet. Ja
total_tokens integer Totalt antal tokens som används i förfrågan (prompt + fullföljande). Ja
completion_tokens_details object Uppdelning av tokens som används i en fullbordan. No

Egenskaper för completion_tokens_details

reasoning_tokens

Name Type Description Standardinställning
reasoning_tokens integer Tokens genererade av modellen för resonemang.

Chattkompletteringsverktyg

Name Type Description Obligatoriskt Standardinställning
type enum Typen av verktyg. För närvarande stöds endast function det.
Möjliga värden: funktion
Ja
function FunctionObject Ja

FunctionParameters

De parametrar som funktionen accepterar, beskrivs som ett JSON-schemaobjekt. Se guiden för exempel och JSON Schema-referensen för dokumentation om formatet.

Att parameters utelämna definierar en funktion med en tom parameterlista.

Inga egenskaper definierade för denna komponent.

FunctionObject

Name Type Description Obligatoriskt Standardinställning
description string En beskrivning av vad funktionen gör, använd av modellen för att välja när och hur funktionen ska anropas. No
name string Namnet på funktionen som ska anropas. Måste vara a-z, A-Z, 0-9, eller innehålla understreck och streck, med en maximal längd på 64. Ja
parameters FunctionParameters De parametrar som funktionen accepterar, beskrivs som ett JSON-schemaobjekt. Se guiden för exempel och JSON Schema-referensen för dokumentation om formatet.

Att parameters utelämna definierar en funktion med en tom parameterlista.
No
Strikt boolean Om man ska aktivera strikt schema-följsamhet vid generering av funktionsanropet. Om den sätts till sant kommer modellen att följa det exakta schemat definierat i parameters fältet. Endast en delmängd av JSON-schemat stöds när strict är true. No Falsk

ResponseFormatText

Name Type Description Obligatoriskt Standardinställning
type enum Typen av svarsformat som definieras: text
Möjliga värden: text
Ja

ResponseFormatJsonObject

Name Type Description Obligatoriskt Standardinställning
type enum Typen av svarsformat som definieras: json_object
Möjliga värden: json_object
Ja

ResponseFormatJsonSchemaSchema

Schemat för svarsformatet, beskrivet som ett JSON Schema-objekt.

Inga egenskaper definierade för denna komponent.

ResponsformatJsonSchema

Name Type Description Obligatoriskt Standardinställning
type enum Typen av svarsformat som definieras: json_schema
Möjliga värden: json_schema
Ja
json-schema object Ja

Egenskaper för json_schema

description

Name Type Description Standardinställning
description string En beskrivning av vad svarsformatet är till för, som används av modellen för att avgöra hur man ska svara i formatet.

name

Name Type Description Standardinställning
name string Namnet på svarsformatet. Måste vara a-z, A-Z, 0-9, eller innehålla understreck och streck, med en maximal längd på 64.

schema

Name Type Description Standardinställning
schema SvarformatJsonSchemaSchema Schemat för svarsformatet, beskrivet som ett JSON Schema-objekt.

Strikt

Name Type Description Standardinställning
Strikt boolean Om man ska aktivera strikt schema-följsamhet vid generering av utdata. Om den sätts till sann kommer modellen alltid att följa det exakta schemat som definierats schema i fältet. Endast en delmängd av JSON-schemat stöds när strict är true. Falsk

Alternativ för att slutföra chatt

Name Type Description Obligatoriskt Standardinställning
index integer No
avslutningsorsak string No

skapa översättningsförfrågan

Översättningsbegäran.

Name Type Description Obligatoriskt Standardinställning
fil string Ljudfilen att översätta. Ja
prompt string En valfri text för att styra modellens stil eller fortsätta ett tidigare ljudsegment. Uppgiften ska vara på engelska. No
svarsformat audioResponseFormat Definierar formatet på utdatan. No
Temperatur number Provtagningstemperaturen, mellan 0 och 1. Högre värden som 0,8 gör resultatet mer slumpmässigt, medan lägre värden som 0,2 gör det mer fokuserat och deterministiskt. Om den sätts till 0 kommer modellen att använda logaritmisk sannolikhet för att automatiskt öka temperaturen tills vissa tröskelvärden nås. No 0

ljudsvar

Översättnings- eller transkriptionssvar när response_format var json

Name Type Description Obligatoriskt Standardinställning
text string Översatt eller transkriberad text. Ja

audioVerboseResponse

Översättnings- eller transkriptionssvar när response_format var verbose_json

Name Type Description Obligatoriskt Standardinställning
text string Översatt eller transkriberad text. Ja
uppgift string Typ av ljuduppgift. No
language string Language. No
duration number Varaktighet. No
Segment array No

audioResponseFormat

Definierar formatet på utdatan.

Beskrivning: Definierar formatet på utdatan.

Typ: sträng

Standard:

Uppräkningsvärden:

  • json
  • text
  • srt
  • verbose_json
  • vtt

skapaTranskriberingsBegäran

Transkriptionsbegäran.

Name Type Description Obligatoriskt Standardinställning
fil string Ljudfilobjektet att transkribera. Ja
prompt string En valfri text för att styra modellens stil eller fortsätta ett tidigare ljudsegment. Prompten ska matcha ljudspråket. No
svarsformat audioResponseFormat Definierar formatet på utdatan. No
Temperatur number Provtagningstemperaturen, mellan 0 och 1. Högre värden som 0,8 gör resultatet mer slumpmässigt, medan lägre värden som 0,2 gör det mer fokuserat och deterministiskt. Om den sätts till 0 kommer modellen att använda logaritmisk sannolikhet för att automatiskt öka temperaturen tills vissa tröskelvärden nås. No 0
language string Språket för inmatningsljudet. Att tillhandahålla inmatningsspråket i ISO-639-1-format kommer att förbättra noggrannhet och latens. No

ljudsegment

Transkriberings- eller översättningssegment.

Name Type Description Obligatoriskt Standardinställning
id integer Segmentidentifierare. No
Söka number Förskjutning av segmentet. No
start number Segmentstart-förskjutning. No
end number Segmentändens förskjutning. No
text string Segmentera text. No
Token array Symboler av texten. No
Temperatur number Temperatur. No
avg_logprob number Genomsnittlig sannolikhet för logaritm. No
compression_ratio number Kompressionsförhållande. No
no_speech_prob number Sannolikhet för no speech. No

bildkvalitet

Bildkvaliteten som kommer att genereras.

Beskrivning: Kvaliteten på bilden som kommer att genereras.

Typ: sträng

Standard: standard

Enum-namn: Kvalitet

Uppräkningsvärden:

Value Description
standard Standardkvalitet skapar bilder med standardkvalitet.
Hd HD-kvalitet skapar bilder med finare detaljer och större konsekvens över bilden.

imagesResponseFormat

Formatet i vilket de genererade bilderna returneras.

Beskrivning: Formatet i vilket de genererade bilderna returneras.

Typ: sträng

Standard: url

Enum-namn: ImagesResponseFormat

Uppräkningsvärden:

Value Description
url URL:en som ger tillfällig åtkomst för att ladda ner de genererade bilderna.
b64_json De genererade bilderna returneras som base64-kodad sträng.

imageSize

Storleken på de genererade bilderna.

Beskrivning: Storleken på de genererade bilderna.

Typ: sträng

Standard: 1024x1024

Enum-namn: Storlek

Uppräkningsvärden:

Value Description
1792x1024 Den önskade storleken på den genererade bilden är 1792x1024 pixlar.
1024x1792 Den önskade storleken på den genererade bilden är 1024x1792 pixlar.
1024x1024 Den önskade storleken på den genererade bilden är 1024x1024 pixlar.

imageStyle

Stilen på de genererade bilderna.

Beskrivning: Stilen på de genererade bilderna.

Typ: sträng

Standard: levande

Enum-namn: Stil

Uppräkningsvärden:

Value Description
Levande Vivid skapar bilder som är hyperrealistiska och dramatiska.
Naturliga Naturligt skapar bilder som är mer naturliga och mindre hyperrealistiska.

bildgenereringsförfrågan

Name Type Description Obligatoriskt Standardinställning
prompt string En textbeskrivning av den önskade bilden/bilderna. Den maximala längden är 4 000 tecken. Ja
n integer Antalet bilder som ska genereras. No 1
size imageSize Storleken på de genererade bilderna. No 1024x1024
svarsformat imagesResponseFormat Formatet i vilket de genererade bilderna returneras. No url
user string En unik identifierare som representerar din slutanvändare, vilket kan hjälpa till att övervaka och upptäcka missbruk. No
kvalitet imageQuality Bildkvaliteten som kommer att genereras. No standard
Stil imageStyle Stilen på de genererade bilderna. No Levande

skapaBildsvar

Name Type Description Obligatoriskt Standardinställning
Skapad integer Unix-tidsstämpeln när operationen skapades. Ja
data array Resultatdata för operationen, om den lyckas Ja

bildresultat

Bild-url:en eller kodad bild om den lyckas, och ett fel annars.

Name Type Description Obligatoriskt Standardinställning
url string Bild-URL:en. No
b64_json string Den base64-kodade bilden No
content_filter_results resultat för dalle innehållsfilter Information om innehållet filtreringsresultat. No
Omarbetad uppmaning string Prompten som användes för att generera bilden, om det fanns någon revidering av prompten. No
prompt_filter_results dalleFilterResults Information om innehållsfiltreringskategorin (hat, sexuell, våld, self_harm), om den har upptäckts, samt allvarlighetsgraden (very_low, låg, medel, hög skala som avgör intensiteten och risknivån för skadligt innehåll) och om den har filtrerats eller inte. Information om jailbreak-innehåll och svordomar, om det har upptäckts och om det har filtrerats eller inte. Och information om kundblocklistan, om den har filtrerats och dess ID. No

Tillägg för slutföranden

Completions-tillägg ingår inte i den senaste GA-versionen av Azure OpenAI:s dataplansinferensspecifikation.

Chattmeddelande

Chatmeddelandeobjektet ingår inte i den senaste GA-versionen av Azure OpenAI:s dataplansinferensspecifikation.

Text-till-tal (Förhandsvisning)

Ingår för närvarande inte i den senaste Azure OpenAI GA-versionen av Azure OpenAI:s specifikation för dataplansinferens. Se den senaste versionen preview för denna funktion.

Nästa steg

Lär dig om modeller och finjustering med REST API. Läs mer om underlying modeller som driver Azure OpenAI.