Azure OpenAI dans Microsoft Foundry Models référence REST API

Cet article fournit des détails sur les terminaux d’inférence de l’API REST pour Azure OpenAI.

Spécifications de l’API

La gestion et l’interaction avec les modèles et ressources OpenAI Azure sont réparties sur trois surfaces principales d’API :

Plan de contrôle
Plan de données - création
Plan de données - inférence

Chaque surface/spécification API englobe un ensemble différent de capacités Azure OpenAI. Chaque API possède son propre ensemble unique de versions d’aperçu et d’API stable/généralement disponibles (GA). Les sorties de prévisualisation suivent actuellement un rythme mensuel.

Important

Il existe désormais une nouvelle API d’inférence d’aperçu. Découvrez-en plus dans notre guide du cycle de vie de l’API.

API	Dernière version d’aperçu	Dernière sortie de GA	Spécifications	Description
Plan de contrôle	`2025-07-01-preview`	`2025-06-01`	Fichiers de spécifications	L’API du plan de contrôle est utilisée pour des opérations telles que la création de ressources, le déploiement de modèles et d’autres tâches de gestion des ressources de haut niveau. Le plan de contrôle régit également ce qui est possible à faire avec des fonctionnalités telles que Azure Resource Manager, Bicep, Terraform et Azure CLI.
Plan de données	`v1 preview`	`v1`	Fichiers de spécifications	L’API du plan de données contrôle les opérations d’inférence et d’authoring.

Authentication

Azure OpenAI propose deux méthodes d’authentification. Vous pouvez utiliser soit API Keys, soit Microsoft Entra ID.

Authentification par clé API : Pour ce type d’authentification, toutes les requêtes API doivent inclure la clé API dans l’en-tête api-key HTTP. Le Quickstart fournit des conseils pour passer des appels avec ce type d’authentification.
Microsoft Entra ID : Vous pouvez authentifier un appel API à l’aide d’un jeton Microsoft Entra. Les jetons d’authentification sont inclus dans une requête en tant qu’en-tête Authorization . Le jeton fourni doit être précédé de Bearer, par exemple Bearer YOUR_AUTH_TOKEN. Vous pouvez lire notre guide pratique sur authentifier avec Microsoft Entra ID.

Versionnement de l’API REST

Les API de service sont versionnées à l’aide du api-version paramètre de requête. Toutes les versions suivent la structure de dates YYYY-MM-DD. Par exemple:

POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/chat/completions?api-version=2024-06-01

Inférence dans les plans de données

Le reste de l’article traite de la version GA de la spécification d’inférence du plan de données OpenAI .

Si vous recherchez de la documentation sur la dernière version de l’API en préversion, reportez-vous à la dernière API d’inférence du plan de données en préversion.

Achèvements

POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2024-10-21

Crée une complétion pour l’invite fournie, les paramètres et le modèle choisi.

Paramètres d’URI

Nom	Dans	Obligatoire	Catégorie	Description
endpoint	path	Oui	string url	Pris en charge Azure terminaux OpenAI (protocole et nom d’hôte, par exemple : `https://aoairesource.openai.azure.com`. Remplacez « aoairesource » par le nom de votre ressource Azure OpenAI). https://{your-resource-name}.openai.azure.com
id-de-déploiement	path	Oui	string	ID de déploiement du modèle qui a été déployé.
version de l'API	Requête	Oui	string	Version de l’API

En-tête de requête

Nom	Obligatoire	Catégorie	Description
clé API	True	string	Fournissez ici la clé API Azure OpenAI

Corps de la requête

Content-Type : application/json

Nom	Catégorie	Description	Obligatoire	Par défaut
prompt	chaîne ou tableau	Le(s) prompt(s) pour générer des complétions pour , encodé sous forme de chaîne, tableau de chaînes, tableau de jetons ou tableau de tableaux de jetons. Notez que <\|endoftext\|> est le séparateur de document que le modèle voit lors de l’entraînement, donc si une invite n’est pas spécifiée, le modèle sera généré comme si c’était le début d’un nouveau document.	Oui
meilleures sélections	entier	Génère `best_of` des complétions côté serveur et retourne le « meilleur » (celui avec la plus grande probabilité logarithmique par jeton). Les résultats ne peuvent pas être diffusés en streaming. Lorsqu’elle est utilisée avec `n`, `best_of` contrôle le nombre de complétions candidates et `n` spécifie combien retourner â€ » `best_of` doit être supérieur à `n`. Note : Parce que ce paramètre génère de nombreuses complétions, il peut rapidement consommer votre quota de jetons. Utilisez avec soin et assurez-vous d’avoir des réglages raisonnables pour `max_tokens` et `stop`.	Non	1
echo	booléen	Faites écho à la consigne en plus de la complétion	Non	Faux
pénalité de fréquence	number	Nombre compris entre -2,0 et 2,0. Les valeurs positives pénalisent les nouveaux jetons en fonction de leur fréquence existante dans le texte jusqu’à présent, diminuant la probabilité que le modèle répète la même phrase mot pour mot.	Non	0
logit_bias	Objet	Modifier la probabilité que des jetons spécifiés apparaissent dans la complétion. Accepte un objet JSON qui associe les jetons (spécifiés par leur identifiant de jeton dans le tokeniseur GPT) à une valeur de biais associée de -100 à 100. Mathématiquement, le biais est ajouté aux logits générés par le modèle avant l’échantillonnage. L’effet exact variera selon le modèle, mais les valeurs comprises entre -1 et 1 devraient diminuer ou augmenter la probabilité de sélection ; des valeurs comme -100 ou 100 devraient entraîner un bannissement ou une sélection exclusive du jeton concerné. Par exemple, vous pouvez passer `{"50256": -100}` pour empêcher la génération du <token \|endoftext> .	Non	None
logprobs	entier	Incluez les probabilités logarithiques sur les `logprobs` jetons de sortie les plus probables, ainsi que les jetons choisis. Par exemple, si `logprobs` est 5, l’API renverra une liste des cinq jetons les plus probables. L’API retournera toujours le `logprob` du jeton échantillonné, donc il peut y avoir jusqu’à jusqu’à `logprobs+1` des éléments dans la réponse. La valeur maximale pour `logprobs` est 5.	Non	None
nombre_maximal_de_tokens	entier	Le nombre maximal de jetons pouvant être générés dans la complétion. Le nombre de jetons de votre invite plus `max_tokens` ne peut pas dépasser la longueur contextuelle du modèle.	Non	16
n	entier	Combien de complétions générer pour chaque invite. Note : Parce que ce paramètre génère de nombreuses complétions, il peut rapidement consommer votre quota de jetons. Utilisez avec soin et assurez-vous d’avoir des réglages raisonnables pour `max_tokens` et `stop`.	Non	1
pénalité de présence	number	Nombre compris entre -2,0 et 2,0. Les valeurs positives pénalisent les nouveaux jetons en fonction de leur apparence dans le texte jusqu’à présent, augmentant ainsi la probabilité du modèle d’aborder de nouveaux sujets.	Non	0
seed	entier	Si spécifié, notre système fera un meilleur effort pour échantillonner de manière déterministe, de sorte que les requêtes répétées avec les mêmes `seed` paramètres et reproduisent le même résultat. Le déterminisme n’est pas garanti, et vous devriez vous référer au `system_fingerprint` paramètre de réponse pour surveiller les changements dans le backend.	Non
Arrêter	chaîne ou tableau	Jusqu’à quatre séquences où l’API cessera de générer d’autres jetons. Le texte retourné ne contiendra pas la séquence d’arrêt.	Non
stream	booléen	Est-ce qu’il faut réintégrer un progrès partiel en détail. S’ils sont activés, les jetons seront envoyés comme des événements uniquement données envoyés par le serveur dès qu’ils deviennent disponibles, le flux étant interrompu par un `data: [DONE]` message.	Non	Faux
Suffixe	string	Le suffixe qui vient après la fin du texte inséré. Ce paramètre n’est pris en charge que pour `gpt-3.5-turbo-instruct`.	Non	None
Température	number	Quelle température d’échantillonnage utiliser, entre 0 et 2. Des valeurs plus élevées comme 0,8 rendent la sortie plus aléatoire, tandis que des valeurs plus basses comme 0,2 la rendent plus ciblée et déterministe. Nous recommandons généralement de modifier cela, ou `top_p` pas les deux.	Non	1
top_p	number	Une alternative à l’échantillonnage par température, appelée échantillonnage de noyau, où le modèle considère les résultats des jetons avec top_p masse de probabilité. Ainsi, 0,1 signifie que seuls les jetons composant la 10e première masse de probabilité% sont pris en compte. Nous recommandons généralement de modifier cela, ou `temperature` pas les deux.	Non	1
utilisateur	string	Un identifiant unique représentant votre utilisateur final, qui peut aider à surveiller et détecter les abus.	Non

Responses

Code de statut : 200

Description : OK

Type de contenu	Type	Description
application/json	createCompletionResponse	Représente une réponse de complétion de l’API. Note : les objets de réponse en streaming et non diffusés partagent la même forme (contrairement au point d’extrémité du chat).

Code de statut : par défaut

Description : Service indisponible

Type de contenu	Type	Description
application/json	errorResponse

Exemples

Example

Crée une complétion pour l’invite fournie, les paramètres et le modèle choisi.

POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2024-10-21

{
 "prompt": [
  "tell me a joke about mango"
 ],
 "max_tokens": 32,
 "temperature": 1.0,
 "n": 1
}

Réponses : Code de statut : 200

{
  "body": {
    "id": "cmpl-7QmVI15qgYVllxK0FtxVGG6ywfzaq",
    "created": 1686617332,
    "choices": [
      {
        "text": "es\n\nWhat do you call a mango who's in charge?\n\nThe head mango.",
        "index": 0,
        "finish_reason": "stop",
        "logprobs": null
      }
    ],
    "usage": {
      "completion_tokens": 20,
      "prompt_tokens": 6,
      "total_tokens": 26
    }
  }
}

Embeddings

POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2024-10-21

Obtenez une représentation vectorielle d’une entrée donnée qui peut être facilement consommée par des modèles et algorithmes d’apprentissage automatique.

Paramètres d’URI

Nom	Dans	Obligatoire	Catégorie	Description
endpoint	path	Oui	string url	Pris en charge Azure terminaux OpenAI (protocole et nom d’hôte, par exemple : `https://aoairesource.openai.azure.com`. Remplacez « aoairesource » par le nom de votre ressource Azure OpenAI). https://{your-resource-name}.openai.azure.com
id-de-déploiement	path	Oui	string
version de l'API	Requête	Oui	string	Version de l’API

En-tête de requête

Nom	Obligatoire	Catégorie	Description
clé API	True	string	Fournissez ici la clé API Azure OpenAI

Corps de la requête

Content-Type : application/json

Nom	Catégorie	Description	Obligatoire
entrée	chaîne ou tableau	Texte d’entrée pour l’intégrer, encodé sous forme de chaîne ou de tableau de jetons. Pour intégrer plusieurs entrées dans une seule requête, passez un tableau de chaînes ou un tableau de tableaux de jetons. L’entrée ne doit pas dépasser le maximum de jetons d’entrée pour le modèle (8 192 jetons pour `text-embedding-ada-002`), ne peut pas être une chaîne vide, et tout tableau doit avoir 2 048 dimensions ou moins. Outre la limite de jetons par entrée, tous les modèles d’incorporation appliquent un maximum de 300 000 jetons additionnés sur toutes les entrées dans une seule requête.	Oui
utilisateur	string	Un identifiant unique représentant votre utilisateur final, qui peut aider à surveiller et détecter les abus.	Non
input_type	string	Type d’entrée de recherche d’intégration à utiliser	Non
encoding_format	string	Le format pour renvoyer les embeddings. Peut être l’un ou l’autre `float` ou `base64`. Par défaut, .`float`	Non
dimensions	entier	Le nombre de dimensions que doivent avoir les embeddings de sortie résultantes. Pris en charge uniquement dans `text-embedding-3` les modèles et les modèles ultérieurs.	Non

Responses

Nom	Catégorie	Obligatoire
Objet	string	Oui
model	string	Oui
Données	tableau	Oui
utilisation	Objet	Oui

Propriétés d’utilisation

prompt_tokens

Nom	Catégorie	Description	Par défaut
prompt_tokens	entier

total_tokens

Nom	Catégorie	Description	Par défaut
total_tokens	entier

Code de statut : 200

Description : OK

Type de contenu	Type	Description
application/json	Objet

Exemples

Example

Retournez les embeddings pour une invite donnée.

POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2024-10-21

{
 "input": [
  "this is a test"
 ]
}

Réponses : Code de statut : 200

{
  "body": {
    "data": [
      {
        "index": 0,
        "embedding": [
          -0.012838088,
          -0.007421397,
          -0.017617522,
          -0.028278312,
          -0.018666342,
          0.01737855,
          -0.01821495,
          -0.006950092,
          -0.009937238,
          -0.038580645,
          0.010674067,
          0.02412286,
          -0.013647936,
          0.013189907,
          0.0021125758,
          0.012406612,
          0.020790534,
          0.00074595667,
          0.008397198,
          -0.00535031,
          0.008968075,
          0.014351576,
          -0.014086051,
          0.015055214,
          -0.022211088,
          -0.025198232,
          0.0065186154,
          -0.036350243,
          0.009180495,
          -0.009698266,
          0.009446018,
          -0.008463579,
          -0.0040426035,
          -0.03443847,
          -0.00091273896,
          -0.0019217303,
          0.002349888,
          -0.021560553,
          0.016515596,
          -0.015572986,
          0.0038666942,
          -8.432463e-05
        ]
      }
    ],
    "usage": {
      "prompt_tokens": 4,
      "total_tokens": 4
    }
  }
}

Finalisation de la conversation

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21

Crée une complétion pour le message de chat

Paramètres d’URI

Nom	Dans	Obligatoire	Catégorie	Description
endpoint	path	Oui	string url	Pris en charge Azure terminaux OpenAI (protocole et nom d’hôte, par exemple : `https://aoairesource.openai.azure.com`. Remplacez « aoairesource » par le nom de votre ressource Azure OpenAI). https://{your-resource-name}.openai.azure.com
id-de-déploiement	path	Oui	string	ID de déploiement du modèle qui a été déployé.
version de l'API	Requête	Oui	string	Version de l’API

En-tête de requête

Nom	Obligatoire	Catégorie	Description
clé API	True	string	Fournissez ici la clé API Azure OpenAI

Corps de la requête

Content-Type : application/json

Nom	Catégorie	Description	Obligatoire	Par défaut
Température	number	Quelle température d’échantillonnage utiliser, entre 0 et 2. Des valeurs plus élevées comme 0,8 rendent la sortie plus aléatoire, tandis que des valeurs plus basses comme 0,2 la rendent plus ciblée et déterministe. Nous recommandons généralement de modifier cela, ou `top_p` pas les deux.	Non	1
top_p	number	Une alternative à l’échantillonnage par température, appelée échantillonnage de noyau, où le modèle considère les résultats des jetons avec top_p masse de probabilité. Ainsi, 0,1 signifie que seuls les jetons composant la 10e première masse de probabilité% sont pris en compte. Nous recommandons généralement de modifier cela, ou `temperature` pas les deux.	Non	1
stream	booléen	Si c’est défini, des deltas partiels de message seront envoyés, comme dans ChatGPT. Les jetons seront envoyés uniquement en données par le serveur dès qu’ils seront disponibles, le flux étant interrompu par un `data: [DONE]` message.	Non	Faux
Arrêter	chaîne ou tableau	Jusqu’à quatre séquences où l’API cessera de générer d’autres jetons.	Non
nombre_maximal_de_tokens	entier	Le nombre maximal de jetons pouvant être générés lors de la fin du chat. La longueur totale des jetons d’entrée et des jetons générés est limitée par la longueur du contexte du modèle.	Non
max_completion_tokens	entier	Une borne supérieure pour le nombre de jetons pouvant être générés pour une complétion, incluant les jetons de sortie visibles et les jetons de raisonnement.	Non
pénalité de présence	number	Nombre compris entre -2,0 et 2,0. Les valeurs positives pénalisent les nouveaux jetons en fonction de leur apparence dans le texte jusqu’à présent, augmentant ainsi la probabilité du modèle d’aborder de nouveaux sujets.	Non	0
pénalité de fréquence	number	Nombre compris entre -2,0 et 2,0. Les valeurs positives pénalisent les nouveaux jetons en fonction de leur fréquence existante dans le texte jusqu’à présent, diminuant la probabilité que le modèle répète la même phrase mot pour mot.	Non	0
logit_bias	Objet	Modifier la probabilité que des jetons spécifiés apparaissent dans la complétion. Accepte un objet JSON qui associe les jetons (spécifiés par leur identifiant de jeton dans le tokenizador) à une valeur de biais associée de -100 à 100. Mathématiquement, le biais est ajouté aux logits générés par le modèle avant l’échantillonnage. L’effet exact variera selon le modèle, mais les valeurs comprises entre -1 et 1 devraient diminuer ou augmenter la probabilité de sélection ; des valeurs comme -100 ou 100 devraient entraîner un bannissement ou une sélection exclusive du jeton concerné.	Non	None
utilisateur	string	Un identifiant unique représentant votre utilisateur final, qui peut aider à surveiller et détecter les abus.	Non
messages	tableau	Une liste des messages qui composent la conversation jusqu’à présent.	Oui
data_sources	tableau	Les entrées de configuration pour les extensions de chat Azure OpenAI qui les utilisent. Cette spécification supplémentaire n’est compatible qu’avec Azure OpenAI.	Non
logprobs	booléen	S’il faut ou non retourner les probabilités logarithiques des jetons de sortie. Si c’est vrai, renvoie les probabilités logarithmitrophiques de chaque jeton de sortie retourné dans le `content` de `message`.	Non	Faux
top_logprobs	entier	Un entier compris entre 0 et 20 spécifiant le nombre de jetons les plus susceptibles de revenir à chaque position de jeton, chacun avec une probabilité logarithmique associée. `logprobs` doit être fixé à `true` si ce paramètre est utilisé.	Non
n	entier	Combien de choix de fin de conversation générer pour chaque message d’entrée. Notez que vous serez facturé en fonction du nombre de jetons générés dans toutes les options. Gardez `n` le minimum `1` pour minimiser les coûts.	Non	1
parallel_tool_calls	ParallelToolCalls	S’il faut activer l’appel de fonctions parallèles lors de l’utilisation de l’outil.	Non	True
format_de_réponse	ResponseFormatText ou ResponseFormatJsonObject ou ResponseFormatJsonSchema	Un objet spécifiant le format que le modèle doit produire. Compatible avec GPT-4o, GPT-4o mini, GPT-4 Turbo et tous les modèles GPT-3.5 Turbo plus récents que `gpt-3.5-turbo-1106`. Mettre sur `{ "type": "json_schema", "json_schema": {...} }` active les sorties structurées, ce qui garantit que le modèle correspondra à votre schéma JSON fourni. Le réglage activant `{ "type": "json_object" }` le mode JSON, qui garantit que le message généré par le modèle est un JSON valide. Important : lors de l’utilisation du mode JSON, vous devez également demander au modèle de produire vous-même le JSON via un message système ou utilisateur. Sans cela, le modèle peut générer un flux ininterrompu d’espaces blancs jusqu’à ce que la génération atteigne la limite de tokens, ce qui entraîne une demande de longue durée et apparemment « bloquée ». Notez également que le contenu du message peut être partiellement coupé si `finish_reason="length"`, ce qui indique que la génération a `max_tokens` dépassé ou que la conversation a dépassé la longueur maximale du contexte.	Non
seed	entier	Cette fonctionnalité est en version Bêta. Si spécifié, notre système fera un meilleur effort pour échantillonner de manière déterministe, de sorte que les requêtes répétées avec les mêmes `seed` paramètres et reproduisent le même résultat. Le déterminisme n’est pas garanti, et vous devriez vous référer au `system_fingerprint` paramètre de réponse pour surveiller les changements dans le backend.	Non
Outils	tableau	Une liste d’outils que le modèle peut appeler. Actuellement, seules les fonctions sont prises en charge comme outil. Utilisez cela pour fournir une liste des fonctions pour lesquelles le modèle peut générer des entrées JSON. Un maximum de 128 fonctions sont pris en charge.	Non
tool_choice	chatCompletionToolChoiceOption	Contrôle quel outil (le cas échéant) est appelé par le modèle. `none` cela signifie que le modèle n’appellera aucun outil et générera un message à la place. `auto` signifie que le modèle peut choisir entre générer un message ou appeler un ou plusieurs outils. `required` signifie que le modèle doit appeler un ou plusieurs outils. Spécifier un outil particulier force `{"type": "function", "function": {"name": "my_function"}}` le modèle à appeler cet outil. `none` est la norme par défaut lorsqu’aucun outil n’est présent. `auto` est la norme par défaut si des outils sont présents.	Non
function_call	chaîne ou chatCompletionFunctionCallOption	Déprécié au profit de `tool_choice`. Contrôle quelle fonction (le cas échéant) est appelée par le modèle. `none` signifie que le modèle n’appellera pas de fonction et générera un message. `auto` signifie que le modèle peut choisir entre générer un message ou appeler une fonction. Spécifier une fonction particulière via `{"name": "my_function"}` force le modèle à appeler cette fonction. `none` est la fonction par défaut lorsqu’aucune fonction n’est présente. `auto` est la valeur par défaut si des fonctions sont présentes.	Non
functions	tableau	Déprécié au profit de `tools`. Une liste des fonctions pour lesquelles le modèle peut générer des entrées JSON.	Non

Responses

Code de statut : 200

Description : OK

Type de contenu	Type	Description
application/json	créerRépondreComplétéChat ou créerRépondreAchèvementCours

Code de statut : par défaut

Description : Service indisponible

Type de contenu	Type	Description
application/json	errorResponse

Exemples

Example

Crée une complétion pour l’invite fournie, les paramètres et le modèle choisi.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21

{
 "messages": [
  {
   "role": "system",
   "content": "you are a helpful assistant that talks like a pirate"
  },
  {
   "role": "user",
   "content": "can you tell me how to care for a parrot?"
  }
 ]
}

Réponses : Code de statut : 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Ahoy matey! So ye be wantin' to care for a fine squawkin' parrot, eh? Well, shiver me timbers, let ol' Cap'n Assistant share some wisdom with ye! Here be the steps to keepin' yer parrot happy 'n healthy:\n\n1. Secure a sturdy cage: Yer parrot be needin' a comfortable place to lay anchor! Be sure ye get a sturdy cage, at least double the size of the bird's wingspan, with enough space to spread their wings, yarrrr!\n\n2. Perches 'n toys: Aye, parrots need perches of different sizes, shapes, 'n textures to keep their feet healthy. Also, a few toys be helpin' to keep them entertained 'n their minds stimulated, arrrh!\n\n3. Proper grub: Feed yer feathered friend a balanced diet of high-quality pellets, fruits, 'n veggies to keep 'em strong 'n healthy. Give 'em fresh water every day, or ye\u00e2\u20ac\u2122ll have a scurvy bird on yer hands!\n\n4. Cleanliness: Swab their cage deck! Clean their cage on a regular basis: fresh water 'n food daily, the floor every couple of days, 'n a thorough scrubbing ev'ry few weeks, so the bird be livin' in a tidy haven, arrhh!\n\n5. Socialize 'n train: Parrots be a sociable lot, arrr! Exercise 'n interact with 'em daily to create a bond 'n maintain their mental 'n physical health. Train 'em with positive reinforcement, treat 'em kindly, yarrr!\n\n6. Proper rest: Yer parrot be needin' \u00e2\u20ac\u2122bout 10-12 hours o' sleep each night. Cover their cage 'n let them slumber in a dim, quiet quarter for a proper night's rest, ye scallywag!\n\n7. Keep a weather eye open for illness: Birds be hidin' their ailments, arrr! Be watchful for signs of sickness, such as lethargy, loss of appetite, puffin' up, or change in droppings, and make haste to a vet if need be.\n\n8. Provide fresh air 'n avoid toxins: Parrots be sensitive to draft and pollutants. Keep yer quarters well ventilated, but no drafts, arrr! Be mindful of toxins like Teflon fumes, candles, or air fresheners.\n\nSo there ye have it, me hearty! With proper care 'n commitment, yer parrot will be squawkin' \"Yo-ho-ho\" for many years to come! Good luck, sailor, and may the wind be at yer back!"
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Crée une complétion basée sur les données Azure Search et l’identité managée assignée au système.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_search",
   "parameters": {
    "endpoint": "https://your-search-endpoint.search.windows.net/",
    "index_name": "{index name}",
    "authentication": {
     "type": "system_assigned_managed_identity"
    }
   }
  }
 ]
}

Réponses : Code de statut : 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Crée une complétion basée sur les données du vecteur de recherche Azure, le message d’assistant précédent et l’identité gérée attribuée par l’utilisateur.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a cat?"
  },
  {
   "role": "assistant",
   "content": "Content of the completion [doc1].",
   "context": {
    "intent": "cat care"
   }
  },
  {
   "role": "user",
   "content": "how about dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_search",
   "parameters": {
    "endpoint": "https://your-search-endpoint.search.windows.net/",
    "authentication": {
     "type": "user_assigned_managed_identity",
     "managed_identity_resource_id": "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{resource-name}"
    },
    "index_name": "{index name}",
    "query_type": "vector",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "in_scope": true,
    "top_n_documents": 5,
    "strictness": 3,
    "role_information": "You are an AI assistant that helps people find information.",
    "fields_mapping": {
     "content_fields_separator": "\\n",
     "content_fields": [
      "content"
     ],
     "filepath_field": "filepath",
     "title_field": "title",
     "url_field": "url",
     "vector_fields": [
      "contentvector"
     ]
    }
   }
  }
 ]
}

Réponses : Code de statut : 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content 2.",
                "title": "Citation Title 2",
                "filepath": "contoso2.txt",
                "url": "https://contoso.blob.windows.net/container/contoso2.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Example

Crée une complétion pour la Azure Cosmos DB fournie.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_cosmos_db",
   "parameters": {
    "authentication": {
     "type": "connection_string",
     "connection_string": "mongodb+srv://rawantest:{password}$@{cluster-name}.mongocluster.cosmos.azure.com/?tls=true&authMechanism=SCRAM-SHA-256&retrywrites=false&maxIdleTimeMS=120000"
    },
    "database_name": "vectordb",
    "container_name": "azuredocs",
    "index_name": "azuredocindex",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "fields_mapping": {
     "content_fields": [
      "content"
     ],
     "vector_fields": [
      "contentvector"
     ]
    }
   }
  }
 ]
}

Réponses : Code de statut : 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

Transcriptions - Créer

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21

Transcrit l’audio dans la langue d’entrée.

Paramètres d’URI

Nom	Dans	Obligatoire	Catégorie	Description
endpoint	path	Oui	string url	Pris en charge Azure terminaux OpenAI (protocole et nom d’hôte, par exemple : `https://aoairesource.openai.azure.com`. Remplacez « aoairesource » par le nom de votre ressource Azure OpenAI). https://{your-resource-name}.openai.azure.com
id-de-déploiement	path	Oui	string	ID de déploiement du modèle de reconnaissance vocale. Pour des informations sur les modèles pris en charge, voir [/azure/ai-foundry/openai/concepts/models#audio-models].
version de l'API	Requête	Oui	string	Version de l’API

En-tête de requête

Nom	Obligatoire	Catégorie	Description
clé API	True	string	Fournissez ici la clé API Azure OpenAI

Corps de la requête

Content-Type : multipart/form-data

Nom	Catégorie	Description	Obligatoire	Par défaut
fichier	string	L’objet du fichier audio à transcrire.	Oui
prompt	string	Un texte optionnel pour guider le style du modèle ou poursuivre un segment audio précédent. La consigne doit correspondre au langage audio.	Non
format_de_réponse	audioResponseFormat	Définit le format de la sortie.	Non
Température	number	La température d’échantillonnage, comprise entre 0 et 1. Des valeurs plus élevées comme 0,8 rendent la sortie plus aléatoire, tandis que des valeurs plus basses comme 0,2 la rendent plus ciblée et déterministe. Si elle est réglée à 0, le modèle utilisera la probabilité logarithmique pour augmenter automatiquement la température jusqu’à atteindre certains seuils.	Non	0
language	string	La langue de l’audio d’entrée. Fournir le langage d’entrée au format ISO-639-1 améliorera la précision et la latence.	Non

Responses

Code de statut : 200

Description : OK

Type de contenu	Type	Description
application/json	audioRéponse ou audioVerboseResponse
texte brut	string	Texte transcrit au format de sortie (quand response_format était un texte de texte, vtt ou srt).

Exemples

Example

Obtient le texte transcrit et les métadonnées associées à partir des données audio parlées fournies.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21

Réponses : Code de statut : 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Example

Obtient le texte transcrit et les métadonnées associées à partir des données audio parlées fournies.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Réponses : Code de statut : 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Traductions - Create

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21

Transcrit et traduit l’audio d’entrée en texte anglais.

Paramètres d’URI

Nom	Dans	Obligatoire	Catégorie	Description
endpoint	path	Oui	string url	Pris en charge Azure terminaux OpenAI (protocole et nom d’hôte, par exemple : `https://aoairesource.openai.azure.com`. Remplacez « aoairesource » par le nom de votre ressource Azure OpenAI). https://{your-resource-name}.openai.azure.com
id-de-déploiement	path	Oui	string	ID de déploiement du modèle whisper qui a été déployé. Pour des informations sur les modèles pris en charge, voir [/azure/ai-foundry/openai/concepts/models#audio-models].
version de l'API	Requête	Oui	string	Version de l’API

En-tête de requête

Nom	Obligatoire	Catégorie	Description
clé API	True	string	Fournissez ici la clé API Azure OpenAI

Corps de la requête

Content-Type : multipart/form-data

Nom	Catégorie	Description	Obligatoire	Par défaut
fichier	string	Le fichier audio à traduire.	Oui
prompt	string	Un texte optionnel pour guider le style du modèle ou poursuivre un segment audio précédent. Le prompt doit être en anglais.	Non
format_de_réponse	audioResponseFormat	Définit le format de la sortie.	Non
Température	number	La température d’échantillonnage, comprise entre 0 et 1. Des valeurs plus élevées comme 0,8 rendent la sortie plus aléatoire, tandis que des valeurs plus basses comme 0,2 la rendent plus ciblée et déterministe. Si elle est réglée à 0, le modèle utilisera la probabilité logarithmique pour augmenter automatiquement la température jusqu’à atteindre certains seuils.	Non	0

Responses

Code de statut : 200

Description : OK

Type de contenu	Type	Description
application/json	audioRéponse ou audioVerboseResponse
texte brut	string	Texte transcrit au format de sortie (quand response_format était un texte de texte, vtt ou srt).

Exemples

Example

Obtient le texte transcrit en anglais et les métadonnées associées à partir des données audio parlées fournies.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Réponses : Code de statut : 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

Example

Obtient le texte transcrit en anglais et les métadonnées associées à partir des données audio parlées fournies.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

Réponses : Code de statut : 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

Génération d'image

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2024-10-21

Génère un lot d’images à partir d’une légende texte sur un déploiement donné du modèle dall-e

Paramètres d’URI

Nom	Dans	Obligatoire	Catégorie	Description
endpoint	path	Oui	string url	Pris en charge Azure terminaux OpenAI (protocole et nom d’hôte, par exemple : `https://aoairesource.openai.azure.com`. Remplacez « aoairesource » par le nom de votre ressource Azure OpenAI). https://{your-resource-name}.openai.azure.com
id-de-déploiement	path	Oui	string	ID de déploiement du modèle dall-e qui a été déployé.
version de l'API	Requête	Oui	string	Version de l’API

En-tête de requête

Nom	Obligatoire	Catégorie	Description
clé API	True	string	Fournissez ici la clé API Azure OpenAI

Corps de la requête

Content-Type : application/json

Nom	Catégorie	Description	Obligatoire	Par défaut
prompt	string	Une description textuelle de l’image ou des images souhaitées. La longueur maximale est de 4 000 caractères.	Oui
n	entier	Le nombre d’images à générer.	Non	1
size	imageSize	La taille des images générées.	Non	1024x1024
format_de_réponse	imagesResponseFormat	Le format dans lequel les images générées sont renvoyées.	Non	url
utilisateur	string	Un identifiant unique représentant votre utilisateur final, qui peut aider à surveiller et détecter les abus.	Non
Qualité	imageQuality	La qualité de l’image qui sera générée.	Non	Norme
style	imageStyle	Le style des images générées.	Non	vivid

Responses

Code de statut : 200

Description : Ok

Type de contenu	Type	Description
application/json	generateImagesResponse

Code de statut : par défaut

Description : Une erreur s’est produite.

Type de contenu	Type	Description
application/json	dalleErrorResponse

Exemples

Example

Crée des images à partir d’une invitation.

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2024-10-21

{
 "prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
 "n": 1,
 "style": "natural",
 "quality": "standard"
}

Réponses : Code de statut : 200

{
  "body": {
    "created": 1698342300,
    "data": [
      {
        "revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
        "prompt_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          },
          "profanity": {
            "detected": false,
            "filtered": false
          }
        },
        "url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
        "content_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          }
        }
      }
    ]
  }
}

Composants

errorResponse

Nom	Catégorie	Description	Obligatoire	Par défaut
erreur	error		Non

errorBase

Nom	Catégorie	Description	Obligatoire	Par défaut
code	string		Non
message	string		Non

erreur

Nom	Catégorie	Description	Obligatoire
param	string		Non
type	string		Non
inner_error	innerError	Erreur intérieure avec des détails supplémentaires.	Non

innerError

Erreur intérieure avec des détails supplémentaires.

Nom	Catégorie	Description	Obligatoire	Par défaut
code	innerErrorCode	Codes d’erreur pour l’objet d’erreur interne.	Non
content_filter_results	contentFilterPromptResults	Informations sur la catégorie de filtrage de contenu (haine, sexuel, violence, self_harm), si elle a été détectée, ainsi que sur le niveau de gravité (very_low, faible, moyen, élevé qui détermine l’intensité et le niveau de risque du contenu nuisible) et si elle a été filtrée ou non. Informations sur le contenu jailbreak et les jurons, s’ils ont été détectés, et si ils ont été filtrés ou non. Et des informations sur la liste de blocage des clients, si elle a été filtrée et son identifiant.	Non

innerErrorCode

Codes d’erreur pour l’objet d’erreur interne.

Description : Codes d’erreur pour l’objet d’erreur interne.

Type : chaîne

Valeur par défaut :

Nom d’enum : InnerErrorCode

Valeurs d’énumération :

Valeur	Description
ResponsibleAIPolicyViolation	La consigne a enfreint l’une des autres règles de filtrage de contenu.

dalleErrorResponse

Nom	Catégorie	Description	Obligatoire	Par défaut
erreur	dalleError		Non

dalleError

Nom	Catégorie	Description	Obligatoire
param	string		Non
type	string		Non
inner_error	dalleInnerError	Erreur intérieure avec des détails supplémentaires.	Non

dalleInnerError

Erreur intérieure avec des détails supplémentaires.

Nom	Catégorie	Description	Obligatoire
code	innerErrorCode	Codes d’erreur pour l’objet d’erreur interne.	Non
content_filter_results	dalleFilterResults	Informations sur la catégorie de filtrage de contenu (haine, sexuel, violence, self_harm), si elle a été détectée, ainsi que sur le niveau de gravité (very_low, faible, moyen, élevé qui détermine l’intensité et le niveau de risque du contenu nuisible) et si elle a été filtrée ou non. Informations sur le contenu jailbreak et les jurons, s’ils ont été détectés, et si ils ont été filtrés ou non. Et des informations sur la liste de blocage des clients, si elle a été filtrée et son identifiant.	Non
revised_prompt	string	La demande utilisée pour générer l’image, s’il y avait une révision de la requête.	Non

BaseDeRésultatDeFiltreDeContenu

Nom	Catégorie	Description	Obligatoire	Par défaut
filtered	booléen		Oui

Résultat de la sévérité du filtre de contenu

Nom	Catégorie	Description	Obligatoire	Par défaut
filtered	booléen		Oui
severity	string		Non

contentFilterDetectedResult

Nom	Catégorie	Description	Obligatoire	Par défaut
filtered	booléen		Oui
détecté	booléen		Non

contentFilterDetectedWithCitationResult

Nom	Catégorie	Description	Obligatoire	Par défaut
citation	Objet		Non

Propriétés de citation

URL

Nom	Catégorie	Description	Par défaut
URL	string

license

Nom	Catégorie	Description	Par défaut
license	string

contentFilterResultsBase

Informations sur les résultats du filtrage de contenu.

Nom	Catégorie	Obligatoire
Sexuelle	résultatDeSévéritéDuFiltreDeContenu	Non
violence	résultatDeSévéritéDuFiltreDeContenu	Non
Déteste	résultatDeSévéritéDuFiltreDeContenu	Non
self_harm	résultatDeSévéritéDuFiltreDeContenu	Non
Blasphème	RésultatDeFiltreDeContenuDétecté	Non
erreur	errorBase	Non

contentFilterPromptResults

Informations sur la catégorie de filtrage de contenu (haine, sexuel, violence, self_harm), si elle a été détectée, ainsi que sur le niveau de gravité (very_low, faible, moyen, élevé qui détermine l’intensité et le niveau de risque du contenu nuisible) et si elle a été filtrée ou non. Informations sur le contenu jailbreak et les jurons, s’ils ont été détectés, et si ils ont été filtrés ou non. Et des informations sur la liste de blocage des clients, si elle a été filtrée et son identifiant.

Nom	Catégorie	Obligatoire
Sexuelle	résultatDeSévéritéDuFiltreDeContenu	Non
violence	résultatDeSévéritéDuFiltreDeContenu	Non
Déteste	résultatDeSévéritéDuFiltreDeContenu	Non
self_harm	résultatDeSévéritéDuFiltreDeContenu	Non
Blasphème	RésultatDeFiltreDeContenuDétecté	Non
erreur	errorBase	Non
jailbreak	RésultatDeFiltreDeContenuDétecté	Non

contentFilterChoiceResults

Informations sur la catégorie de filtrage de contenu (haine, sexuel, violence, self_harm), si elle a été détectée, ainsi que sur le niveau de gravité (very_low, faible, moyen, élevé qui détermine l’intensité et le niveau de risque du contenu nuisible) et si elle a été filtrée ou non. Informations sur les textes et jurons tiers, si cela a été détecté, et s’il a été filtré ou non. Et des informations sur la liste de blocage des clients, si elle a été filtrée et son identifiant.

Nom	Catégorie	Obligatoire
Sexuelle	résultatDeSévéritéDuFiltreDeContenu	Non
violence	résultatDeSévéritéDuFiltreDeContenu	Non
Déteste	résultatDeSévéritéDuFiltreDeContenu	Non
self_harm	résultatDeSévéritéDuFiltreDeContenu	Non
Blasphème	RésultatDeFiltreDeContenuDétecté	Non
erreur	errorBase	Non
protected_material_text	RésultatDeFiltreDeContenuDétecté	Non
protected_material_code	filtreDeContenuDetectéAvecRésultatDeCitation	Non

promptFilterResult

Résultats de filtrage de contenu pour une seule invite dans la requête.

Nom	Catégorie	Description	Obligatoire	Par défaut
prompt_index	entier		Non
content_filter_results	contentFilterPromptResults	Informations sur la catégorie de filtrage de contenu (haine, sexuel, violence, self_harm), si elle a été détectée, ainsi que sur le niveau de gravité (very_low, faible, moyen, élevé qui détermine l’intensité et le niveau de risque du contenu nuisible) et si elle a été filtrée ou non. Informations sur le contenu jailbreak et les jurons, s’ils ont été détectés, et si ils ont été filtrés ou non. Et des informations sur la liste de blocage des clients, si elle a été filtrée et son identifiant.	Non

promptFilterResults

Filtrage de contenu pour zéro ou plus d’invites dans la requête. Dans une requête en streaming, les résultats pour différentes invitations peuvent arriver à des moments ou dans des ordres différents.

Aucune propriété définie pour ce composant.

RésultatsDalleFiltreDeContenu

Informations sur les résultats du filtrage de contenu.

Nom	Catégorie	Obligatoire
Sexuelle	résultatDeSévéritéDuFiltreDeContenu	Non
violence	résultatDeSévéritéDuFiltreDeContenu	Non
Déteste	résultatDeSévéritéDuFiltreDeContenu	Non
self_harm	résultatDeSévéritéDuFiltreDeContenu	Non

dalleFilterResults

Nom	Catégorie	Obligatoire
Sexuelle	résultatDeSévéritéDuFiltreDeContenu	Non
violence	résultatDeSévéritéDuFiltreDeContenu	Non
Déteste	résultatDeSévéritéDuFiltreDeContenu	Non
self_harm	résultatDeSévéritéDuFiltreDeContenu	Non
Blasphème	RésultatDeFiltreDeContenuDétecté	Non
jailbreak	RésultatDeFiltreDeContenuDétecté	Non

chatCompletionsRequestCommon

Nom	Catégorie	Description	Obligatoire	Par défaut
Température	number	Quelle température d’échantillonnage utiliser, entre 0 et 2. Des valeurs plus élevées comme 0,8 rendent la sortie plus aléatoire, tandis que des valeurs plus basses comme 0,2 la rendent plus ciblée et déterministe. Nous recommandons généralement de modifier cela, ou `top_p` pas les deux.	Non	1
top_p	number	Une alternative à l’échantillonnage par température, appelée échantillonnage de noyau, où le modèle considère les résultats des jetons avec top_p masse de probabilité. Ainsi, 0,1 signifie que seuls les jetons composant la 10e première masse de probabilité% sont pris en compte. Nous recommandons généralement de modifier cela, ou `temperature` pas les deux.	Non	1
stream	booléen	Si c’est défini, des deltas partiels de message seront envoyés, comme dans ChatGPT. Les jetons seront envoyés uniquement en données par le serveur dès qu’ils seront disponibles, le flux étant interrompu par un `data: [DONE]` message.	Non	Faux
Arrêter	chaîne ou tableau	Jusqu’à quatre séquences où l’API cessera de générer d’autres jetons.	Non
nombre_maximal_de_tokens	entier	Le nombre maximal de jetons autorisé pour la réponse générée. Par défaut, le nombre de jetons que le modèle peut retourner sera (4096 - jetons à invites). Cette valeur est désormais dépréciée au profit de `max_completion_tokens`, et n’est pas compatible avec les modèles de la série O1.	Non	4096
max_completion_tokens	entier	Une borne supérieure pour le nombre de jetons pouvant être générés pour une complétion, incluant les jetons de sortie visibles et les jetons de raisonnement.	Non
pénalité de présence	number	Nombre compris entre -2,0 et 2,0. Les valeurs positives pénalisent les nouveaux jetons en fonction de leur apparence dans le texte jusqu’à présent, augmentant ainsi la probabilité du modèle d’aborder de nouveaux sujets.	Non	0
pénalité de fréquence	number	Nombre compris entre -2,0 et 2,0. Les valeurs positives pénalisent les nouveaux jetons en fonction de leur fréquence existante dans le texte jusqu’à présent, diminuant la probabilité que le modèle répète la même phrase mot pour mot.	Non	0
logit_bias	Objet	Modifier la probabilité que des jetons spécifiés apparaissent dans la complétion. Accepte un objet json qui associe les jetons (spécifiés par leur identifiant de jeton dans le tokenizador) à une valeur de biais associée de -100 à 100. Mathématiquement, le biais est ajouté aux logits générés par le modèle avant l’échantillonnage. L’effet exact variera selon le modèle, mais les valeurs comprises entre -1 et 1 devraient diminuer ou augmenter la probabilité de sélection ; des valeurs comme -100 ou 100 devraient entraîner un bannissement ou une sélection exclusive du jeton concerné.	Non
utilisateur	string	Un identifiant unique représentant votre utilisateur final, qui peut aider Azure OpenAI à surveiller et détecter les abus.	Non

créerDemandeDeComplétion

Nom	Catégorie	Description	Obligatoire	Par défaut
prompt	chaîne ou tableau	Le(s) prompt(s) pour générer des complétions pour , encodé sous forme de chaîne, tableau de chaînes, tableau de jetons ou tableau de tableaux de jetons. Notez que <\|endoftext\|> est le séparateur de document que le modèle voit lors de l’entraînement, donc si une invite n’est pas spécifiée, le modèle sera généré comme si c’était le début d’un nouveau document.	Oui
meilleures sélections	entier	Génère `best_of` des complétions côté serveur et retourne le « meilleur » (celui avec la plus grande probabilité logarithmique par jeton). Les résultats ne peuvent pas être diffusés en streaming. Lorsqu’elle est utilisée avec `n`, `best_of` contrôle le nombre de complétions candidates et `n` spécifie combien retourner â€ » `best_of` doit être supérieur à `n`. Note : Parce que ce paramètre génère de nombreuses complétions, il peut rapidement consommer votre quota de jetons. Utilisez avec soin et assurez-vous d’avoir des réglages raisonnables pour `max_tokens` et `stop`.	Non	1
echo	booléen	Faites écho à la consigne en plus de la complétion	Non	Faux
pénalité de fréquence	number	Nombre compris entre -2,0 et 2,0. Les valeurs positives pénalisent les nouveaux jetons en fonction de leur fréquence existante dans le texte jusqu’à présent, diminuant la probabilité que le modèle répète la même phrase mot pour mot.	Non	0
logit_bias	Objet	Modifier la probabilité que des jetons spécifiés apparaissent dans la complétion. Accepte un objet JSON qui associe les jetons (spécifiés par leur identifiant de jeton dans le tokeniseur GPT) à une valeur de biais associée de -100 à 100. Mathématiquement, le biais est ajouté aux logits générés par le modèle avant l’échantillonnage. L’effet exact variera selon le modèle, mais les valeurs comprises entre -1 et 1 devraient diminuer ou augmenter la probabilité de sélection ; des valeurs comme -100 ou 100 devraient entraîner un bannissement ou une sélection exclusive du jeton concerné. Par exemple, vous pouvez passer `{"50256": -100}` pour empêcher la génération du <token \|endoftext> .	Non	None
logprobs	entier	Incluez les probabilités logarithiques sur les `logprobs` jetons de sortie les plus probables, ainsi que les jetons choisis. Par exemple, si `logprobs` est 5, l’API renverra une liste des cinq jetons les plus probables. L’API retournera toujours le `logprob` du jeton échantillonné, donc il peut y avoir jusqu’à jusqu’à `logprobs+1` des éléments dans la réponse. La valeur maximale pour `logprobs` est 5.	Non	None
nombre_maximal_de_tokens	entier	Le nombre maximal de jetons pouvant être générés dans la complétion. Le nombre de jetons de votre invite plus `max_tokens` ne peut pas dépasser la longueur contextuelle du modèle.	Non	16
n	entier	Combien de complétions générer pour chaque invite. Note : Parce que ce paramètre génère de nombreuses complétions, il peut rapidement consommer votre quota de jetons. Utilisez avec soin et assurez-vous d’avoir des réglages raisonnables pour `max_tokens` et `stop`.	Non	1
pénalité de présence	number	Nombre compris entre -2,0 et 2,0. Les valeurs positives pénalisent les nouveaux jetons en fonction de leur apparence dans le texte jusqu’à présent, augmentant ainsi la probabilité du modèle d’aborder de nouveaux sujets.	Non	0
seed	entier	Si spécifié, notre système fera un meilleur effort pour échantillonner de manière déterministe, de sorte que les requêtes répétées avec les mêmes `seed` paramètres et reproduisent le même résultat. Le déterminisme n’est pas garanti, et vous devriez vous référer au `system_fingerprint` paramètre de réponse pour surveiller les changements dans le backend.	Non
Arrêter	chaîne ou tableau	Jusqu’à quatre séquences où l’API cessera de générer d’autres jetons. Le texte retourné ne contiendra pas la séquence d’arrêt.	Non
stream	booléen	Est-ce qu’il faut réintégrer un progrès partiel en détail. S’ils sont activés, les jetons seront envoyés comme des événements uniquement données envoyés par le serveur dès qu’ils deviennent disponibles, le flux étant interrompu par un `data: [DONE]` message.	Non	Faux
Suffixe	string	Le suffixe qui vient après la fin du texte inséré. Ce paramètre n’est pris en charge que pour `gpt-3.5-turbo-instruct`.	Non	None
Température	number	Quelle température d’échantillonnage utiliser, entre 0 et 2. Des valeurs plus élevées comme 0,8 rendent la sortie plus aléatoire, tandis que des valeurs plus basses comme 0,2 la rendent plus ciblée et déterministe. Nous recommandons généralement de modifier cela, ou `top_p` pas les deux.	Non	1
top_p	number	Une alternative à l’échantillonnage par température, appelée échantillonnage de noyau, où le modèle considère les résultats des jetons avec top_p masse de probabilité. Ainsi, 0,1 signifie que seuls les jetons composant la 10e première masse de probabilité% sont pris en compte. Nous recommandons généralement de modifier cela, ou `temperature` pas les deux.	Non	1
utilisateur	string	Un identifiant unique représentant votre utilisateur final, qui peut aider à surveiller et détecter les abus.	Non

createCompletionResponse

Représente une réponse de complétion de l’API. Note : les objets de réponse en streaming et non diffusés partagent la même forme (contrairement au point d’extrémité du chat).

Nom	Catégorie	Description	Obligatoire
ID	string	Un identifiant unique pour l’achèvement.	Oui
choix	tableau	La liste des choix de complétion générés par le modèle pour l’invite d’entrée.	Oui
créé	entier	L’horodatage Unix (en secondes) de la création de la complétion.	Oui
model	string	Le modèle utilisé pour la complétion.	Oui
prompt_filter_results	promptFilterResults	Filtrage de contenu pour zéro ou plus d’invites dans la requête. Dans une requête en streaming, les résultats pour différentes invitations peuvent arriver à des moments ou dans des ordres différents.	Non
system_fingerprint	string	Cette empreinte digitale représente la configuration backend avec laquelle le modèle fonctionne. Peut être utilisé conjointement avec le `seed` paramètre de requête pour comprendre quand des modifications en backend ont été effectuées pouvant impacter le déterminisme.	Non
Objet	enum	Le type d’objet, qui est toujours « text_completion » Valeurs possibles : text_completion	Oui
utilisation	completionUsage	Statistiques d’utilisation pour la demande de complétion.	Non

createChatCompletionRequest

Nom	Catégorie	Description	Obligatoire	Par défaut
Température	number	Quelle température d’échantillonnage utiliser, entre 0 et 2. Des valeurs plus élevées comme 0,8 rendent la sortie plus aléatoire, tandis que des valeurs plus basses comme 0,2 la rendent plus ciblée et déterministe. Nous recommandons généralement de modifier cela, ou `top_p` pas les deux.	Non	1
top_p	number	Une alternative à l’échantillonnage par température, appelée échantillonnage de noyau, où le modèle considère les résultats des jetons avec top_p masse de probabilité. Ainsi, 0,1 signifie que seuls les jetons composant la 10e première masse de probabilité% sont pris en compte. Nous recommandons généralement de modifier cela, ou `temperature` pas les deux.	Non	1
stream	booléen	Si c’est défini, des deltas partiels de message seront envoyés, comme dans ChatGPT. Les jetons seront envoyés uniquement en données par le serveur dès qu’ils seront disponibles, le flux étant interrompu par un `data: [DONE]` message.	Non	Faux
Arrêter	chaîne ou tableau	Jusqu’à quatre séquences où l’API cessera de générer d’autres jetons.	Non
nombre_maximal_de_tokens	entier	Le nombre maximal de jetons pouvant être générés lors de la fin du chat. La longueur totale des jetons d’entrée et des jetons générés est limitée par la longueur du contexte du modèle.	Non
max_completion_tokens	entier	Une borne supérieure pour le nombre de jetons pouvant être générés pour une complétion, incluant les jetons de sortie visibles et les jetons de raisonnement.	Non
pénalité de présence	number	Nombre compris entre -2,0 et 2,0. Les valeurs positives pénalisent les nouveaux jetons en fonction de leur apparence dans le texte jusqu’à présent, augmentant ainsi la probabilité du modèle d’aborder de nouveaux sujets.	Non	0
pénalité de fréquence	number	Nombre compris entre -2,0 et 2,0. Les valeurs positives pénalisent les nouveaux jetons en fonction de leur fréquence existante dans le texte jusqu’à présent, diminuant la probabilité que le modèle répète la même phrase mot pour mot.	Non	0
logit_bias	Objet	Modifier la probabilité que des jetons spécifiés apparaissent dans la complétion. Accepte un objet JSON qui associe les jetons (spécifiés par leur identifiant de jeton dans le tokenizador) à une valeur de biais associée de -100 à 100. Mathématiquement, le biais est ajouté aux logits générés par le modèle avant l’échantillonnage. L’effet exact variera selon le modèle, mais les valeurs comprises entre -1 et 1 devraient diminuer ou augmenter la probabilité de sélection ; des valeurs comme -100 ou 100 devraient entraîner un bannissement ou une sélection exclusive du jeton concerné.	Non	None
utilisateur	string	Un identifiant unique représentant votre utilisateur final, qui peut aider à surveiller et détecter les abus.	Non
messages	tableau	Une liste des messages qui composent la conversation jusqu’à présent.	Oui
data_sources	tableau	Les entrées de configuration pour les extensions de chat Azure OpenAI qui les utilisent. Cette spécification supplémentaire n’est compatible qu’avec Azure OpenAI.	Non
logprobs	booléen	S’il faut ou non retourner les probabilités logarithiques des jetons de sortie. Si c’est vrai, renvoie les probabilités logarithmitrophiques de chaque jeton de sortie retourné dans le `content` de `message`.	Non	Faux
top_logprobs	entier	Un entier compris entre 0 et 20 spécifiant le nombre de jetons les plus susceptibles de revenir à chaque position de jeton, chacun avec une probabilité logarithmique associée. `logprobs` doit être fixé à `true` si ce paramètre est utilisé.	Non
n	entier	Combien de choix de fin de conversation générer pour chaque message d’entrée. Notez que vous serez facturé en fonction du nombre de jetons générés dans toutes les options. Gardez `n` le minimum `1` pour minimiser les coûts.	Non	1
parallel_tool_calls	ParallelToolCalls	S’il faut activer l’appel de fonctions parallèles lors de l’utilisation de l’outil.	Non	True
format_de_réponse	ResponseFormatText ou ResponseFormatJsonObject ou ResponseFormatJsonSchema	Un objet spécifiant le format que le modèle doit produire. Compatible avec GPT-4o, GPT-4o mini, GPT-4 Turbo et tous les modèles GPT-3.5 Turbo plus récents que `gpt-3.5-turbo-1106`. Mettre sur `{ "type": "json_schema", "json_schema": {...} }` active les sorties structurées, ce qui garantit que le modèle correspondra à votre schéma JSON fourni. Le réglage activant `{ "type": "json_object" }` le mode JSON, qui garantit que le message généré par le modèle est un JSON valide. Important : lors de l’utilisation du mode JSON, vous devez également demander au modèle de produire vous-même le JSON via un message système ou utilisateur. Sans cela, le modèle peut générer un flux ininterrompu d’espaces blancs jusqu’à ce que la génération atteigne la limite de tokens, ce qui entraîne une demande de longue durée et apparemment « bloquée ». Notez également que le contenu du message peut être partiellement coupé si `finish_reason="length"`, ce qui indique que la génération a `max_tokens` dépassé ou que la conversation a dépassé la longueur maximale du contexte.	Non
seed	entier	Cette fonctionnalité est en version Bêta. Si spécifié, notre système fera un meilleur effort pour échantillonner de manière déterministe, de sorte que les requêtes répétées avec les mêmes `seed` paramètres et reproduisent le même résultat. Le déterminisme n’est pas garanti, et vous devriez vous référer au `system_fingerprint` paramètre de réponse pour surveiller les changements dans le backend.	Non
Outils	tableau	Une liste d’outils que le modèle peut appeler. Actuellement, seules les fonctions sont prises en charge comme outil. Utilisez cela pour fournir une liste des fonctions pour lesquelles le modèle peut générer des entrées JSON. Un maximum de 128 fonctions sont pris en charge.	Non
tool_choice	chatCompletionToolChoiceOption	Contrôle quel outil (le cas échéant) est appelé par le modèle. `none` cela signifie que le modèle n’appellera aucun outil et générera un message à la place. `auto` signifie que le modèle peut choisir entre générer un message ou appeler un ou plusieurs outils. `required` signifie que le modèle doit appeler un ou plusieurs outils. Spécifier un outil particulier force `{"type": "function", "function": {"name": "my_function"}}` le modèle à appeler cet outil. `none` est la norme par défaut lorsqu’aucun outil n’est présent. `auto` est la norme par défaut si des outils sont présents.	Non
function_call	chaîne ou chatCompletionFunctionCallOption	Déprécié au profit de `tool_choice`. Contrôle quelle fonction (le cas échéant) est appelée par le modèle. `none` signifie que le modèle n’appellera pas de fonction et générera un message. `auto` signifie que le modèle peut choisir entre générer un message ou appeler une fonction. Spécifier une fonction particulière via `{"name": "my_function"}` force le modèle à appeler cette fonction. `none` est la fonction par défaut lorsqu’aucune fonction n’est présente. `auto` est la valeur par défaut si des fonctions sont présentes.	Non
functions	tableau	Déprécié au profit de `tools`. Une liste des fonctions pour lesquelles le modèle peut générer des entrées JSON.	Non

chatCompletionFunctions

Nom	Catégorie	Description	Obligatoire
description	string	Une description de ce que fait la fonction, utilisée par le modèle pour choisir quand et comment appeler la fonction.	Non
name	string	Le nom de la fonction à appeler. Doit être de A à Z, de A à Z, de 0 à 9, ou contenir des sous-traits et des titres, avec une longueur maximale de 64.	Oui
parameters	FunctionParameters	Les paramètres acceptés par les fonctions sont décrits comme un objet schéma JSON. Voir le guide pour des exemples, ainsi que la référence du schéma JSON pour la documentation sur le format. Omettre `parameters` définit une fonction avec une liste de paramètres vide.	Non

chatCompletionFunctionCallOption

Spécifier une fonction particulière via {"name": "my_function"} force le modèle à appeler cette fonction.

Nom	Catégorie	Description	Obligatoire	Par défaut
name	string	Le nom de la fonction à appeler.	Oui

chatCompletionRequestMessage

Ce composant peut être l’un des suivants :

Message du système de demande d'achèvement du chat

Nom	Catégorie	Description	Obligatoire
contenu	chaîne ou tableau	Le contenu du message système.	Oui
role	enum	Le rôle de l’auteur des messages, dans ce cas `system`. Valeurs possibles : système	Oui
name	string	Un nom optionnel pour le participant. Fournit les informations du modèle permettant de différencier les participants ayant le même rôle.	Non

chatCompletionRequestUserMessage

Nom	Catégorie	Description	Obligatoire
contenu	chaîne ou tableau	Le contenu du message utilisateur.	Oui
role	enum	Le rôle de l’auteur des messages, dans ce cas `user`. Valeurs possibles : utilisateur	Oui
name	string	Un nom optionnel pour le participant. Fournit les informations du modèle permettant de différencier les participants ayant le même rôle.	Non

chatCompletionRequestAssistantMessage

Nom	Catégorie	Description	Obligatoire
contenu	chaîne ou tableau	Le contenu du message de l’assistant. Obligatoire sauf `tool_calls` indication contraire `function_call` .	Non
refusal	string	Le message de refus de l’assistant.	Non
role	enum	Le rôle de l’auteur des messages, dans ce cas `assistant`. Valeurs possibles : assistant	Oui
name	string	Un nom optionnel pour le participant. Fournit les informations du modèle permettant de différencier les participants ayant le même rôle.	Non
tool_calls	chatCompletionMessageToolCalls	Les appels d’outils générés par le modèle, tels que les appels de fonction.	Non
function_call	Objet	Déprécié et remplacé par `tool_calls`. Le nom et les arguments d’une fonction à appeler, tels que générés par le modèle.	Non

Propriétés pour function_call

Arguments

Nom	Catégorie	Description	Par défaut
Arguments	string	Les arguments pour appeler la fonction avec, telle que générée par le modèle au format JSON. Notez que le modèle ne génère pas toujours un JSON valide, et peut générer des paramètres non définis par votre schéma de fonction. Validez les arguments de votre code avant d’appeler votre fonction.

name

Nom	Catégorie	Description	Par défaut
name	string	Le nom de la fonction à appeler.

chatCompletionRequestToolMessage

Nom	Catégorie	Description	Obligatoire
role	enum	Le rôle de l’auteur des messages, dans ce cas `tool`. Valeurs possibles : outil	Oui
contenu	chaîne ou tableau	Le contenu du message de l’outil.	Oui
tool_call_id	string	Appel d’outil auquel ce message répond.	Oui

chatCompletionRequestFunctionMessage

Nom	Catégorie	Description	Obligatoire
role	enum	Le rôle de l’auteur des messages, dans ce cas `function`. Valeurs possibles : fonction	Oui
contenu	string	Le contenu du message de fonction.	Oui
name	string	Le nom de la fonction à appeler.	Oui

Partie de contenu du message système de requête de finalisation de chat

Ce composant peut être l’un des suivants :

chatCompletionRequestUserMessageContentPart

Ce composant peut être l’un des suivants :

chatCompletionRequestAssistantMessageContentPart

Ce composant peut être l’un des suivants :

chatCompletionRequestToolMessageContentPart

Ce composant peut être l’un des suivants :

chatCompletionRequestMessageContentPartText

Nom	Catégorie	Description	Obligatoire	Par défaut
type	enum	Le type de contenu. Valeurs possibles : texte	Oui
texte	string	Le contenu du texte.	Oui

chatCompletionRequestMessageContentPartImage

Nom	Catégorie	Description	Obligatoire	Par défaut
type	enum	Le type de contenu. Valeurs possibles : image_url	Oui
image_url	Objet		Oui

Propriétés pour image_url

url

Nom	Catégorie	Description	Par défaut
url	string	Soit une URL de l’image, soit les données d’image encodées en base64.

detail

Nom	Catégorie	Description	Par défaut
detail	string	Précise le niveau de détail de l’image. En savoir plus dans le guide Vision.	auto

chatCompletionRequestMessageContentPartRefusal

Nom	Catégorie	Description	Obligatoire	Par défaut
type	enum	Le type de contenu. Valeurs possibles : refus	Oui
refusal	string	Le message de refus généré par le modèle.	Oui

configuration de l'extension de chat Azure

Une représentation des données de configuration pour une seule extension de chat OpenAI d’Azure. Cela sera utilisé par une demande de complétion de chat qui devrait utiliser les extensions de chat OpenAI d’Azure pour renforcer le comportement de réponse. L’utilisation de cette configuration est compatible uniquement avec Azure OpenAI.

Nom	Catégorie	Description	Obligatoire	Par défaut
type	azureChatExtensionType	Une représentation des données de configuration pour une seule extension de chat OpenAI d’Azure. Cela sera utilisé par un chat des complétions qui devraient utiliser les extensions de chat OpenAI d’Azure pour compléter le comportement de réponse. L’utilisation de cette configuration est compatible uniquement avec Azure OpenAI.	Oui

azureChatExtensionType

Description : Représentation des données de configuration pour une seule extension de chat OpenAI Azure. Cela sera utilisé par une demande de complétion de chat qui devrait utiliser les extensions de chat OpenAI d’Azure pour renforcer le comportement de réponse. L’utilisation de cette configuration est compatible uniquement avec Azure OpenAI.

Type : chaîne

Valeur par défaut :

Enum Name : AzureChatExtensionType

Valeurs d’énumération :

Valeur	Description
azure_search	Représente l’utilisation d’Azure Search comme extension de chat OpenAI d’Azure.
azure_cosmos_db	Représente l’utilisation d’Azure Cosmos DB comme extension de chat Azure OpenAI.

Configuration d'extension de chat Azure Search

Une représentation spécifique des options configurables pour Azure Search lorsqu’on l’utilise comme extension de chat OpenAI d’Azure.

Nom	Catégorie	Description	Obligatoire	Par défaut
type	azureChatExtensionType	Une représentation des données de configuration pour une seule extension de chat OpenAI d’Azure. Cela sera utilisé par un chat des complétions qui devraient utiliser les extensions de chat OpenAI d’Azure pour compléter le comportement de réponse. L’utilisation de cette configuration est compatible uniquement avec Azure OpenAI.	Oui
parameters	azureSearchChatExtensionParameters	Paramètres pour Azure Search lorsqu’ils sont utilisés comme extension de chat OpenAI Azure.	Non

azureSearchChatExtensionParameters

Paramètres pour Azure Search lorsqu’ils sont utilisés comme extension de chat OpenAI Azure.

Nom	Catégorie	Description	Obligatoire
Authentification	onYourDataApiKeyAuthenticationOptions ou onVotReDataSystemAssignéGéréIdentitatOptionsAuthenticationOu onVotReDataUtilisateurAssignéGéréIdentitatAuthenticationOptions		Oui
top_n_documents	entier	Le nombre supérieur configuré de documents à présenter pour la requête configurée.	Non
in_scope	booléen	Est-ce que les requêtes doivent être restreintes à l’utilisation de données indexées.	Non
Rigueur	entier	La stricteur configurée du filtrage de pertinence de recherche. Plus la rigueur est élevée, plus la précision est élevée mais moins la mémoire de la réponse est élevée.	Non
informations_sur_le_rôle	string	Donnez au modèle des instructions sur son comportement et tout contexte auquel il doit se référer lors de la génération d’une réponse. Vous pouvez décrire la personnalité de l’assistant et lui expliquer comment formater les réponses. Il y a une limite de 100 jetons, et cela compte dans la limite globale de jetons.	Non
endpoint	string	Le chemin d’extrémité absolu pour la ressource Azure Search à utiliser.	Oui
nom_de_l'index	string	Le nom de l’index à utiliser tel que disponible dans la ressource Azure Search référencée.	Oui
cartographie des champs	Options de mappage de champs de l'index de recherche Azure	Paramètres optionnels pour contrôler le traitement des champs lors de l’utilisation d’une ressource Azure Search configurée.	Non
type_de_requête	azureSearchQueryType	Le type de requête de recherche Azure qui doit être exécutée lorsqu’on l’utilise comme extension de chat OpenAI Azure.	Non
configuration_sémantique	string	La configuration sémantique supplémentaire pour la requête.	Non
filter	string	Filtre de recherche.	Non
embedding_dependency	onTonDataDataEndpointVectorisationSource ou surVotReDonnéesDéploiementNomVectorisationSource		Non

Options de mappage de champs de l'index de recherche Azure

Paramètres optionnels pour contrôler le traitement des champs lors de l’utilisation d’une ressource Azure Search configurée.

Nom	Catégorie	Description	Obligatoire
champ_titre	string	Le nom du champ index à utiliser comme titre.	Non
url_field	string	Le nom du champ index à utiliser comme URL.	Non
filepath_field	string	Le nom du champ d’index à utiliser comme chemin de fichier.	Non
champs_de_contenu	tableau	Les noms des champs d’index qui doivent être considérés comme du contenu.	Non
séparateur_de_champs_de_contenu	string	Le motif séparateur que les champs de contenu doivent utiliser.	Non
champs vectoriels	tableau	Les noms des champs qui représentent des données vectorielles.	Non

azureSearchQueryType

Le type de requête de recherche Azure qui doit être exécutée lorsqu’on l’utilise comme extension de chat OpenAI Azure.

Description : Le type de requête de recherche Azure à effectuer lorsqu’il est utilisé comme extension de chat OpenAI Azure.

Type : chaîne

Valeur par défaut :

Enum Name : AzureSearchQueryType

Valeurs d’énumération :

Valeur	Description
simple	Représente le parseur de requête simple par défaut.
Sémantique	Représente l’analyseur sémantique de requêtes pour la modélisation sémantique avancée.
vector	Représente la recherche vectorielle sur des données calculées.
vector_simple_hybrid	Représente une combinaison de la stratégie de requête simple avec des données vectorielles.
vecteur_sémantique_hybride	Représente une combinaison de recherche sémantique et d’interrogation de données vectorielles.

azureCosmosDBChatExtensionConfiguration

Une représentation spécifique des options configurables pour Azure Cosmos DB lorsqu’il est utilisé comme extension de chat Azure OpenAI.

Nom	Catégorie	Description	Obligatoire	Par défaut
type	azureChatExtensionType	Une représentation des données de configuration pour une seule extension de chat OpenAI d’Azure. Cela sera utilisé par un chat des complétions qui devraient utiliser les extensions de chat OpenAI d’Azure pour compléter le comportement de réponse. L’utilisation de cette configuration est compatible uniquement avec Azure OpenAI.	Oui
parameters	azureCosmosDBChatExtensionParameters	Paramètres à utiliser lors de la configuration des extensions de chat Azure OpenAI On Your Data lors de l’utilisation d’Azure Cosmos DB pour MongoDB vCore.	Non

azureCosmosDBChatExtensionParameters

Paramètres à utiliser lors de la configuration des extensions de chat Azure OpenAI On Your Data lors de l’utilisation d’Azure Cosmos DB pour MongoDB vCore.

Nom	Catégorie	Description	Obligatoire
Authentification	onYourDataConnectionStringAuthenticationOptions	Les options d’authentification pour Azure OpenAI On Your Data lors de l’utilisation d’une chaîne de connexion.	Oui
top_n_documents	entier	Le nombre supérieur configuré de documents à présenter pour la requête configurée.	Non
in_scope	booléen	Est-ce que les requêtes doivent être restreintes à l’utilisation de données indexées.	Non
Rigueur	entier	La stricteur configurée du filtrage de pertinence de recherche. Plus la rigueur est élevée, plus la précision est élevée mais moins la mémoire de la réponse est élevée.	Non
informations_sur_le_rôle	string	Donnez au modèle des instructions sur son comportement et tout contexte auquel il doit se référer lors de la génération d’une réponse. Vous pouvez décrire la personnalité de l’assistant et lui expliquer comment formater les réponses. Il y a une limite de 100 jetons, et cela compte dans la limite globale de jetons.	Non
database_name	string	Le nom de base de données MongoDB vCore à utiliser avec Azure Cosmos DB.	Oui
nom_du_conteneur	string	Le nom du conteneur de ressources Azure Cosmos DB.	Oui
nom_de_l'index	string	Le nom d’index MongoDB vCore à utiliser avec Azure Cosmos DB.	Oui
cartographie des champs	azureCosmosDBFieldMappingOptions	Paramètres optionnels pour contrôler le traitement des champs lors de l’utilisation d’une ressource Azure Cosmos DB configurée.	Oui
embedding_dependency	onTonDataDataEndpointVectorisationSource ou surVotReDonnéesDéploiementNomVectorisationSource		Oui

azureCosmosDBFieldMappingOptions

Paramètres optionnels pour contrôler le traitement des champs lors de l’utilisation d’une ressource Azure Cosmos DB configurée.

Nom	Catégorie	Description	Obligatoire
champ_titre	string	Le nom du champ index à utiliser comme titre.	Non
url_field	string	Le nom du champ index à utiliser comme URL.	Non
filepath_field	string	Le nom du champ d’index à utiliser comme chemin de fichier.	Non
champs_de_contenu	tableau	Les noms des champs d’index qui doivent être considérés comme du contenu.	Oui
séparateur_de_champs_de_contenu	string	Le motif séparateur que les champs de contenu doivent utiliser.	Non
champs vectoriels	tableau	Les noms des champs qui représentent des données vectorielles.	Oui

surVosOptionsD'AuthentificationDesDonnées

Les options d’authentification pour Azure OpenAI sur vos données.

Nom	Catégorie	Description	Obligatoire	Par défaut
type	onYourDataAuthenticationType	Les types d’authentification pris en charge par Azure OpenAI On Your Data.	Oui

onYourDataAuthenticationType

Les types d’authentification pris en charge par Azure OpenAI On Your Data.

Description : Les types d’authentification pris en charge par Azure OpenAI On Your Data.

Type : chaîne

Valeur par défaut :

Nom d’enum : OnYourDataAuthenticationType

Valeurs d’énumération :

Valeur	Description
Clé API	Authentification via clé API.
connection_string	Authentification via chaîne de connexion.
identité gérée attribuée par le système	Authentification via une identité managée attribuée au système.
identité_gérée_assignée_par_l'utilisateur	Authentification via une identité managée attribuée par l’utilisateur.

onYourDataApiKeyAuthenticationOptions

Les options d’authentification pour Azure OpenAI On Your Data lors de l’utilisation d’une clé API.

Nom	Catégorie	Description	Obligatoire	Par défaut
type	onYourDataAuthenticationType	Les types d’authentification pris en charge par Azure OpenAI On Your Data.	Oui
clé	string	La clé API à utiliser pour l’authentification.	Non

onYourDataConnectionStringAuthenticationOptions

Les options d’authentification pour Azure OpenAI On Your Data lors de l’utilisation d’une chaîne de connexion.

Nom	Catégorie	Description	Obligatoire	Par défaut
type	onYourDataAuthenticationType	Les types d’authentification pris en charge par Azure OpenAI On Your Data.	Oui
connection_string	string	La chaîne de connexion à utiliser pour l’authentification.	Non

onYourDataSystemAssignedManagedIdentityAuthenticationOptions

Les options d’authentification pour Azure OpenAI On Your Data lors de l’utilisation d’une identité managée attribuée au système.

Nom	Catégorie	Description	Obligatoire	Par défaut
type	onYourDataAuthenticationType	Les types d’authentification pris en charge par Azure OpenAI On Your Data.	Oui

onYourDataUserAssignedManagedIdentityAuthenticationOptions

Les options d’authentification pour Azure OpenAI On Your Data lors de l’utilisation d’une identité managée attribuée par l’utilisateur.

Nom	Catégorie	Description	Obligatoire	Par défaut
type	onYourDataAuthenticationType	Les types d’authentification pris en charge par Azure OpenAI On Your Data.	Oui
managed_identity_resource_id	string	L’identifiant de ressource de l’identité managée attribuée par l’utilisateur à utiliser pour l’authentification.	Non

onYourDataVectorizationSource

Une représentation abstraite d’une source de vectorisation pour Azure OpenAI On Your Data avec recherche vectorielle.

Nom	Catégorie	Description	Obligatoire	Par défaut
type	onYourDataVectorizationSourceType	Représente les sources disponibles qu’Azure OpenAI On Your Data peut utiliser pour configurer la vectorisation des données à utiliser avec recherche vectorielle.	Oui

onYourDataVectorizationSourceType

Représente les sources disponibles qu’Azure OpenAI On Your Data peut utiliser pour configurer la vectorisation des données à utiliser avec la recherche vectorielle.

Description : Représente les sources disponibles Azure OpenAI On Your Data peut utiliser pour configurer la vectorisation des données à utiliser avec
recherche vectorielle.

Type : chaîne

Valeur par défaut :

Nom d’enum : OnYourDataVectorizationSourceType

Valeurs d’énumération :

Valeur	Description
endpoint	Représente la vectorisation effectuée par des appels de service public vers un modèle d’embedding Azure OpenAI.
nom_de_déploiement	Représente un nom de déploiement de modèle Ada à utiliser. Ce déploiement de modèle doit être dans la même ressource Azure OpenAI, mais On Your Data utilisera ce modèle pour le déploiement via un appel interne plutôt qu’un appel public, ce qui permet le vector Cherche même dans des réseaux privés.

onYourDataDeploymentNameVectorizationSource

Les détails d’une source de vectorisation, utilisée par Azure OpenAI On Your Data lors de l’application de la recherche vectorielle, basée sur un nom de déploiement interne de modèle d’embeddings dans la même ressource Azure OpenAI.

Nom	Catégorie	Description	Obligatoire	Par défaut
type	onYourDataVectorizationSourceType	Représente les sources disponibles qu’Azure OpenAI On Your Data peut utiliser pour configurer la vectorisation des données à utiliser avec recherche vectorielle.	Oui
nom_de_déploiement	string	Spécifie le nom du déploiement du modèle à utiliser pour la vectorisation. Ce déploiement du modèle doit se faire dans la même ressource Azure OpenAI, mais On Your Data utilisera ce déploiement via un appel interne plutôt que public, ce qui permet la recherche vectorielle même dans les réseaux privés.	Non

onYourDataEndpointVectorizationSource

Les détails d’une source de vectorisation, utilisée par Azure OpenAI On Your Data lors de l’application de la recherche vectorielle, basée sur un appel public d’intégration Azure OpenAI.

Nom	Catégorie	Description	Obligatoire
type	onYourDataVectorizationSourceType	Représente les sources disponibles qu’Azure OpenAI On Your Data peut utiliser pour configurer la vectorisation des données à utiliser avec recherche vectorielle.	Oui
Authentification	onYourDataApiKeyAuthenticationOptions	Les options d’authentification pour Azure OpenAI On Your Data lors de l’utilisation d’une clé API.	Non
endpoint	string	Spécifie le point de terminaison à utiliser pour la vectorisation. Ce point de terminaison doit être dans la même ressource Azure OpenAI, mais On Your Data utilisera ce point via un appel interne plutôt qu’un appel public, ce qui permet la recherche vectorielle même dans les réseaux privés.	Non

azureChatExtensionsMessageContext

Une représentation des informations contextuelles supplémentaires disponibles lorsque des extensions de chat OpenAI d’Azure sont impliquées dans la génération d’une réponse de complétion de chat correspondante. Ces informations contextuelles ne sont remplies que lorsqu’on utilise une requête OpenAI Azure configurée pour utiliser une extension correspondante.

Nom	Catégorie	Description	Obligatoire	Par défaut
citations	tableau	Le résultat de la récupération de la source de données, utilisé pour générer le message de l’assistant dans la réponse.	Non
objectif	string	L’intention détectée dans l’historique du chat, utilisée pour passer au tour suivant afin de transmettre le contexte.	Non

citation

Informations de citation pour un message de réponse à la fin d’un chat.

Nom	Catégorie	Description	Obligatoire
contenu	string	Le contenu de la citation.	Oui
title	string	Le titre de la citation.	Non
url	string	L’URL de la source.	Non
chemin d’accès	string	Le chemin du fichier de la citation.	Non
identifiant_du_segment	string	L’identifiant du bloc de la contravention.	Non

chatCompletionMessageToolCall

Nom	Catégorie	Description	Obligatoire
ID	string	L’identifiant de l’appel à outils.	Oui
type	toolCallType	Le type d’appel de l’outil, dans ce cas `function`.	Oui
function	Objet	La fonction que le modèle a appelée.	Oui

Propriétés de la fonction

name

Nom	Catégorie	Description	Par défaut
name	string	Le nom de la fonction à appeler.

Arguments

Nom	Catégorie	Description	Par défaut
Arguments	string	Les arguments pour appeler la fonction avec, telle que générée par le modèle au format JSON. Notez que le modèle ne génère pas toujours un JSON valide, et peut générer des paramètres non définis par votre schéma de fonction. Validez les arguments de votre code avant d’appeler votre fonction.

toolCallType

Le type d’appel de l’outil, dans ce cas function.

Description : Le type d’appel à l’outil, dans ce cas function.

Type : chaîne

Valeur par défaut :

Nom d’enum : ToolCallType

Valeurs d’énumération :

Valeur	Description
function	Le type d’appel d’outil est fonction.

chatCompletionRequestMessageTool

Nom	Catégorie	Description	Obligatoire	Par défaut
tool_call_id	string	Appel d’outil auquel ce message répond.	Non
contenu	string	Le contenu du message.	Non

chatCompletionRequestMessageFunction

Nom	Catégorie	Description	Obligatoire
role	enum	Le rôle de l’auteur des messages, dans ce cas `function`. Valeurs possibles : fonction	Non
name	string	Le contenu du message.	Non
contenu	string	Le contenu du message.	Non

createChatCompletionResponse

Représente une réponse de fin de discussion retournée par le modèle, basée sur l’entrée fournie.

Nom	Catégorie	Description	Obligatoire
ID	string	Un identifiant unique pour la fin du chat.	Oui
prompt_filter_results	promptFilterResults	Filtrage de contenu pour zéro ou plus d’invites dans la requête. Dans une requête en streaming, les résultats pour différentes invitations peuvent arriver à des moments ou dans des ordres différents.	Non
choix	tableau	Une liste des options pour compléter le chat. Peut être plus d’un si `n` c’est supérieur à 1.	Oui
créé	entier	L’horodatage Unix (en quelques secondes) de la création de la fin du chat.	Oui
model	string	Le modèle utilisé pour compléter le chat.	Oui
system_fingerprint	string	Cette empreinte digitale représente la configuration backend avec laquelle le modèle fonctionne. Peut être utilisé conjointement avec le `seed` paramètre de requête pour comprendre quand des modifications en backend ont été effectuées pouvant impacter le déterminisme.	Non
Objet	enum	Le type d’objet, qui est toujours `chat.completion`. Valeurs possibles : chat.completion	Oui
utilisation	completionUsage	Statistiques d’utilisation pour la demande de complétion.	Non

createChatCompletionStreamResponse

Représente un segment diffusé d’une réponse de fin de chat retournée par le modèle, basé sur l’entrée fournie.

Nom	Catégorie	Description	Obligatoire
ID	string	Un identifiant unique pour la fin du chat. Chaque morceau a le même ID.	Oui
choix	tableau	Une liste des options pour compléter le chat. Peut contenir plus d’un élément si `n` est supérieur à 1.	Oui
créé	entier	L’horodatage Unix (en quelques secondes) de la création de la fin du chat. Chaque morceau a le même horodatage.	Oui
model	string	Le modèle pour générer la complétion.	Oui
system_fingerprint	string	Cette empreinte digitale représente la configuration backend avec laquelle le modèle fonctionne. Peut être utilisé conjointement avec le `seed` paramètre de requête pour comprendre quand des modifications en backend ont été effectuées pouvant impacter le déterminisme.	Non
Objet	enum	Le type d’objet, qui est toujours `chat.completion.chunk`. Valeurs possibles : chat.completion.chunk	Oui

chatCompletionStreamResponseDelta

Un delta de complétion du chat généré par les réponses du modèle en streaming.

Nom	Catégorie	Description	Obligatoire
contenu	string	Le contenu du message du bloc.	Non
function_call	Objet	Déprécié et remplacé par `tool_calls`. Le nom et les arguments d’une fonction à appeler, tels que générés par le modèle.	Non
tool_calls	tableau		Non
role	enum	Le rôle de l’auteur de ce message. Valeurs possibles : système, utilisateur, assistant, outil	Non
refusal	string	Le message de refus généré par le modèle.	Non

Propriétés pour function_call

Arguments

Nom	Catégorie	Description	Par défaut
Arguments	string	Les arguments pour appeler la fonction avec, telle que générée par le modèle au format JSON. Notez que le modèle ne génère pas toujours un JSON valide, et peut générer des paramètres non définis par votre schéma de fonction. Validez les arguments de votre code avant d’appeler votre fonction.

name

Nom	Catégorie	Description	Par défaut
name	string	Le nom de la fonction à appeler.

chatCompletionMessageToolCallChunk

Nom	Catégorie	Description	Obligatoire
index	entier		Oui
ID	string	L’identifiant de l’appel à outils.	Non
type	enum	Le type d’outil. Actuellement, seul `function` est pris en charge. Valeurs possibles : fonction	Non
function	Objet		Non

Propriétés de la fonction

name

Nom	Catégorie	Description	Par défaut
name	string	Le nom de la fonction à appeler.

Arguments

Nom	Catégorie	Description	Par défaut
Arguments	string	Les arguments pour appeler la fonction avec, telle que générée par le modèle au format JSON. Notez que le modèle ne génère pas toujours un JSON valide, et peut générer des paramètres non définis par votre schéma de fonction. Validez les arguments de votre code avant d’appeler votre fonction.

chatCompletionStreamOptions

Options pour la réponse en streaming. Ne réglez cela que lorsque vous activez stream: true.

Nom	Catégorie	Description	Obligatoire	Par défaut
include_usage	booléen	Si elle est définie, un segment supplémentaire sera diffusé avant le `data: [DONE]` message. Le `usage` champ sur ce chunk affiche les statistiques d’utilisation du token pour l’ensemble de la requête, et le `choices` champ restera toujours un tableau vide. Tous les autres chunks incluront également un `usage` champ, mais avec une valeur nulle.	Non

chatCompletionChoiceLogProbs

Enregistrez les informations de probabilité pour le choix.

Nom	Catégorie	Description	Obligatoire	Par défaut
contenu	tableau	Une liste des jetons de contenu des messages avec les informations de probabilité logarithmique.	Oui
refusal	tableau	Une liste de jetons de refus de message avec des informations de probabilité logarithmique.	Non

chatCompletionTokenLogprob

Nom	Catégorie	Description	Obligatoire
Jeton	string	Jeton.	Oui
logprob	number	La probabilité logarithmique de ce jeton.	Oui
Octets	tableau	Une liste d’entiers représentant la représentation UTF-8 octets du jeton. Utile dans les cas où les caractères sont représentés par plusieurs jetons et où leurs représentations en octets doivent être combinées pour générer la représentation du texte correcte. Cela peut l’être `null` s’il n’y a pas de représentation en octets pour le jeton.	Oui
top_logprobs	tableau	Liste des jetons les plus probables et de leur probabilité logarithmique, à cette position de jeton. Dans de rares cas, il peut y avoir moins de `top_logprobs` demandes retournées.	Oui

Message de réponse de complétion de chat

Un message de complétion de chat généré par le modèle.

Nom	Catégorie	Description	Obligatoire
role	chatCompletionResponseMessageRole	Le rôle de l’auteur du message de réponse.	Oui
refusal	string	Le message de refus généré par le modèle.	Oui
contenu	string	Le contenu du message.	Oui
tool_calls	tableau	Les appels d’outils générés par le modèle, tels que les appels de fonction.	Non
function_call	chatCompletionFunctionCall	Déprécié et remplacé par `tool_calls`. Le nom et les arguments d’une fonction à appeler, tels que générés par le modèle.	Non
context	azureChatExtensionsMessageContext	Une représentation des informations contextuelles supplémentaires disponibles lorsque des extensions de chat OpenAI d’Azure sont impliquées dans la génération d’une réponse correspondante aux complétions de conversation. Cette information de contexte n’est remplie que lorsque en utilisant une requête OpenAI Azure configurée pour utiliser une extension correspondante.	Non

chatCompletionResponseMessageRole

Le rôle de l’auteur du message de réponse.

Description : Le rôle de l’auteur du message de réponse.

Type : chaîne

Valeur par défaut :

Valeurs d’énumération :

assistant

chatCompletionToolChoiceOption

Contrôle quel outil (le cas échéant) est appelé par le modèle. none cela signifie que le modèle n’appellera aucun outil et générera un message à la place. auto signifie que le modèle peut choisir entre générer un message ou appeler un ou plusieurs outils. required signifie que le modèle doit appeler un ou plusieurs outils. Spécifier un outil particulier force {"type": "function", "function": {"name": "my_function"}} le modèle à appeler cet outil. none est la norme par défaut lorsqu’aucun outil n’est présent. auto est la norme par défaut si des outils sont présents.

Ce composant peut être l’un des suivants :

chatCompletionNamedToolChoice

Spécifie un outil que le modèle doit utiliser. À utiliser pour forcer le modèle à appeler une fonction spécifique.

Nom	Catégorie	Description	Obligatoire	Par défaut
type	enum	Le type d’outil. Actuellement, seul `function` est pris en charge. Valeurs possibles : fonction	Oui
function	Objet		Oui

Propriétés de la fonction

name

Nom	Catégorie	Description	Par défaut
name	string	Le nom de la fonction à appeler.

ParallelToolCalls

S’il faut activer l’appel de fonctions parallèles lors de l’utilisation de l’outil.

Aucune propriété définie pour ce composant.

chatCompletionMessageToolCalls

Les appels d’outils générés par le modèle, tels que les appels de fonction.

Aucune propriété définie pour ce composant.

chatCompletionFunctionCall

Déprécié et remplacé par tool_calls. Le nom et les arguments d’une fonction à appeler, tels que générés par le modèle.

Nom	Catégorie	Description	Obligatoire	Par défaut
name	string	Le nom de la fonction à appeler.	Oui
Arguments	string	Les arguments pour appeler la fonction avec, telle que générée par le modèle au format JSON. Notez que le modèle ne génère pas toujours un JSON valide, et peut générer des paramètres non définis par votre schéma de fonction. Validez les arguments de votre code avant d’appeler votre fonction.	Oui

completionUsage

Statistiques d’utilisation pour la demande de complétion.

Nom	Catégorie	Description	Obligatoire
prompt_tokens	entier	Nombre de jetons dans la consigne.	Oui
completion_tokens	entier	Nombre de jetons dans la complétion générée.	Oui
total_tokens	entier	Nombre total de jetons utilisés dans la requête (prompt + complétion).	Oui
completion_tokens_details	Objet	Répartition des jetons utilisés dans une complétion.	Non

Propriétés pour completion_tokens_details

jetons_de_raisonnement

Nom	Catégorie	Description	Par défaut
jetons_de_raisonnement	entier	Des jetons générés par le modèle pour raisonner.

chatCompletionTool

Nom	Catégorie	Description	Obligatoire	Par défaut
type	enum	Le type d’outil. Actuellement, seul `function` est pris en charge. Valeurs possibles : fonction	Oui
function	FunctionObject		Oui

FunctionParameters

Les paramètres acceptés par les fonctions sont décrits comme un objet schéma JSON. Voir le guide pour des exemples, ainsi que la référence du schéma JSON pour la documentation sur le format.

Omettre parameters définit une fonction avec une liste de paramètres vide.

Aucune propriété définie pour ce composant.

FunctionObject

Nom	Catégorie	Description	Obligatoire	Par défaut
description	string	Une description de ce que fait la fonction, utilisée par le modèle pour choisir quand et comment appeler la fonction.	Non
name	string	Le nom de la fonction à appeler. Doit être de A à Z, de A à Z, de 0 à 9, ou contenir des sous-traits et des titres, avec une longueur maximale de 64.	Oui
parameters	FunctionParameters	Les paramètres acceptés par les fonctions sont décrits comme un objet schéma JSON. Voir le guide pour des exemples, ainsi que la référence du schéma JSON pour la documentation sur le format. Omettre `parameters` définit une fonction avec une liste de paramètres vide.	Non
strict	booléen	S’il faut activer une stricte adhésion au schéma lors de la génération de l’appel de fonction. Si le modèle est réglé sur true, le modèle suivra exactement le schéma défini dans le `parameters` champ. Seul un sous-ensemble de JSON Schema est pris en charge lorsque `strict` est `true`.	Non	Faux

ResponseFormatText

Nom	Catégorie	Description	Obligatoire	Par défaut
type	enum	Le type de format de réponse défini : `text` Valeurs possibles : texte	Oui

ResponseFormatJsonObject

Nom	Catégorie	Description	Obligatoire	Par défaut
type	enum	Le type de format de réponse défini : `json_object` Valeurs possibles : json_object	Oui

ResponseFormatJsonSchemaSchema

Le schéma pour le format de réponse est décrit comme un objet de schéma JSON.

Aucune propriété définie pour ce composant.

ResponseFormatJsonSchema

Nom	Catégorie	Description	Obligatoire	Par défaut
type	enum	Le type de format de réponse défini : `json_schema` Valeurs possibles : json_schema	Oui
json_schema	Objet		Oui

Propriétés pour json_schema

description

Nom	Catégorie	Description	Par défaut
description	string	Une description du format de réponse, utilisée par le modèle pour déterminer comment répondre dans ce format.

name

Nom	Catégorie	Description	Par défaut
name	string	Le nom du format de la réponse. Doit être de A à Z, de A à Z, de 0 à 9, ou contenir des sous-traits et des titres, avec une longueur maximale de 64.

schema

Nom	Catégorie	Description	Par défaut
schema	ResponseFormatJsonSchemaSchema	Le schéma pour le format de réponse est décrit comme un objet de schéma JSON.

strict

Nom	Catégorie	Description	Par défaut
strict	booléen	S’il faut activer une stricte adhésion au schéma lors de la génération de la sortie. Si le modèle est réglé sur vrai, le modèle suivra toujours exactement le schéma défini sur le `schema` terrain. Seul un sous-ensemble de JSON Schema est pris en charge lorsque `strict` est `true`.	Faux

chatCompletionChoiceCommon

Nom	Catégorie	Description	Obligatoire	Par défaut
index	entier		Non
finish_reason	string		Non

créerDemandeDeTraduction

Demande de traduction.

Nom	Catégorie	Description	Obligatoire	Par défaut
fichier	string	Le fichier audio à traduire.	Oui
prompt	string	Un texte optionnel pour guider le style du modèle ou poursuivre un segment audio précédent. Le prompt doit être en anglais.	Non
format_de_réponse	audioResponseFormat	Définit le format de la sortie.	Non
Température	number	La température d’échantillonnage, comprise entre 0 et 1. Des valeurs plus élevées comme 0,8 rendent la sortie plus aléatoire, tandis que des valeurs plus basses comme 0,2 la rendent plus ciblée et déterministe. Si elle est réglée à 0, le modèle utilisera la probabilité logarithmique pour augmenter automatiquement la température jusqu’à atteindre certains seuils.	Non	0

réponse audio

Réponse à la traduction ou à la transcription lorsque response_format était json

Nom	Catégorie	Description	Obligatoire	Par défaut
texte	string	Texte traduit ou transcrit.	Oui

audioVerboseResponse

Réponse à la traduction ou à la transcription lorsque response_format était verbose_json

Nom	Catégorie	Description	Obligatoire
texte	string	Texte traduit ou transcrit.	Oui
tâche	string	Type de tâche audio.	Non
language	string	Language.	Non
durée	number	Durée.	Non
segments	tableau		Non

audioResponseFormat

Définit le format de la sortie.

Description : Définit le format de la sortie.

Type : chaîne

Valeur par défaut :

Valeurs d’énumération :

Json
texte
SRT
verbose_json
vtt

créerDemandeDeTranscription

Demande de transcription.

Nom	Catégorie	Description	Obligatoire	Par défaut
fichier	string	L’objet du fichier audio à transcrire.	Oui
prompt	string	Un texte optionnel pour guider le style du modèle ou poursuivre un segment audio précédent. La consigne doit correspondre au langage audio.	Non
format_de_réponse	audioResponseFormat	Définit le format de la sortie.	Non
Température	number	La température d’échantillonnage, comprise entre 0 et 1. Des valeurs plus élevées comme 0,8 rendent la sortie plus aléatoire, tandis que des valeurs plus basses comme 0,2 la rendent plus ciblée et déterministe. Si elle est réglée à 0, le modèle utilisera la probabilité logarithmique pour augmenter automatiquement la température jusqu’à atteindre certains seuils.	Non	0
language	string	La langue de l’audio d’entrée. Fournir le langage d’entrée au format ISO-639-1 améliorera la précision et la latence.	Non

audioSegment

Segment de transcription ou de traduction.

Nom	Catégorie	Description	Obligatoire
ID	entier	Identificateur de segment.	Non
Chercher	number	Décalage du segment.	Non
start	number	Décalage de début de segment.	Non
fin	number	Décalage de fin de segment.	Non
texte	string	Texte segmenté.	Non
tokens	tableau	Des symboles du texte.	Non
Température	number	Température.	Non
avg_logprob	number	Probabilité logarithmique moyenne.	Non
compression_ratio	number	Taux de compression.	Non
no_speech_prob	number	Probabilité de `no speech`.	Non

imageQuality

La qualité de l’image qui sera générée.

Description : La qualité de l’image qui sera générée.

Type : chaîne

Valeur par défaut : standard

Nom Enum : Qualité

Valeurs d’énumération :

Valeur	Description
Norme	La qualité standard crée des images avec une qualité standard.
hd	La qualité HD crée des images avec des détails plus fins et une plus grande cohérence à travers l’image.

imagesResponseFormat

Le format dans lequel les images générées sont renvoyées.

Description : Le format dans lequel les images générées sont renvoyées.

Type : chaîne

Valeur par défaut : URL

Nom d’enum : ImagesResponseFormat

Valeurs d’énumération :

Valeur	Description
url	L’URL qui permet un accès temporaire au téléchargement des images générées.
b64_json	Les images générées sont retournées sous forme de chaînes encodées en base64.

taille de l’image

La taille des images générées.

Description : La taille des images générées.

Type : chaîne

Valeur par défaut : 1024x1024

Nom Enum : Taille

Valeurs d’énumération :

Valeur	Description
1792x1024	La taille souhaitée de l’image générée est de 1792x1024 pixels.
1024x1792	La taille souhaitée de l’image générée est de 1024x1792 pixels.
1024x1024	La taille souhaitée de l’image générée est de 1024x1024 pixels.

imageStyle

Le style des images générées.

Description : Le style des images générées.

Type : chaîne

Valeur par défaut : vif

Nom Enum : Style

Valeurs d’énumération :

Valeur	Description
vivid	Vivid crée des images hyperréalistes et dramatiques.
Naturel	Le naturel crée des images plus naturales et moins hyperréalistes.

demandeDeGénérationD'Images

Nom	Catégorie	Description	Obligatoire	Par défaut
prompt	string	Une description textuelle de l’image ou des images souhaitées. La longueur maximale est de 4 000 caractères.	Oui
n	entier	Le nombre d’images à générer.	Non	1
size	imageSize	La taille des images générées.	Non	1024x1024
format_de_réponse	imagesResponseFormat	Le format dans lequel les images générées sont renvoyées.	Non	url
utilisateur	string	Un identifiant unique représentant votre utilisateur final, qui peut aider à surveiller et détecter les abus.	Non
Qualité	imageQuality	La qualité de l’image qui sera générée.	Non	Norme
style	imageStyle	Le style des images générées.	Non	vivid

generateImagesResponse

Nom	Catégorie	Description	Obligatoire	Par défaut
créé	entier	L’horodatage Unix lors de la création de l’opération.	Oui
Données	tableau	Les données de résultat de l’opération, si elles ont réussi	Oui

résultat d'image

L’URL de l’image ou l’image encodée si elle réussit, et une erreur sinon.

Nom	Catégorie	Description	Obligatoire
url	string	L’URL de l’image.	Non
b64_json	string	L’image codée en base64	Non
content_filter_results	dalleContentFilterResults	Informations sur les résultats du filtrage de contenu.	Non
revised_prompt	string	La demande utilisée pour générer l’image, s’il y avait une révision de la requête.	Non
prompt_filter_results	dalleFilterResults	Informations sur la catégorie de filtrage de contenu (haine, sexuel, violence, self_harm), si elle a été détectée, ainsi que sur le niveau de gravité (very_low, faible, moyen, élevé qui détermine l’intensité et le niveau de risque du contenu nuisible) et si elle a été filtrée ou non. Informations sur le contenu jailbreak et les jurons, s’ils ont été détectés, et si ils ont été filtrés ou non. Et des informations sur la liste de blocage des clients, si elle a été filtrée et son identifiant.	Non

Extensions de saisie semi-automatique

Les extensions de complétion ne font pas partie de la dernière version GA de la spécification d'inférence du plan de données OpenAI d'Azure.

Chatmessage

L'objet message Chat ne fait pas partie de la dernière version GA de la spécification d'inférence du plan de données OpenAI d'Azure.

Synthèse vocale (Aperçu)

Ne fait actuellement pas partie de la dernière version Azure OpenAI GA de la spécification d’inférence du plan de données OpenAI Azure. Consultez la dernière version aperçu pour cette fonctionnalité.

Étapes suivantes

Apprenez-en plus sur les modèles et l’ajustement fin avec l’API REST. En savoir plus sur les modèles sous-jacents qui alimentent Azure OpenAI.

Commentaires

Cette page a-t-elle été utile ?

Last updated on 2026-05-20