Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Cet article fournit des détails sur les terminaux d’inférence de l’API REST pour Azure OpenAI.
Spécifications de l’API
La gestion et l’interaction avec les modèles et ressources OpenAI Azure sont réparties sur trois surfaces principales d’API :
- Plan de contrôle
- Plan de données - création
- Plan de données - inférence
Chaque surface/spécification API englobe un ensemble différent de capacités Azure OpenAI. Chaque API possède son propre ensemble unique de versions d’aperçu et d’API stable/généralement disponibles (GA). Les sorties de prévisualisation suivent actuellement un rythme mensuel.
Important
Il existe désormais une nouvelle API d’inférence d’aperçu. Découvrez-en plus dans notre guide du cycle de vie de l’API.
| API | Dernière version d’aperçu | Dernière sortie de GA | Spécifications | Description |
|---|---|---|---|---|
| Plan de contrôle | 2025-07-01-preview |
2025-06-01 |
Fichiers de spécifications | L’API du plan de contrôle est utilisée pour des opérations telles que la création de ressources, le déploiement de modèles et d’autres tâches de gestion des ressources de haut niveau. Le plan de contrôle régit également ce qui est possible à faire avec des fonctionnalités telles que Azure Resource Manager, Bicep, Terraform et Azure CLI. |
| Plan de données | v1 preview |
v1 |
Fichiers de spécifications | L’API du plan de données contrôle les opérations d’inférence et d’authoring. |
Authentication
Azure OpenAI propose deux méthodes d’authentification. Vous pouvez utiliser soit API Keys, soit Microsoft Entra ID.
Authentification par clé API : Pour ce type d’authentification, toutes les requêtes API doivent inclure la clé API dans l’en-tête
api-keyHTTP. Le Quickstart fournit des conseils pour passer des appels avec ce type d’authentification.Microsoft Entra ID : Vous pouvez authentifier un appel API à l’aide d’un jeton Microsoft Entra. Les jetons d’authentification sont inclus dans une requête en tant qu’en-tête Authorization. Le jeton fourni doit être précédé deBearer, par exempleBearer YOUR_AUTH_TOKEN. Vous pouvez lire notre guide pratique sur authentifier avec Microsoft Entra ID.
Versionnement de l’API REST
Les API de service sont versionnées à l’aide du api-version paramètre de requête. Toutes les versions suivent la structure de dates YYYY-MM-DD. Par exemple:
POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/chat/completions?api-version=2024-06-01
Inférence dans les plans de données
Le reste de l’article traite de la version GA de la spécification d’inférence du plan de données OpenAI
Si vous recherchez de la documentation sur la dernière version de l’API en préversion, reportez-vous à la dernière API d’inférence du plan de données en préversion.
Achèvements
POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2024-10-21
Crée une complétion pour l’invite fournie, les paramètres et le modèle choisi.
Paramètres d’URI
| Nom | Dans | Obligatoire | Catégorie | Description |
|---|---|---|---|---|
| endpoint | path | Oui | string url |
Pris en charge Azure terminaux OpenAI (protocole et nom d’hôte, par exemple : https://aoairesource.openai.azure.com. Remplacez « aoairesource » par le nom de votre ressource Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| id-de-déploiement | path | Oui | string | ID de déploiement du modèle qui a été déployé. |
| version de l'API | Requête | Oui | string | Version de l’API |
En-tête de requête
| Nom | Obligatoire | Catégorie | Description |
|---|---|---|---|
| clé API | True | string | Fournissez ici la clé API Azure OpenAI |
Corps de la requête
Content-Type : application/json
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| prompt | chaîne ou tableau | Le(s) prompt(s) pour générer des complétions pour , encodé sous forme de chaîne, tableau de chaînes, tableau de jetons ou tableau de tableaux de jetons. Notez que <|endoftext|> est le séparateur de document que le modèle voit lors de l’entraînement, donc si une invite n’est pas spécifiée, le modèle sera généré comme si c’était le début d’un nouveau document. |
Oui | |
| meilleures sélections | entier | Génère best_of des complétions côté serveur et retourne le « meilleur » (celui avec la plus grande probabilité logarithmique par jeton). Les résultats ne peuvent pas être diffusés en streaming.Lorsqu’elle est utilisée avec n, best_of contrôle le nombre de complétions candidates et n spécifie combien retourner †» best_of doit être supérieur à n.Note : Parce que ce paramètre génère de nombreuses complétions, il peut rapidement consommer votre quota de jetons. Utilisez avec soin et assurez-vous d’avoir des réglages raisonnables pour max_tokens et stop. |
Non | 1 |
| echo | booléen | Faites écho à la consigne en plus de la complétion |
Non | Faux |
| pénalité de fréquence | number | Nombre compris entre -2,0 et 2,0. Les valeurs positives pénalisent les nouveaux jetons en fonction de leur fréquence existante dans le texte jusqu’à présent, diminuant la probabilité que le modèle répète la même phrase mot pour mot. |
Non | 0 |
| logit_bias | Objet | Modifier la probabilité que des jetons spécifiés apparaissent dans la complétion. Accepte un objet JSON qui associe les jetons (spécifiés par leur identifiant de jeton dans le tokeniseur GPT) à une valeur de biais associée de -100 à 100. Mathématiquement, le biais est ajouté aux logits générés par le modèle avant l’échantillonnage. L’effet exact variera selon le modèle, mais les valeurs comprises entre -1 et 1 devraient diminuer ou augmenter la probabilité de sélection ; des valeurs comme -100 ou 100 devraient entraîner un bannissement ou une sélection exclusive du jeton concerné. Par exemple, vous pouvez passer {"50256": -100} pour empêcher la génération du <token |endoftext> . |
Non | None |
| logprobs | entier | Incluez les probabilités logarithiques sur les logprobs jetons de sortie les plus probables, ainsi que les jetons choisis. Par exemple, si logprobs est 5, l’API renverra une liste des cinq jetons les plus probables. L’API retournera toujours le logprob du jeton échantillonné, donc il peut y avoir jusqu’à jusqu’à logprobs+1 des éléments dans la réponse.La valeur maximale pour logprobs est 5. |
Non | None |
| nombre_maximal_de_tokens | entier | Le nombre maximal de jetons pouvant être générés dans la complétion. Le nombre de jetons de votre invite plus max_tokens ne peut pas dépasser la longueur contextuelle du modèle. |
Non | 16 |
| n | entier | Combien de complétions générer pour chaque invite. Note : Parce que ce paramètre génère de nombreuses complétions, il peut rapidement consommer votre quota de jetons. Utilisez avec soin et assurez-vous d’avoir des réglages raisonnables pour max_tokens et stop. |
Non | 1 |
| pénalité de présence | number | Nombre compris entre -2,0 et 2,0. Les valeurs positives pénalisent les nouveaux jetons en fonction de leur apparence dans le texte jusqu’à présent, augmentant ainsi la probabilité du modèle d’aborder de nouveaux sujets. |
Non | 0 |
| seed | entier | Si spécifié, notre système fera un meilleur effort pour échantillonner de manière déterministe, de sorte que les requêtes répétées avec les mêmes seed paramètres et reproduisent le même résultat.Le déterminisme n’est pas garanti, et vous devriez vous référer au system_fingerprint paramètre de réponse pour surveiller les changements dans le backend. |
Non | |
| Arrêter | chaîne ou tableau | Jusqu’à quatre séquences où l’API cessera de générer d’autres jetons. Le texte retourné ne contiendra pas la séquence d’arrêt. |
Non | |
| stream | booléen | Est-ce qu’il faut réintégrer un progrès partiel en détail. S’ils sont activés, les jetons seront envoyés comme des événements uniquement données envoyés par le serveur dès qu’ils deviennent disponibles, le flux étant interrompu par un data: [DONE] message. |
Non | Faux |
| Suffixe | string | Le suffixe qui vient après la fin du texte inséré. Ce paramètre n’est pris en charge que pour gpt-3.5-turbo-instruct. |
Non | None |
| Température | number | Quelle température d’échantillonnage utiliser, entre 0 et 2. Des valeurs plus élevées comme 0,8 rendent la sortie plus aléatoire, tandis que des valeurs plus basses comme 0,2 la rendent plus ciblée et déterministe. Nous recommandons généralement de modifier cela, ou top_p pas les deux. |
Non | 1 |
| top_p | number | Une alternative à l’échantillonnage par température, appelée échantillonnage de noyau, où le modèle considère les résultats des jetons avec top_p masse de probabilité. Ainsi, 0,1 signifie que seuls les jetons composant la 10e première masse de probabilité% sont pris en compte. Nous recommandons généralement de modifier cela, ou temperature pas les deux. |
Non | 1 |
| utilisateur | string | Un identifiant unique représentant votre utilisateur final, qui peut aider à surveiller et détecter les abus. |
Non |
Responses
Code de statut : 200
Description : OK
| Type de contenu | Type | Description |
|---|---|---|
| application/json | createCompletionResponse | Représente une réponse de complétion de l’API. Note : les objets de réponse en streaming et non diffusés partagent la même forme (contrairement au point d’extrémité du chat). |
Code de statut : par défaut
Description : Service indisponible
| Type de contenu | Type | Description |
|---|---|---|
| application/json | errorResponse |
Exemples
Example
Crée une complétion pour l’invite fournie, les paramètres et le modèle choisi.
POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2024-10-21
{
"prompt": [
"tell me a joke about mango"
],
"max_tokens": 32,
"temperature": 1.0,
"n": 1
}
Réponses : Code de statut : 200
{
"body": {
"id": "cmpl-7QmVI15qgYVllxK0FtxVGG6ywfzaq",
"created": 1686617332,
"choices": [
{
"text": "es\n\nWhat do you call a mango who's in charge?\n\nThe head mango.",
"index": 0,
"finish_reason": "stop",
"logprobs": null
}
],
"usage": {
"completion_tokens": 20,
"prompt_tokens": 6,
"total_tokens": 26
}
}
}
Embeddings
POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2024-10-21
Obtenez une représentation vectorielle d’une entrée donnée qui peut être facilement consommée par des modèles et algorithmes d’apprentissage automatique.
Paramètres d’URI
| Nom | Dans | Obligatoire | Catégorie | Description |
|---|---|---|---|---|
| endpoint | path | Oui | string url |
Pris en charge Azure terminaux OpenAI (protocole et nom d’hôte, par exemple : https://aoairesource.openai.azure.com. Remplacez « aoairesource » par le nom de votre ressource Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| id-de-déploiement | path | Oui | string | |
| version de l'API | Requête | Oui | string | Version de l’API |
En-tête de requête
| Nom | Obligatoire | Catégorie | Description |
|---|---|---|---|
| clé API | True | string | Fournissez ici la clé API Azure OpenAI |
Corps de la requête
Content-Type : application/json
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| entrée | chaîne ou tableau | Texte d’entrée pour l’intégrer, encodé sous forme de chaîne ou de tableau de jetons. Pour intégrer plusieurs entrées dans une seule requête, passez un tableau de chaînes ou un tableau de tableaux de jetons. L’entrée ne doit pas dépasser le maximum de jetons d’entrée pour le modèle (8 192 jetons pour text-embedding-ada-002), ne peut pas être une chaîne vide, et tout tableau doit avoir 2 048 dimensions ou moins. Outre la limite de jetons par entrée, tous les modèles d’incorporation appliquent un maximum de 300 000 jetons additionnés sur toutes les entrées dans une seule requête. |
Oui | |
| utilisateur | string | Un identifiant unique représentant votre utilisateur final, qui peut aider à surveiller et détecter les abus. | Non | |
| input_type | string | Type d’entrée de recherche d’intégration à utiliser | Non | |
| encoding_format | string | Le format pour renvoyer les embeddings. Peut être l’un ou l’autre float ou base64. Par défaut, .float |
Non | |
| dimensions | entier | Le nombre de dimensions que doivent avoir les embeddings de sortie résultantes. Pris en charge uniquement dans text-embedding-3 les modèles et les modèles ultérieurs. |
Non |
Responses
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| Objet | string | Oui | ||
| model | string | Oui | ||
| Données | tableau | Oui | ||
| utilisation | Objet | Oui |
Propriétés d’utilisation
prompt_tokens
| Nom | Catégorie | Description | Par défaut |
|---|---|---|---|
| prompt_tokens | entier |
total_tokens
| Nom | Catégorie | Description | Par défaut |
|---|---|---|---|
| total_tokens | entier |
Code de statut : 200
Description : OK
| Type de contenu | Type | Description |
|---|---|---|
| application/json | Objet |
Exemples
Example
Retournez les embeddings pour une invite donnée.
POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2024-10-21
{
"input": [
"this is a test"
]
}
Réponses : Code de statut : 200
{
"body": {
"data": [
{
"index": 0,
"embedding": [
-0.012838088,
-0.007421397,
-0.017617522,
-0.028278312,
-0.018666342,
0.01737855,
-0.01821495,
-0.006950092,
-0.009937238,
-0.038580645,
0.010674067,
0.02412286,
-0.013647936,
0.013189907,
0.0021125758,
0.012406612,
0.020790534,
0.00074595667,
0.008397198,
-0.00535031,
0.008968075,
0.014351576,
-0.014086051,
0.015055214,
-0.022211088,
-0.025198232,
0.0065186154,
-0.036350243,
0.009180495,
-0.009698266,
0.009446018,
-0.008463579,
-0.0040426035,
-0.03443847,
-0.00091273896,
-0.0019217303,
0.002349888,
-0.021560553,
0.016515596,
-0.015572986,
0.0038666942,
-8.432463e-05
]
}
],
"usage": {
"prompt_tokens": 4,
"total_tokens": 4
}
}
}
Finalisation de la conversation
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21
Crée une complétion pour le message de chat
Paramètres d’URI
| Nom | Dans | Obligatoire | Catégorie | Description |
|---|---|---|---|---|
| endpoint | path | Oui | string url |
Pris en charge Azure terminaux OpenAI (protocole et nom d’hôte, par exemple : https://aoairesource.openai.azure.com. Remplacez « aoairesource » par le nom de votre ressource Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| id-de-déploiement | path | Oui | string | ID de déploiement du modèle qui a été déployé. |
| version de l'API | Requête | Oui | string | Version de l’API |
En-tête de requête
| Nom | Obligatoire | Catégorie | Description |
|---|---|---|---|
| clé API | True | string | Fournissez ici la clé API Azure OpenAI |
Corps de la requête
Content-Type : application/json
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| Température | number | Quelle température d’échantillonnage utiliser, entre 0 et 2. Des valeurs plus élevées comme 0,8 rendent la sortie plus aléatoire, tandis que des valeurs plus basses comme 0,2 la rendent plus ciblée et déterministe. Nous recommandons généralement de modifier cela, ou top_p pas les deux. |
Non | 1 |
| top_p | number | Une alternative à l’échantillonnage par température, appelée échantillonnage de noyau, où le modèle considère les résultats des jetons avec top_p masse de probabilité. Ainsi, 0,1 signifie que seuls les jetons composant la 10e première masse de probabilité% sont pris en compte. Nous recommandons généralement de modifier cela, ou temperature pas les deux. |
Non | 1 |
| stream | booléen | Si c’est défini, des deltas partiels de message seront envoyés, comme dans ChatGPT. Les jetons seront envoyés uniquement en données par le serveur dès qu’ils seront disponibles, le flux étant interrompu par un data: [DONE] message. |
Non | Faux |
| Arrêter | chaîne ou tableau | Jusqu’à quatre séquences où l’API cessera de générer d’autres jetons. |
Non | |
| nombre_maximal_de_tokens | entier | Le nombre maximal de jetons pouvant être générés lors de la fin du chat. La longueur totale des jetons d’entrée et des jetons générés est limitée par la longueur du contexte du modèle. |
Non | |
| max_completion_tokens | entier | Une borne supérieure pour le nombre de jetons pouvant être générés pour une complétion, incluant les jetons de sortie visibles et les jetons de raisonnement. | Non | |
| pénalité de présence | number | Nombre compris entre -2,0 et 2,0. Les valeurs positives pénalisent les nouveaux jetons en fonction de leur apparence dans le texte jusqu’à présent, augmentant ainsi la probabilité du modèle d’aborder de nouveaux sujets. |
Non | 0 |
| pénalité de fréquence | number | Nombre compris entre -2,0 et 2,0. Les valeurs positives pénalisent les nouveaux jetons en fonction de leur fréquence existante dans le texte jusqu’à présent, diminuant la probabilité que le modèle répète la même phrase mot pour mot. |
Non | 0 |
| logit_bias | Objet | Modifier la probabilité que des jetons spécifiés apparaissent dans la complétion. Accepte un objet JSON qui associe les jetons (spécifiés par leur identifiant de jeton dans le tokenizador) à une valeur de biais associée de -100 à 100. Mathématiquement, le biais est ajouté aux logits générés par le modèle avant l’échantillonnage. L’effet exact variera selon le modèle, mais les valeurs comprises entre -1 et 1 devraient diminuer ou augmenter la probabilité de sélection ; des valeurs comme -100 ou 100 devraient entraîner un bannissement ou une sélection exclusive du jeton concerné. |
Non | None |
| utilisateur | string | Un identifiant unique représentant votre utilisateur final, qui peut aider à surveiller et détecter les abus. |
Non | |
| messages | tableau | Une liste des messages qui composent la conversation jusqu’à présent. | Oui | |
| data_sources | tableau | Les entrées de configuration pour les extensions de chat Azure OpenAI qui les utilisent. Cette spécification supplémentaire n’est compatible qu’avec Azure OpenAI. |
Non | |
| logprobs | booléen | S’il faut ou non retourner les probabilités logarithiques des jetons de sortie. Si c’est vrai, renvoie les probabilités logarithmitrophiques de chaque jeton de sortie retourné dans le content de message. |
Non | Faux |
| top_logprobs | entier | Un entier compris entre 0 et 20 spécifiant le nombre de jetons les plus susceptibles de revenir à chaque position de jeton, chacun avec une probabilité logarithmique associée.
logprobs doit être fixé à true si ce paramètre est utilisé. |
Non | |
| n | entier | Combien de choix de fin de conversation générer pour chaque message d’entrée. Notez que vous serez facturé en fonction du nombre de jetons générés dans toutes les options. Gardez n le minimum 1 pour minimiser les coûts. |
Non | 1 |
| parallel_tool_calls | ParallelToolCalls | S’il faut activer l’appel de fonctions parallèles lors de l’utilisation de l’outil. | Non | True |
| format_de_réponse | ResponseFormatText ou ResponseFormatJsonObject ou ResponseFormatJsonSchema | Un objet spécifiant le format que le modèle doit produire. Compatible avec GPT-4o, GPT-4o mini, GPT-4 Turbo et tous les modèles GPT-3.5 Turbo plus récents que gpt-3.5-turbo-1106.Mettre sur { "type": "json_schema", "json_schema": {...} } active les sorties structurées, ce qui garantit que le modèle correspondra à votre schéma JSON fourni.Le réglage activant { "type": "json_object" } le mode JSON, qui garantit que le message généré par le modèle est un JSON valide.Important : lors de l’utilisation du mode JSON, vous devez également demander au modèle de produire vous-même le JSON via un message système ou utilisateur. Sans cela, le modèle peut générer un flux ininterrompu d’espaces blancs jusqu’à ce que la génération atteigne la limite de tokens, ce qui entraîne une demande de longue durée et apparemment « bloquée ». Notez également que le contenu du message peut être partiellement coupé si finish_reason="length", ce qui indique que la génération a max_tokens dépassé ou que la conversation a dépassé la longueur maximale du contexte. |
Non | |
| seed | entier | Cette fonctionnalité est en version Bêta. Si spécifié, notre système fera un meilleur effort pour échantillonner de manière déterministe, de sorte que les requêtes répétées avec les mêmes seed paramètres et reproduisent le même résultat.Le déterminisme n’est pas garanti, et vous devriez vous référer au system_fingerprint paramètre de réponse pour surveiller les changements dans le backend. |
Non | |
| Outils | tableau | Une liste d’outils que le modèle peut appeler. Actuellement, seules les fonctions sont prises en charge comme outil. Utilisez cela pour fournir une liste des fonctions pour lesquelles le modèle peut générer des entrées JSON. Un maximum de 128 fonctions sont pris en charge. |
Non | |
| tool_choice | chatCompletionToolChoiceOption | Contrôle quel outil (le cas échéant) est appelé par le modèle.
none cela signifie que le modèle n’appellera aucun outil et générera un message à la place.
auto signifie que le modèle peut choisir entre générer un message ou appeler un ou plusieurs outils.
required signifie que le modèle doit appeler un ou plusieurs outils. Spécifier un outil particulier force {"type": "function", "function": {"name": "my_function"}} le modèle à appeler cet outil.
none est la norme par défaut lorsqu’aucun outil n’est présent.
auto est la norme par défaut si des outils sont présents. |
Non | |
| function_call | chaîne ou chatCompletionFunctionCallOption | Déprécié au profit de tool_choice.Contrôle quelle fonction (le cas échéant) est appelée par le modèle. none signifie que le modèle n’appellera pas de fonction et générera un message.auto signifie que le modèle peut choisir entre générer un message ou appeler une fonction.Spécifier une fonction particulière via {"name": "my_function"} force le modèle à appeler cette fonction.none est la fonction par défaut lorsqu’aucune fonction n’est présente.
auto est la valeur par défaut si des fonctions sont présentes. |
Non | |
| functions | tableau | Déprécié au profit de tools.Une liste des fonctions pour lesquelles le modèle peut générer des entrées JSON. |
Non |
Responses
Code de statut : 200
Description : OK
| Type de contenu | Type | Description |
|---|---|---|
| application/json | créerRépondreComplétéChat ou créerRépondreAchèvementCours |
Code de statut : par défaut
Description : Service indisponible
| Type de contenu | Type | Description |
|---|---|---|
| application/json | errorResponse |
Exemples
Example
Crée une complétion pour l’invite fournie, les paramètres et le modèle choisi.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21
{
"messages": [
{
"role": "system",
"content": "you are a helpful assistant that talks like a pirate"
},
{
"role": "user",
"content": "can you tell me how to care for a parrot?"
}
]
}
Réponses : Code de statut : 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Ahoy matey! So ye be wantin' to care for a fine squawkin' parrot, eh? Well, shiver me timbers, let ol' Cap'n Assistant share some wisdom with ye! Here be the steps to keepin' yer parrot happy 'n healthy:\n\n1. Secure a sturdy cage: Yer parrot be needin' a comfortable place to lay anchor! Be sure ye get a sturdy cage, at least double the size of the bird's wingspan, with enough space to spread their wings, yarrrr!\n\n2. Perches 'n toys: Aye, parrots need perches of different sizes, shapes, 'n textures to keep their feet healthy. Also, a few toys be helpin' to keep them entertained 'n their minds stimulated, arrrh!\n\n3. Proper grub: Feed yer feathered friend a balanced diet of high-quality pellets, fruits, 'n veggies to keep 'em strong 'n healthy. Give 'em fresh water every day, or ye\u00e2\u20ac\u2122ll have a scurvy bird on yer hands!\n\n4. Cleanliness: Swab their cage deck! Clean their cage on a regular basis: fresh water 'n food daily, the floor every couple of days, 'n a thorough scrubbing ev'ry few weeks, so the bird be livin' in a tidy haven, arrhh!\n\n5. Socialize 'n train: Parrots be a sociable lot, arrr! Exercise 'n interact with 'em daily to create a bond 'n maintain their mental 'n physical health. Train 'em with positive reinforcement, treat 'em kindly, yarrr!\n\n6. Proper rest: Yer parrot be needin' \u00e2\u20ac\u2122bout 10-12 hours o' sleep each night. Cover their cage 'n let them slumber in a dim, quiet quarter for a proper night's rest, ye scallywag!\n\n7. Keep a weather eye open for illness: Birds be hidin' their ailments, arrr! Be watchful for signs of sickness, such as lethargy, loss of appetite, puffin' up, or change in droppings, and make haste to a vet if need be.\n\n8. Provide fresh air 'n avoid toxins: Parrots be sensitive to draft and pollutants. Keep yer quarters well ventilated, but no drafts, arrr! Be mindful of toxins like Teflon fumes, candles, or air fresheners.\n\nSo there ye have it, me hearty! With proper care 'n commitment, yer parrot will be squawkin' \"Yo-ho-ho\" for many years to come! Good luck, sailor, and may the wind be at yer back!"
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Example
Crée une complétion basée sur les données Azure Search et l’identité managée assignée au système.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "azure_search",
"parameters": {
"endpoint": "https://your-search-endpoint.search.windows.net/",
"index_name": "{index name}",
"authentication": {
"type": "system_assigned_managed_identity"
}
}
}
]
}
Réponses : Code de statut : 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Example
Crée une complétion basée sur les données du vecteur de recherche Azure, le message d’assistant précédent et l’identité gérée attribuée par l’utilisateur.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a cat?"
},
{
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"intent": "cat care"
}
},
{
"role": "user",
"content": "how about dog?"
}
],
"data_sources": [
{
"type": "azure_search",
"parameters": {
"endpoint": "https://your-search-endpoint.search.windows.net/",
"authentication": {
"type": "user_assigned_managed_identity",
"managed_identity_resource_id": "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{resource-name}"
},
"index_name": "{index name}",
"query_type": "vector",
"embedding_dependency": {
"type": "deployment_name",
"deployment_name": "{embedding deployment name}"
},
"in_scope": true,
"top_n_documents": 5,
"strictness": 3,
"role_information": "You are an AI assistant that helps people find information.",
"fields_mapping": {
"content_fields_separator": "\\n",
"content_fields": [
"content"
],
"filepath_field": "filepath",
"title_field": "title",
"url_field": "url",
"vector_fields": [
"contentvector"
]
}
}
}
]
}
Réponses : Code de statut : 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content 2.",
"title": "Citation Title 2",
"filepath": "contoso2.txt",
"url": "https://contoso.blob.windows.net/container/contoso2.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Example
Crée une complétion pour la Azure Cosmos DB fournie.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "azure_cosmos_db",
"parameters": {
"authentication": {
"type": "connection_string",
"connection_string": "mongodb+srv://rawantest:{password}$@{cluster-name}.mongocluster.cosmos.azure.com/?tls=true&authMechanism=SCRAM-SHA-256&retrywrites=false&maxIdleTimeMS=120000"
},
"database_name": "vectordb",
"container_name": "azuredocs",
"index_name": "azuredocindex",
"embedding_dependency": {
"type": "deployment_name",
"deployment_name": "{embedding deployment name}"
},
"fields_mapping": {
"content_fields": [
"content"
],
"vector_fields": [
"contentvector"
]
}
}
}
]
}
Réponses : Code de statut : 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Transcriptions - Créer
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21
Transcrit l’audio dans la langue d’entrée.
Paramètres d’URI
| Nom | Dans | Obligatoire | Catégorie | Description |
|---|---|---|---|---|
| endpoint | path | Oui | string url |
Pris en charge Azure terminaux OpenAI (protocole et nom d’hôte, par exemple : https://aoairesource.openai.azure.com. Remplacez « aoairesource » par le nom de votre ressource Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| id-de-déploiement | path | Oui | string | ID de déploiement du modèle de reconnaissance vocale. Pour des informations sur les modèles pris en charge, voir [/azure/ai-foundry/openai/concepts/models#audio-models]. |
| version de l'API | Requête | Oui | string | Version de l’API |
En-tête de requête
| Nom | Obligatoire | Catégorie | Description |
|---|---|---|---|
| clé API | True | string | Fournissez ici la clé API Azure OpenAI |
Corps de la requête
Content-Type : multipart/form-data
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| fichier | string | L’objet du fichier audio à transcrire. | Oui | |
| prompt | string | Un texte optionnel pour guider le style du modèle ou poursuivre un segment audio précédent. La consigne doit correspondre au langage audio. | Non | |
| format_de_réponse | audioResponseFormat | Définit le format de la sortie. | Non | |
| Température | number | La température d’échantillonnage, comprise entre 0 et 1. Des valeurs plus élevées comme 0,8 rendent la sortie plus aléatoire, tandis que des valeurs plus basses comme 0,2 la rendent plus ciblée et déterministe. Si elle est réglée à 0, le modèle utilisera la probabilité logarithmique pour augmenter automatiquement la température jusqu’à atteindre certains seuils. | Non | 0 |
| language | string | La langue de l’audio d’entrée. Fournir le langage d’entrée au format ISO-639-1 améliorera la précision et la latence. | Non |
Responses
Code de statut : 200
Description : OK
| Type de contenu | Type | Description |
|---|---|---|
| application/json | audioRéponse ou audioVerboseResponse | |
| texte brut | string | Texte transcrit au format de sortie (quand response_format était un texte de texte, vtt ou srt). |
Exemples
Example
Obtient le texte transcrit et les métadonnées associées à partir des données audio parlées fournies.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21
Réponses : Code de statut : 200
{
"body": {
"text": "A structured object when requesting json or verbose_json"
}
}
Example
Obtient le texte transcrit et les métadonnées associées à partir des données audio parlées fournies.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
Réponses : Code de statut : 200
{
"type": "string",
"example": "plain text when requesting text, srt, or vtt"
}
Traductions - Create
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21
Transcrit et traduit l’audio d’entrée en texte anglais.
Paramètres d’URI
| Nom | Dans | Obligatoire | Catégorie | Description |
|---|---|---|---|---|
| endpoint | path | Oui | string url |
Pris en charge Azure terminaux OpenAI (protocole et nom d’hôte, par exemple : https://aoairesource.openai.azure.com. Remplacez « aoairesource » par le nom de votre ressource Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| id-de-déploiement | path | Oui | string | ID de déploiement du modèle whisper qui a été déployé. Pour des informations sur les modèles pris en charge, voir [/azure/ai-foundry/openai/concepts/models#audio-models]. |
| version de l'API | Requête | Oui | string | Version de l’API |
En-tête de requête
| Nom | Obligatoire | Catégorie | Description |
|---|---|---|---|
| clé API | True | string | Fournissez ici la clé API Azure OpenAI |
Corps de la requête
Content-Type : multipart/form-data
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| fichier | string | Le fichier audio à traduire. | Oui | |
| prompt | string | Un texte optionnel pour guider le style du modèle ou poursuivre un segment audio précédent. Le prompt doit être en anglais. | Non | |
| format_de_réponse | audioResponseFormat | Définit le format de la sortie. | Non | |
| Température | number | La température d’échantillonnage, comprise entre 0 et 1. Des valeurs plus élevées comme 0,8 rendent la sortie plus aléatoire, tandis que des valeurs plus basses comme 0,2 la rendent plus ciblée et déterministe. Si elle est réglée à 0, le modèle utilisera la probabilité logarithmique pour augmenter automatiquement la température jusqu’à atteindre certains seuils. | Non | 0 |
Responses
Code de statut : 200
Description : OK
| Type de contenu | Type | Description |
|---|---|---|
| application/json | audioRéponse ou audioVerboseResponse | |
| texte brut | string | Texte transcrit au format de sortie (quand response_format était un texte de texte, vtt ou srt). |
Exemples
Example
Obtient le texte transcrit en anglais et les métadonnées associées à partir des données audio parlées fournies.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
Réponses : Code de statut : 200
{
"body": {
"text": "A structured object when requesting json or verbose_json"
}
}
Example
Obtient le texte transcrit en anglais et les métadonnées associées à partir des données audio parlées fournies.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
Réponses : Code de statut : 200
{
"type": "string",
"example": "plain text when requesting text, srt, or vtt"
}
Génération d'image
POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2024-10-21
Génère un lot d’images à partir d’une légende texte sur un déploiement donné du modèle dall-e
Paramètres d’URI
| Nom | Dans | Obligatoire | Catégorie | Description |
|---|---|---|---|---|
| endpoint | path | Oui | string url |
Pris en charge Azure terminaux OpenAI (protocole et nom d’hôte, par exemple : https://aoairesource.openai.azure.com. Remplacez « aoairesource » par le nom de votre ressource Azure OpenAI). https://{your-resource-name}.openai.azure.com |
| id-de-déploiement | path | Oui | string | ID de déploiement du modèle dall-e qui a été déployé. |
| version de l'API | Requête | Oui | string | Version de l’API |
En-tête de requête
| Nom | Obligatoire | Catégorie | Description |
|---|---|---|---|
| clé API | True | string | Fournissez ici la clé API Azure OpenAI |
Corps de la requête
Content-Type : application/json
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| prompt | string | Une description textuelle de l’image ou des images souhaitées. La longueur maximale est de 4 000 caractères. | Oui | |
| n | entier | Le nombre d’images à générer. | Non | 1 |
| size | imageSize | La taille des images générées. | Non | 1024x1024 |
| format_de_réponse | imagesResponseFormat | Le format dans lequel les images générées sont renvoyées. | Non | url |
| utilisateur | string | Un identifiant unique représentant votre utilisateur final, qui peut aider à surveiller et détecter les abus. | Non | |
| Qualité | imageQuality | La qualité de l’image qui sera générée. | Non | Norme |
| style | imageStyle | Le style des images générées. | Non | vivid |
Responses
Code de statut : 200
Description : Ok
| Type de contenu | Type | Description |
|---|---|---|
| application/json | generateImagesResponse |
Code de statut : par défaut
Description : Une erreur s’est produite.
| Type de contenu | Type | Description |
|---|---|---|
| application/json | dalleErrorResponse |
Exemples
Example
Crée des images à partir d’une invitation.
POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2024-10-21
{
"prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
"n": 1,
"style": "natural",
"quality": "standard"
}
Réponses : Code de statut : 200
{
"body": {
"created": 1698342300,
"data": [
{
"revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
"prompt_filter_results": {
"sexual": {
"severity": "safe",
"filtered": false
},
"violence": {
"severity": "safe",
"filtered": false
},
"hate": {
"severity": "safe",
"filtered": false
},
"self_harm": {
"severity": "safe",
"filtered": false
},
"profanity": {
"detected": false,
"filtered": false
}
},
"url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
"content_filter_results": {
"sexual": {
"severity": "safe",
"filtered": false
},
"violence": {
"severity": "safe",
"filtered": false
},
"hate": {
"severity": "safe",
"filtered": false
},
"self_harm": {
"severity": "safe",
"filtered": false
}
}
}
]
}
}
Composants
errorResponse
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| erreur | error | Non |
errorBase
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| code | string | Non | ||
| message | string | Non |
erreur
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| param | string | Non | ||
| type | string | Non | ||
| inner_error | innerError | Erreur intérieure avec des détails supplémentaires. | Non |
innerError
Erreur intérieure avec des détails supplémentaires.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| code | innerErrorCode | Codes d’erreur pour l’objet d’erreur interne. | Non | |
| content_filter_results | contentFilterPromptResults | Informations sur la catégorie de filtrage de contenu (haine, sexuel, violence, self_harm), si elle a été détectée, ainsi que sur le niveau de gravité (very_low, faible, moyen, élevé qui détermine l’intensité et le niveau de risque du contenu nuisible) et si elle a été filtrée ou non. Informations sur le contenu jailbreak et les jurons, s’ils ont été détectés, et si ils ont été filtrés ou non. Et des informations sur la liste de blocage des clients, si elle a été filtrée et son identifiant. | Non |
innerErrorCode
Codes d’erreur pour l’objet d’erreur interne.
Description : Codes d’erreur pour l’objet d’erreur interne.
Type : chaîne
Valeur par défaut :
Nom d’enum : InnerErrorCode
Valeurs d’énumération :
| Valeur | Description |
|---|---|
| ResponsibleAIPolicyViolation | La consigne a enfreint l’une des autres règles de filtrage de contenu. |
dalleErrorResponse
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| erreur | dalleError | Non |
dalleError
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| param | string | Non | ||
| type | string | Non | ||
| inner_error | dalleInnerError | Erreur intérieure avec des détails supplémentaires. | Non |
dalleInnerError
Erreur intérieure avec des détails supplémentaires.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| code | innerErrorCode | Codes d’erreur pour l’objet d’erreur interne. | Non | |
| content_filter_results | dalleFilterResults | Informations sur la catégorie de filtrage de contenu (haine, sexuel, violence, self_harm), si elle a été détectée, ainsi que sur le niveau de gravité (very_low, faible, moyen, élevé qui détermine l’intensité et le niveau de risque du contenu nuisible) et si elle a été filtrée ou non. Informations sur le contenu jailbreak et les jurons, s’ils ont été détectés, et si ils ont été filtrés ou non. Et des informations sur la liste de blocage des clients, si elle a été filtrée et son identifiant. | Non | |
| revised_prompt | string | La demande utilisée pour générer l’image, s’il y avait une révision de la requête. | Non |
BaseDeRésultatDeFiltreDeContenu
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| filtered | booléen | Oui |
Résultat de la sévérité du filtre de contenu
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| filtered | booléen | Oui | ||
| severity | string | Non |
contentFilterDetectedResult
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| filtered | booléen | Oui | ||
| détecté | booléen | Non |
contentFilterDetectedWithCitationResult
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| citation | Objet | Non |
Propriétés de citation
URL
| Nom | Catégorie | Description | Par défaut |
|---|---|---|---|
| URL | string |
license
| Nom | Catégorie | Description | Par défaut |
|---|---|---|---|
| license | string |
contentFilterResultsBase
Informations sur les résultats du filtrage de contenu.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| Sexuelle | résultatDeSévéritéDuFiltreDeContenu | Non | ||
| violence | résultatDeSévéritéDuFiltreDeContenu | Non | ||
| Déteste | résultatDeSévéritéDuFiltreDeContenu | Non | ||
| self_harm | résultatDeSévéritéDuFiltreDeContenu | Non | ||
| Blasphème | RésultatDeFiltreDeContenuDétecté | Non | ||
| erreur | errorBase | Non |
contentFilterPromptResults
Informations sur la catégorie de filtrage de contenu (haine, sexuel, violence, self_harm), si elle a été détectée, ainsi que sur le niveau de gravité (very_low, faible, moyen, élevé qui détermine l’intensité et le niveau de risque du contenu nuisible) et si elle a été filtrée ou non. Informations sur le contenu jailbreak et les jurons, s’ils ont été détectés, et si ils ont été filtrés ou non. Et des informations sur la liste de blocage des clients, si elle a été filtrée et son identifiant.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| Sexuelle | résultatDeSévéritéDuFiltreDeContenu | Non | ||
| violence | résultatDeSévéritéDuFiltreDeContenu | Non | ||
| Déteste | résultatDeSévéritéDuFiltreDeContenu | Non | ||
| self_harm | résultatDeSévéritéDuFiltreDeContenu | Non | ||
| Blasphème | RésultatDeFiltreDeContenuDétecté | Non | ||
| erreur | errorBase | Non | ||
| jailbreak | RésultatDeFiltreDeContenuDétecté | Non |
contentFilterChoiceResults
Informations sur la catégorie de filtrage de contenu (haine, sexuel, violence, self_harm), si elle a été détectée, ainsi que sur le niveau de gravité (very_low, faible, moyen, élevé qui détermine l’intensité et le niveau de risque du contenu nuisible) et si elle a été filtrée ou non. Informations sur les textes et jurons tiers, si cela a été détecté, et s’il a été filtré ou non. Et des informations sur la liste de blocage des clients, si elle a été filtrée et son identifiant.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| Sexuelle | résultatDeSévéritéDuFiltreDeContenu | Non | ||
| violence | résultatDeSévéritéDuFiltreDeContenu | Non | ||
| Déteste | résultatDeSévéritéDuFiltreDeContenu | Non | ||
| self_harm | résultatDeSévéritéDuFiltreDeContenu | Non | ||
| Blasphème | RésultatDeFiltreDeContenuDétecté | Non | ||
| erreur | errorBase | Non | ||
| protected_material_text | RésultatDeFiltreDeContenuDétecté | Non | ||
| protected_material_code | filtreDeContenuDetectéAvecRésultatDeCitation | Non |
promptFilterResult
Résultats de filtrage de contenu pour une seule invite dans la requête.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| prompt_index | entier | Non | ||
| content_filter_results | contentFilterPromptResults | Informations sur la catégorie de filtrage de contenu (haine, sexuel, violence, self_harm), si elle a été détectée, ainsi que sur le niveau de gravité (very_low, faible, moyen, élevé qui détermine l’intensité et le niveau de risque du contenu nuisible) et si elle a été filtrée ou non. Informations sur le contenu jailbreak et les jurons, s’ils ont été détectés, et si ils ont été filtrés ou non. Et des informations sur la liste de blocage des clients, si elle a été filtrée et son identifiant. | Non |
promptFilterResults
Filtrage de contenu pour zéro ou plus d’invites dans la requête. Dans une requête en streaming, les résultats pour différentes invitations peuvent arriver à des moments ou dans des ordres différents.
Aucune propriété définie pour ce composant.
RésultatsDalleFiltreDeContenu
Informations sur les résultats du filtrage de contenu.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| Sexuelle | résultatDeSévéritéDuFiltreDeContenu | Non | ||
| violence | résultatDeSévéritéDuFiltreDeContenu | Non | ||
| Déteste | résultatDeSévéritéDuFiltreDeContenu | Non | ||
| self_harm | résultatDeSévéritéDuFiltreDeContenu | Non |
dalleFilterResults
Informations sur la catégorie de filtrage de contenu (haine, sexuel, violence, self_harm), si elle a été détectée, ainsi que sur le niveau de gravité (very_low, faible, moyen, élevé qui détermine l’intensité et le niveau de risque du contenu nuisible) et si elle a été filtrée ou non. Informations sur le contenu jailbreak et les jurons, s’ils ont été détectés, et si ils ont été filtrés ou non. Et des informations sur la liste de blocage des clients, si elle a été filtrée et son identifiant.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| Sexuelle | résultatDeSévéritéDuFiltreDeContenu | Non | ||
| violence | résultatDeSévéritéDuFiltreDeContenu | Non | ||
| Déteste | résultatDeSévéritéDuFiltreDeContenu | Non | ||
| self_harm | résultatDeSévéritéDuFiltreDeContenu | Non | ||
| Blasphème | RésultatDeFiltreDeContenuDétecté | Non | ||
| jailbreak | RésultatDeFiltreDeContenuDétecté | Non |
chatCompletionsRequestCommon
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| Température | number | Quelle température d’échantillonnage utiliser, entre 0 et 2. Des valeurs plus élevées comme 0,8 rendent la sortie plus aléatoire, tandis que des valeurs plus basses comme 0,2 la rendent plus ciblée et déterministe. Nous recommandons généralement de modifier cela, ou top_p pas les deux. |
Non | 1 |
| top_p | number | Une alternative à l’échantillonnage par température, appelée échantillonnage de noyau, où le modèle considère les résultats des jetons avec top_p masse de probabilité. Ainsi, 0,1 signifie que seuls les jetons composant la 10e première masse de probabilité% sont pris en compte. Nous recommandons généralement de modifier cela, ou temperature pas les deux. |
Non | 1 |
| stream | booléen | Si c’est défini, des deltas partiels de message seront envoyés, comme dans ChatGPT. Les jetons seront envoyés uniquement en données par le serveur dès qu’ils seront disponibles, le flux étant interrompu par un data: [DONE] message. |
Non | Faux |
| Arrêter | chaîne ou tableau | Jusqu’à quatre séquences où l’API cessera de générer d’autres jetons. | Non | |
| nombre_maximal_de_tokens | entier | Le nombre maximal de jetons autorisé pour la réponse générée. Par défaut, le nombre de jetons que le modèle peut retourner sera (4096 - jetons à invites). Cette valeur est désormais dépréciée au profit de max_completion_tokens, et n’est pas compatible avec les modèles de la série O1. |
Non | 4096 |
| max_completion_tokens | entier | Une borne supérieure pour le nombre de jetons pouvant être générés pour une complétion, incluant les jetons de sortie visibles et les jetons de raisonnement. | Non | |
| pénalité de présence | number | Nombre compris entre -2,0 et 2,0. Les valeurs positives pénalisent les nouveaux jetons en fonction de leur apparence dans le texte jusqu’à présent, augmentant ainsi la probabilité du modèle d’aborder de nouveaux sujets. | Non | 0 |
| pénalité de fréquence | number | Nombre compris entre -2,0 et 2,0. Les valeurs positives pénalisent les nouveaux jetons en fonction de leur fréquence existante dans le texte jusqu’à présent, diminuant la probabilité que le modèle répète la même phrase mot pour mot. | Non | 0 |
| logit_bias | Objet | Modifier la probabilité que des jetons spécifiés apparaissent dans la complétion. Accepte un objet json qui associe les jetons (spécifiés par leur identifiant de jeton dans le tokenizador) à une valeur de biais associée de -100 à 100. Mathématiquement, le biais est ajouté aux logits générés par le modèle avant l’échantillonnage. L’effet exact variera selon le modèle, mais les valeurs comprises entre -1 et 1 devraient diminuer ou augmenter la probabilité de sélection ; des valeurs comme -100 ou 100 devraient entraîner un bannissement ou une sélection exclusive du jeton concerné. | Non | |
| utilisateur | string | Un identifiant unique représentant votre utilisateur final, qui peut aider Azure OpenAI à surveiller et détecter les abus. | Non |
créerDemandeDeComplétion
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| prompt | chaîne ou tableau | Le(s) prompt(s) pour générer des complétions pour , encodé sous forme de chaîne, tableau de chaînes, tableau de jetons ou tableau de tableaux de jetons. Notez que <|endoftext|> est le séparateur de document que le modèle voit lors de l’entraînement, donc si une invite n’est pas spécifiée, le modèle sera généré comme si c’était le début d’un nouveau document. |
Oui | |
| meilleures sélections | entier | Génère best_of des complétions côté serveur et retourne le « meilleur » (celui avec la plus grande probabilité logarithmique par jeton). Les résultats ne peuvent pas être diffusés en streaming.Lorsqu’elle est utilisée avec n, best_of contrôle le nombre de complétions candidates et n spécifie combien retourner †» best_of doit être supérieur à n.Note : Parce que ce paramètre génère de nombreuses complétions, il peut rapidement consommer votre quota de jetons. Utilisez avec soin et assurez-vous d’avoir des réglages raisonnables pour max_tokens et stop. |
Non | 1 |
| echo | booléen | Faites écho à la consigne en plus de la complétion |
Non | Faux |
| pénalité de fréquence | number | Nombre compris entre -2,0 et 2,0. Les valeurs positives pénalisent les nouveaux jetons en fonction de leur fréquence existante dans le texte jusqu’à présent, diminuant la probabilité que le modèle répète la même phrase mot pour mot. |
Non | 0 |
| logit_bias | Objet | Modifier la probabilité que des jetons spécifiés apparaissent dans la complétion. Accepte un objet JSON qui associe les jetons (spécifiés par leur identifiant de jeton dans le tokeniseur GPT) à une valeur de biais associée de -100 à 100. Mathématiquement, le biais est ajouté aux logits générés par le modèle avant l’échantillonnage. L’effet exact variera selon le modèle, mais les valeurs comprises entre -1 et 1 devraient diminuer ou augmenter la probabilité de sélection ; des valeurs comme -100 ou 100 devraient entraîner un bannissement ou une sélection exclusive du jeton concerné. Par exemple, vous pouvez passer {"50256": -100} pour empêcher la génération du <token |endoftext> . |
Non | None |
| logprobs | entier | Incluez les probabilités logarithiques sur les logprobs jetons de sortie les plus probables, ainsi que les jetons choisis. Par exemple, si logprobs est 5, l’API renverra une liste des cinq jetons les plus probables. L’API retournera toujours le logprob du jeton échantillonné, donc il peut y avoir jusqu’à jusqu’à logprobs+1 des éléments dans la réponse.La valeur maximale pour logprobs est 5. |
Non | None |
| nombre_maximal_de_tokens | entier | Le nombre maximal de jetons pouvant être générés dans la complétion. Le nombre de jetons de votre invite plus max_tokens ne peut pas dépasser la longueur contextuelle du modèle. |
Non | 16 |
| n | entier | Combien de complétions générer pour chaque invite. Note : Parce que ce paramètre génère de nombreuses complétions, il peut rapidement consommer votre quota de jetons. Utilisez avec soin et assurez-vous d’avoir des réglages raisonnables pour max_tokens et stop. |
Non | 1 |
| pénalité de présence | number | Nombre compris entre -2,0 et 2,0. Les valeurs positives pénalisent les nouveaux jetons en fonction de leur apparence dans le texte jusqu’à présent, augmentant ainsi la probabilité du modèle d’aborder de nouveaux sujets. |
Non | 0 |
| seed | entier | Si spécifié, notre système fera un meilleur effort pour échantillonner de manière déterministe, de sorte que les requêtes répétées avec les mêmes seed paramètres et reproduisent le même résultat.Le déterminisme n’est pas garanti, et vous devriez vous référer au system_fingerprint paramètre de réponse pour surveiller les changements dans le backend. |
Non | |
| Arrêter | chaîne ou tableau | Jusqu’à quatre séquences où l’API cessera de générer d’autres jetons. Le texte retourné ne contiendra pas la séquence d’arrêt. |
Non | |
| stream | booléen | Est-ce qu’il faut réintégrer un progrès partiel en détail. S’ils sont activés, les jetons seront envoyés comme des événements uniquement données envoyés par le serveur dès qu’ils deviennent disponibles, le flux étant interrompu par un data: [DONE] message. |
Non | Faux |
| Suffixe | string | Le suffixe qui vient après la fin du texte inséré. Ce paramètre n’est pris en charge que pour gpt-3.5-turbo-instruct. |
Non | None |
| Température | number | Quelle température d’échantillonnage utiliser, entre 0 et 2. Des valeurs plus élevées comme 0,8 rendent la sortie plus aléatoire, tandis que des valeurs plus basses comme 0,2 la rendent plus ciblée et déterministe. Nous recommandons généralement de modifier cela, ou top_p pas les deux. |
Non | 1 |
| top_p | number | Une alternative à l’échantillonnage par température, appelée échantillonnage de noyau, où le modèle considère les résultats des jetons avec top_p masse de probabilité. Ainsi, 0,1 signifie que seuls les jetons composant la 10e première masse de probabilité% sont pris en compte. Nous recommandons généralement de modifier cela, ou temperature pas les deux. |
Non | 1 |
| utilisateur | string | Un identifiant unique représentant votre utilisateur final, qui peut aider à surveiller et détecter les abus. |
Non |
createCompletionResponse
Représente une réponse de complétion de l’API. Note : les objets de réponse en streaming et non diffusés partagent la même forme (contrairement au point d’extrémité du chat).
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| ID | string | Un identifiant unique pour l’achèvement. | Oui | |
| choix | tableau | La liste des choix de complétion générés par le modèle pour l’invite d’entrée. | Oui | |
| créé | entier | L’horodatage Unix (en secondes) de la création de la complétion. | Oui | |
| model | string | Le modèle utilisé pour la complétion. | Oui | |
| prompt_filter_results | promptFilterResults | Filtrage de contenu pour zéro ou plus d’invites dans la requête. Dans une requête en streaming, les résultats pour différentes invitations peuvent arriver à des moments ou dans des ordres différents. | Non | |
| system_fingerprint | string | Cette empreinte digitale représente la configuration backend avec laquelle le modèle fonctionne. Peut être utilisé conjointement avec le seed paramètre de requête pour comprendre quand des modifications en backend ont été effectuées pouvant impacter le déterminisme. |
Non | |
| Objet | enum | Le type d’objet, qui est toujours « text_completion » Valeurs possibles : text_completion |
Oui | |
| utilisation | completionUsage | Statistiques d’utilisation pour la demande de complétion. | Non |
createChatCompletionRequest
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| Température | number | Quelle température d’échantillonnage utiliser, entre 0 et 2. Des valeurs plus élevées comme 0,8 rendent la sortie plus aléatoire, tandis que des valeurs plus basses comme 0,2 la rendent plus ciblée et déterministe. Nous recommandons généralement de modifier cela, ou top_p pas les deux. |
Non | 1 |
| top_p | number | Une alternative à l’échantillonnage par température, appelée échantillonnage de noyau, où le modèle considère les résultats des jetons avec top_p masse de probabilité. Ainsi, 0,1 signifie que seuls les jetons composant la 10e première masse de probabilité% sont pris en compte. Nous recommandons généralement de modifier cela, ou temperature pas les deux. |
Non | 1 |
| stream | booléen | Si c’est défini, des deltas partiels de message seront envoyés, comme dans ChatGPT. Les jetons seront envoyés uniquement en données par le serveur dès qu’ils seront disponibles, le flux étant interrompu par un data: [DONE] message. |
Non | Faux |
| Arrêter | chaîne ou tableau | Jusqu’à quatre séquences où l’API cessera de générer d’autres jetons. |
Non | |
| nombre_maximal_de_tokens | entier | Le nombre maximal de jetons pouvant être générés lors de la fin du chat. La longueur totale des jetons d’entrée et des jetons générés est limitée par la longueur du contexte du modèle. |
Non | |
| max_completion_tokens | entier | Une borne supérieure pour le nombre de jetons pouvant être générés pour une complétion, incluant les jetons de sortie visibles et les jetons de raisonnement. | Non | |
| pénalité de présence | number | Nombre compris entre -2,0 et 2,0. Les valeurs positives pénalisent les nouveaux jetons en fonction de leur apparence dans le texte jusqu’à présent, augmentant ainsi la probabilité du modèle d’aborder de nouveaux sujets. |
Non | 0 |
| pénalité de fréquence | number | Nombre compris entre -2,0 et 2,0. Les valeurs positives pénalisent les nouveaux jetons en fonction de leur fréquence existante dans le texte jusqu’à présent, diminuant la probabilité que le modèle répète la même phrase mot pour mot. |
Non | 0 |
| logit_bias | Objet | Modifier la probabilité que des jetons spécifiés apparaissent dans la complétion. Accepte un objet JSON qui associe les jetons (spécifiés par leur identifiant de jeton dans le tokenizador) à une valeur de biais associée de -100 à 100. Mathématiquement, le biais est ajouté aux logits générés par le modèle avant l’échantillonnage. L’effet exact variera selon le modèle, mais les valeurs comprises entre -1 et 1 devraient diminuer ou augmenter la probabilité de sélection ; des valeurs comme -100 ou 100 devraient entraîner un bannissement ou une sélection exclusive du jeton concerné. |
Non | None |
| utilisateur | string | Un identifiant unique représentant votre utilisateur final, qui peut aider à surveiller et détecter les abus. |
Non | |
| messages | tableau | Une liste des messages qui composent la conversation jusqu’à présent. | Oui | |
| data_sources | tableau | Les entrées de configuration pour les extensions de chat Azure OpenAI qui les utilisent. Cette spécification supplémentaire n’est compatible qu’avec Azure OpenAI. |
Non | |
| logprobs | booléen | S’il faut ou non retourner les probabilités logarithiques des jetons de sortie. Si c’est vrai, renvoie les probabilités logarithmitrophiques de chaque jeton de sortie retourné dans le content de message. |
Non | Faux |
| top_logprobs | entier | Un entier compris entre 0 et 20 spécifiant le nombre de jetons les plus susceptibles de revenir à chaque position de jeton, chacun avec une probabilité logarithmique associée.
logprobs doit être fixé à true si ce paramètre est utilisé. |
Non | |
| n | entier | Combien de choix de fin de conversation générer pour chaque message d’entrée. Notez que vous serez facturé en fonction du nombre de jetons générés dans toutes les options. Gardez n le minimum 1 pour minimiser les coûts. |
Non | 1 |
| parallel_tool_calls | ParallelToolCalls | S’il faut activer l’appel de fonctions parallèles lors de l’utilisation de l’outil. | Non | True |
| format_de_réponse | ResponseFormatText ou ResponseFormatJsonObject ou ResponseFormatJsonSchema | Un objet spécifiant le format que le modèle doit produire. Compatible avec GPT-4o, GPT-4o mini, GPT-4 Turbo et tous les modèles GPT-3.5 Turbo plus récents que gpt-3.5-turbo-1106.Mettre sur { "type": "json_schema", "json_schema": {...} } active les sorties structurées, ce qui garantit que le modèle correspondra à votre schéma JSON fourni.Le réglage activant { "type": "json_object" } le mode JSON, qui garantit que le message généré par le modèle est un JSON valide.Important : lors de l’utilisation du mode JSON, vous devez également demander au modèle de produire vous-même le JSON via un message système ou utilisateur. Sans cela, le modèle peut générer un flux ininterrompu d’espaces blancs jusqu’à ce que la génération atteigne la limite de tokens, ce qui entraîne une demande de longue durée et apparemment « bloquée ». Notez également que le contenu du message peut être partiellement coupé si finish_reason="length", ce qui indique que la génération a max_tokens dépassé ou que la conversation a dépassé la longueur maximale du contexte. |
Non | |
| seed | entier | Cette fonctionnalité est en version Bêta. Si spécifié, notre système fera un meilleur effort pour échantillonner de manière déterministe, de sorte que les requêtes répétées avec les mêmes seed paramètres et reproduisent le même résultat.Le déterminisme n’est pas garanti, et vous devriez vous référer au system_fingerprint paramètre de réponse pour surveiller les changements dans le backend. |
Non | |
| Outils | tableau | Une liste d’outils que le modèle peut appeler. Actuellement, seules les fonctions sont prises en charge comme outil. Utilisez cela pour fournir une liste des fonctions pour lesquelles le modèle peut générer des entrées JSON. Un maximum de 128 fonctions sont pris en charge. |
Non | |
| tool_choice | chatCompletionToolChoiceOption | Contrôle quel outil (le cas échéant) est appelé par le modèle.
none cela signifie que le modèle n’appellera aucun outil et générera un message à la place.
auto signifie que le modèle peut choisir entre générer un message ou appeler un ou plusieurs outils.
required signifie que le modèle doit appeler un ou plusieurs outils. Spécifier un outil particulier force {"type": "function", "function": {"name": "my_function"}} le modèle à appeler cet outil.
none est la norme par défaut lorsqu’aucun outil n’est présent.
auto est la norme par défaut si des outils sont présents. |
Non | |
| function_call | chaîne ou chatCompletionFunctionCallOption | Déprécié au profit de tool_choice.Contrôle quelle fonction (le cas échéant) est appelée par le modèle. none signifie que le modèle n’appellera pas de fonction et générera un message.auto signifie que le modèle peut choisir entre générer un message ou appeler une fonction.Spécifier une fonction particulière via {"name": "my_function"} force le modèle à appeler cette fonction.none est la fonction par défaut lorsqu’aucune fonction n’est présente.
auto est la valeur par défaut si des fonctions sont présentes. |
Non | |
| functions | tableau | Déprécié au profit de tools.Une liste des fonctions pour lesquelles le modèle peut générer des entrées JSON. |
Non |
chatCompletionFunctions
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| description | string | Une description de ce que fait la fonction, utilisée par le modèle pour choisir quand et comment appeler la fonction. | Non | |
| name | string | Le nom de la fonction à appeler. Doit être de A à Z, de A à Z, de 0 à 9, ou contenir des sous-traits et des titres, avec une longueur maximale de 64. | Oui | |
| parameters | FunctionParameters | Les paramètres acceptés par les fonctions sont décrits comme un objet schéma JSON.
Voir le guide pour des exemples, ainsi que la référence du schéma JSON pour la documentation sur le format. Omettre parameters définit une fonction avec une liste de paramètres vide. |
Non |
chatCompletionFunctionCallOption
Spécifier une fonction particulière via {"name": "my_function"} force le modèle à appeler cette fonction.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| name | string | Le nom de la fonction à appeler. | Oui |
chatCompletionRequestMessage
Ce composant peut être l’un des suivants :
Message du système de demande d'achèvement du chat
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| contenu | chaîne ou tableau | Le contenu du message système. | Oui | |
| role | enum | Le rôle de l’auteur des messages, dans ce cas system.Valeurs possibles : système |
Oui | |
| name | string | Un nom optionnel pour le participant. Fournit les informations du modèle permettant de différencier les participants ayant le même rôle. | Non |
chatCompletionRequestUserMessage
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| contenu | chaîne ou tableau | Le contenu du message utilisateur. |
Oui | |
| role | enum | Le rôle de l’auteur des messages, dans ce cas user.Valeurs possibles : utilisateur |
Oui | |
| name | string | Un nom optionnel pour le participant. Fournit les informations du modèle permettant de différencier les participants ayant le même rôle. | Non |
chatCompletionRequestAssistantMessage
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| contenu | chaîne ou tableau | Le contenu du message de l’assistant. Obligatoire sauf tool_calls indication contraire function_call . |
Non | |
| refusal | string | Le message de refus de l’assistant. | Non | |
| role | enum | Le rôle de l’auteur des messages, dans ce cas assistant.Valeurs possibles : assistant |
Oui | |
| name | string | Un nom optionnel pour le participant. Fournit les informations du modèle permettant de différencier les participants ayant le même rôle. | Non | |
| tool_calls | chatCompletionMessageToolCalls | Les appels d’outils générés par le modèle, tels que les appels de fonction. | Non | |
| function_call | Objet | Déprécié et remplacé par tool_calls. Le nom et les arguments d’une fonction à appeler, tels que générés par le modèle. |
Non |
Propriétés pour function_call
Arguments
| Nom | Catégorie | Description | Par défaut |
|---|---|---|---|
| Arguments | string | Les arguments pour appeler la fonction avec, telle que générée par le modèle au format JSON. Notez que le modèle ne génère pas toujours un JSON valide, et peut générer des paramètres non définis par votre schéma de fonction. Validez les arguments de votre code avant d’appeler votre fonction. |
name
| Nom | Catégorie | Description | Par défaut |
|---|---|---|---|
| name | string | Le nom de la fonction à appeler. |
chatCompletionRequestToolMessage
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| role | enum | Le rôle de l’auteur des messages, dans ce cas tool.Valeurs possibles : outil |
Oui | |
| contenu | chaîne ou tableau | Le contenu du message de l’outil. | Oui | |
| tool_call_id | string | Appel d’outil auquel ce message répond. | Oui |
chatCompletionRequestFunctionMessage
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| role | enum | Le rôle de l’auteur des messages, dans ce cas function.Valeurs possibles : fonction |
Oui | |
| contenu | string | Le contenu du message de fonction. | Oui | |
| name | string | Le nom de la fonction à appeler. | Oui |
Partie de contenu du message système de requête de finalisation de chat
Ce composant peut être l’un des suivants :
chatCompletionRequestUserMessageContentPart
Ce composant peut être l’un des suivants :
chatCompletionRequestAssistantMessageContentPart
Ce composant peut être l’un des suivants :
chatCompletionRequestToolMessageContentPart
Ce composant peut être l’un des suivants :
chatCompletionRequestMessageContentPartText
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| type | enum | Le type de contenu. Valeurs possibles : texte |
Oui | |
| texte | string | Le contenu du texte. | Oui |
chatCompletionRequestMessageContentPartImage
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| type | enum | Le type de contenu. Valeurs possibles : image_url |
Oui | |
| image_url | Objet | Oui |
Propriétés pour image_url
url
| Nom | Catégorie | Description | Par défaut |
|---|---|---|---|
| url | string | Soit une URL de l’image, soit les données d’image encodées en base64. |
detail
| Nom | Catégorie | Description | Par défaut |
|---|---|---|---|
| detail | string | Précise le niveau de détail de l’image. En savoir plus dans le guide Vision. | auto |
chatCompletionRequestMessageContentPartRefusal
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| type | enum | Le type de contenu. Valeurs possibles : refus |
Oui | |
| refusal | string | Le message de refus généré par le modèle. | Oui |
configuration de l'extension de chat Azure
Une représentation des données de configuration pour une seule extension de chat OpenAI d’Azure. Cela sera utilisé par une demande de complétion de chat qui devrait utiliser les extensions de chat OpenAI d’Azure pour renforcer le comportement de réponse. L’utilisation de cette configuration est compatible uniquement avec Azure OpenAI.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| type | azureChatExtensionType | Une représentation des données de configuration pour une seule extension de chat OpenAI d’Azure. Cela sera utilisé par un chat des complétions qui devraient utiliser les extensions de chat OpenAI d’Azure pour compléter le comportement de réponse. L’utilisation de cette configuration est compatible uniquement avec Azure OpenAI. |
Oui |
azureChatExtensionType
Une représentation des données de configuration pour une seule extension de chat OpenAI d’Azure. Cela sera utilisé par une demande de complétion de chat qui devrait utiliser les extensions de chat OpenAI d’Azure pour renforcer le comportement de réponse. L’utilisation de cette configuration est compatible uniquement avec Azure OpenAI.
Description : Représentation des données de configuration pour une seule extension de chat OpenAI Azure. Cela sera utilisé par une demande de complétion de chat qui devrait utiliser les extensions de chat OpenAI d’Azure pour renforcer le comportement de réponse. L’utilisation de cette configuration est compatible uniquement avec Azure OpenAI.
Type : chaîne
Valeur par défaut :
Enum Name : AzureChatExtensionType
Valeurs d’énumération :
| Valeur | Description |
|---|---|
| azure_search | Représente l’utilisation d’Azure Search comme extension de chat OpenAI d’Azure. |
| azure_cosmos_db | Représente l’utilisation d’Azure Cosmos DB comme extension de chat Azure OpenAI. |
Configuration d'extension de chat Azure Search
Une représentation spécifique des options configurables pour Azure Search lorsqu’on l’utilise comme extension de chat OpenAI d’Azure.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| type | azureChatExtensionType | Une représentation des données de configuration pour une seule extension de chat OpenAI d’Azure. Cela sera utilisé par un chat des complétions qui devraient utiliser les extensions de chat OpenAI d’Azure pour compléter le comportement de réponse. L’utilisation de cette configuration est compatible uniquement avec Azure OpenAI. |
Oui | |
| parameters | azureSearchChatExtensionParameters | Paramètres pour Azure Search lorsqu’ils sont utilisés comme extension de chat OpenAI Azure. | Non |
azureSearchChatExtensionParameters
Paramètres pour Azure Search lorsqu’ils sont utilisés comme extension de chat OpenAI Azure.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| Authentification | onYourDataApiKeyAuthenticationOptions ou onVotReDataSystemAssignéGéréIdentitatOptionsAuthenticationOuonVotReDataUtilisateurAssignéGéréIdentitatAuthenticationOptions | Oui | ||
| top_n_documents | entier | Le nombre supérieur configuré de documents à présenter pour la requête configurée. | Non | |
| in_scope | booléen | Est-ce que les requêtes doivent être restreintes à l’utilisation de données indexées. | Non | |
| Rigueur | entier | La stricteur configurée du filtrage de pertinence de recherche. Plus la rigueur est élevée, plus la précision est élevée mais moins la mémoire de la réponse est élevée. | Non | |
| informations_sur_le_rôle | string | Donnez au modèle des instructions sur son comportement et tout contexte auquel il doit se référer lors de la génération d’une réponse. Vous pouvez décrire la personnalité de l’assistant et lui expliquer comment formater les réponses. Il y a une limite de 100 jetons, et cela compte dans la limite globale de jetons. | Non | |
| endpoint | string | Le chemin d’extrémité absolu pour la ressource Azure Search à utiliser. | Oui | |
| nom_de_l'index | string | Le nom de l’index à utiliser tel que disponible dans la ressource Azure Search référencée. | Oui | |
| cartographie des champs | Options de mappage de champs de l'index de recherche Azure | Paramètres optionnels pour contrôler le traitement des champs lors de l’utilisation d’une ressource Azure Search configurée. | Non | |
| type_de_requête | azureSearchQueryType | Le type de requête de recherche Azure qui doit être exécutée lorsqu’on l’utilise comme extension de chat OpenAI Azure. | Non | |
| configuration_sémantique | string | La configuration sémantique supplémentaire pour la requête. | Non | |
| filter | string | Filtre de recherche. | Non | |
| embedding_dependency | onTonDataDataEndpointVectorisationSource ou surVotReDonnéesDéploiementNomVectorisationSource | Non |
Options de mappage de champs de l'index de recherche Azure
Paramètres optionnels pour contrôler le traitement des champs lors de l’utilisation d’une ressource Azure Search configurée.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| champ_titre | string | Le nom du champ index à utiliser comme titre. | Non | |
| url_field | string | Le nom du champ index à utiliser comme URL. | Non | |
| filepath_field | string | Le nom du champ d’index à utiliser comme chemin de fichier. | Non | |
| champs_de_contenu | tableau | Les noms des champs d’index qui doivent être considérés comme du contenu. | Non | |
| séparateur_de_champs_de_contenu | string | Le motif séparateur que les champs de contenu doivent utiliser. | Non | |
| champs vectoriels | tableau | Les noms des champs qui représentent des données vectorielles. | Non |
azureSearchQueryType
Le type de requête de recherche Azure qui doit être exécutée lorsqu’on l’utilise comme extension de chat OpenAI Azure.
Description : Le type de requête de recherche Azure à effectuer lorsqu’il est utilisé comme extension de chat OpenAI Azure.
Type : chaîne
Valeur par défaut :
Enum Name : AzureSearchQueryType
Valeurs d’énumération :
| Valeur | Description |
|---|---|
| simple | Représente le parseur de requête simple par défaut. |
| Sémantique | Représente l’analyseur sémantique de requêtes pour la modélisation sémantique avancée. |
| vector | Représente la recherche vectorielle sur des données calculées. |
| vector_simple_hybrid | Représente une combinaison de la stratégie de requête simple avec des données vectorielles. |
| vecteur_sémantique_hybride | Représente une combinaison de recherche sémantique et d’interrogation de données vectorielles. |
azureCosmosDBChatExtensionConfiguration
Une représentation spécifique des options configurables pour Azure Cosmos DB lorsqu’il est utilisé comme extension de chat Azure OpenAI.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| type | azureChatExtensionType | Une représentation des données de configuration pour une seule extension de chat OpenAI d’Azure. Cela sera utilisé par un chat des complétions qui devraient utiliser les extensions de chat OpenAI d’Azure pour compléter le comportement de réponse. L’utilisation de cette configuration est compatible uniquement avec Azure OpenAI. |
Oui | |
| parameters | azureCosmosDBChatExtensionParameters | Paramètres à utiliser lors de la configuration des extensions de chat Azure OpenAI On Your Data lors de l’utilisation d’Azure Cosmos DB pour MongoDB vCore. |
Non |
azureCosmosDBChatExtensionParameters
Paramètres à utiliser lors de la configuration des extensions de chat Azure OpenAI On Your Data lors de l’utilisation d’Azure Cosmos DB pour MongoDB vCore.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| Authentification | onYourDataConnectionStringAuthenticationOptions | Les options d’authentification pour Azure OpenAI On Your Data lors de l’utilisation d’une chaîne de connexion. | Oui | |
| top_n_documents | entier | Le nombre supérieur configuré de documents à présenter pour la requête configurée. | Non | |
| in_scope | booléen | Est-ce que les requêtes doivent être restreintes à l’utilisation de données indexées. | Non | |
| Rigueur | entier | La stricteur configurée du filtrage de pertinence de recherche. Plus la rigueur est élevée, plus la précision est élevée mais moins la mémoire de la réponse est élevée. | Non | |
| informations_sur_le_rôle | string | Donnez au modèle des instructions sur son comportement et tout contexte auquel il doit se référer lors de la génération d’une réponse. Vous pouvez décrire la personnalité de l’assistant et lui expliquer comment formater les réponses. Il y a une limite de 100 jetons, et cela compte dans la limite globale de jetons. | Non | |
| database_name | string | Le nom de base de données MongoDB vCore à utiliser avec Azure Cosmos DB. | Oui | |
| nom_du_conteneur | string | Le nom du conteneur de ressources Azure Cosmos DB. | Oui | |
| nom_de_l'index | string | Le nom d’index MongoDB vCore à utiliser avec Azure Cosmos DB. | Oui | |
| cartographie des champs | azureCosmosDBFieldMappingOptions | Paramètres optionnels pour contrôler le traitement des champs lors de l’utilisation d’une ressource Azure Cosmos DB configurée. | Oui | |
| embedding_dependency | onTonDataDataEndpointVectorisationSource ou surVotReDonnéesDéploiementNomVectorisationSource | Oui |
azureCosmosDBFieldMappingOptions
Paramètres optionnels pour contrôler le traitement des champs lors de l’utilisation d’une ressource Azure Cosmos DB configurée.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| champ_titre | string | Le nom du champ index à utiliser comme titre. | Non | |
| url_field | string | Le nom du champ index à utiliser comme URL. | Non | |
| filepath_field | string | Le nom du champ d’index à utiliser comme chemin de fichier. | Non | |
| champs_de_contenu | tableau | Les noms des champs d’index qui doivent être considérés comme du contenu. | Oui | |
| séparateur_de_champs_de_contenu | string | Le motif séparateur que les champs de contenu doivent utiliser. | Non | |
| champs vectoriels | tableau | Les noms des champs qui représentent des données vectorielles. | Oui |
surVosOptionsD'AuthentificationDesDonnées
Les options d’authentification pour Azure OpenAI sur vos données.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| type | onYourDataAuthenticationType | Les types d’authentification pris en charge par Azure OpenAI On Your Data. | Oui |
onYourDataAuthenticationType
Les types d’authentification pris en charge par Azure OpenAI On Your Data.
Description : Les types d’authentification pris en charge par Azure OpenAI On Your Data.
Type : chaîne
Valeur par défaut :
Nom d’enum : OnYourDataAuthenticationType
Valeurs d’énumération :
| Valeur | Description |
|---|---|
| Clé API | Authentification via clé API. |
| connection_string | Authentification via chaîne de connexion. |
| identité gérée attribuée par le système | Authentification via une identité managée attribuée au système. |
| identité_gérée_assignée_par_l'utilisateur | Authentification via une identité managée attribuée par l’utilisateur. |
onYourDataApiKeyAuthenticationOptions
Les options d’authentification pour Azure OpenAI On Your Data lors de l’utilisation d’une clé API.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| type | onYourDataAuthenticationType | Les types d’authentification pris en charge par Azure OpenAI On Your Data. | Oui | |
| clé | string | La clé API à utiliser pour l’authentification. | Non |
onYourDataConnectionStringAuthenticationOptions
Les options d’authentification pour Azure OpenAI On Your Data lors de l’utilisation d’une chaîne de connexion.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| type | onYourDataAuthenticationType | Les types d’authentification pris en charge par Azure OpenAI On Your Data. | Oui | |
| connection_string | string | La chaîne de connexion à utiliser pour l’authentification. | Non |
onYourDataSystemAssignedManagedIdentityAuthenticationOptions
Les options d’authentification pour Azure OpenAI On Your Data lors de l’utilisation d’une identité managée attribuée au système.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| type | onYourDataAuthenticationType | Les types d’authentification pris en charge par Azure OpenAI On Your Data. | Oui |
onYourDataUserAssignedManagedIdentityAuthenticationOptions
Les options d’authentification pour Azure OpenAI On Your Data lors de l’utilisation d’une identité managée attribuée par l’utilisateur.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| type | onYourDataAuthenticationType | Les types d’authentification pris en charge par Azure OpenAI On Your Data. | Oui | |
| managed_identity_resource_id | string | L’identifiant de ressource de l’identité managée attribuée par l’utilisateur à utiliser pour l’authentification. | Non |
onYourDataVectorizationSource
Une représentation abstraite d’une source de vectorisation pour Azure OpenAI On Your Data avec recherche vectorielle.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| type | onYourDataVectorizationSourceType | Représente les sources disponibles qu’Azure OpenAI On Your Data peut utiliser pour configurer la vectorisation des données à utiliser avec recherche vectorielle. |
Oui |
onYourDataVectorizationSourceType
Représente les sources disponibles qu’Azure OpenAI On Your Data peut utiliser pour configurer la vectorisation des données à utiliser avec la recherche vectorielle.
Description : Représente les sources disponibles Azure OpenAI On Your Data peut utiliser pour configurer la vectorisation des données à utiliser avec
recherche vectorielle.
Type : chaîne
Valeur par défaut :
Nom d’enum : OnYourDataVectorizationSourceType
Valeurs d’énumération :
| Valeur | Description |
|---|---|
| endpoint | Représente la vectorisation effectuée par des appels de service public vers un modèle d’embedding Azure OpenAI. |
| nom_de_déploiement | Représente un nom de déploiement de modèle Ada à utiliser. Ce déploiement de modèle doit être dans la même ressource Azure OpenAI, mais On Your Data utilisera ce modèle pour le déploiement via un appel interne plutôt qu’un appel public, ce qui permet le vector Cherche même dans des réseaux privés. |
onYourDataDeploymentNameVectorizationSource
Les détails d’une source de vectorisation, utilisée par Azure OpenAI On Your Data lors de l’application de la recherche vectorielle, basée sur un nom de déploiement interne de modèle d’embeddings dans la même ressource Azure OpenAI.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| type | onYourDataVectorizationSourceType | Représente les sources disponibles qu’Azure OpenAI On Your Data peut utiliser pour configurer la vectorisation des données à utiliser avec recherche vectorielle. |
Oui | |
| nom_de_déploiement | string | Spécifie le nom du déploiement du modèle à utiliser pour la vectorisation. Ce déploiement du modèle doit se faire dans la même ressource Azure OpenAI, mais On Your Data utilisera ce déploiement via un appel interne plutôt que public, ce qui permet la recherche vectorielle même dans les réseaux privés. | Non |
onYourDataEndpointVectorizationSource
Les détails d’une source de vectorisation, utilisée par Azure OpenAI On Your Data lors de l’application de la recherche vectorielle, basée sur un appel public d’intégration Azure OpenAI.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| type | onYourDataVectorizationSourceType | Représente les sources disponibles qu’Azure OpenAI On Your Data peut utiliser pour configurer la vectorisation des données à utiliser avec recherche vectorielle. |
Oui | |
| Authentification | onYourDataApiKeyAuthenticationOptions | Les options d’authentification pour Azure OpenAI On Your Data lors de l’utilisation d’une clé API. | Non | |
| endpoint | string | Spécifie le point de terminaison à utiliser pour la vectorisation. Ce point de terminaison doit être dans la même ressource Azure OpenAI, mais On Your Data utilisera ce point via un appel interne plutôt qu’un appel public, ce qui permet la recherche vectorielle même dans les réseaux privés. | Non |
azureChatExtensionsMessageContext
Une représentation des informations contextuelles supplémentaires disponibles lorsque des extensions de chat OpenAI d’Azure sont impliquées dans la génération d’une réponse de complétion de chat correspondante. Ces informations contextuelles ne sont remplies que lorsqu’on utilise une requête OpenAI Azure configurée pour utiliser une extension correspondante.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| citations | tableau | Le résultat de la récupération de la source de données, utilisé pour générer le message de l’assistant dans la réponse. | Non | |
| objectif | string | L’intention détectée dans l’historique du chat, utilisée pour passer au tour suivant afin de transmettre le contexte. | Non |
citation
Informations de citation pour un message de réponse à la fin d’un chat.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| contenu | string | Le contenu de la citation. | Oui | |
| title | string | Le titre de la citation. | Non | |
| url | string | L’URL de la source. | Non | |
| chemin d’accès | string | Le chemin du fichier de la citation. | Non | |
| identifiant_du_segment | string | L’identifiant du bloc de la contravention. | Non |
chatCompletionMessageToolCall
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| ID | string | L’identifiant de l’appel à outils. | Oui | |
| type | toolCallType | Le type d’appel de l’outil, dans ce cas function. |
Oui | |
| function | Objet | La fonction que le modèle a appelée. | Oui |
Propriétés de la fonction
name
| Nom | Catégorie | Description | Par défaut |
|---|---|---|---|
| name | string | Le nom de la fonction à appeler. |
Arguments
| Nom | Catégorie | Description | Par défaut |
|---|---|---|---|
| Arguments | string | Les arguments pour appeler la fonction avec, telle que générée par le modèle au format JSON. Notez que le modèle ne génère pas toujours un JSON valide, et peut générer des paramètres non définis par votre schéma de fonction. Validez les arguments de votre code avant d’appeler votre fonction. |
toolCallType
Le type d’appel de l’outil, dans ce cas function.
Description : Le type d’appel à l’outil, dans ce cas function.
Type : chaîne
Valeur par défaut :
Nom d’enum : ToolCallType
Valeurs d’énumération :
| Valeur | Description |
|---|---|
| function | Le type d’appel d’outil est fonction. |
chatCompletionRequestMessageTool
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| tool_call_id | string | Appel d’outil auquel ce message répond. | Non | |
| contenu | string | Le contenu du message. | Non |
chatCompletionRequestMessageFunction
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| role | enum | Le rôle de l’auteur des messages, dans ce cas function.Valeurs possibles : fonction |
Non | |
| name | string | Le contenu du message. | Non | |
| contenu | string | Le contenu du message. | Non |
createChatCompletionResponse
Représente une réponse de fin de discussion retournée par le modèle, basée sur l’entrée fournie.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| ID | string | Un identifiant unique pour la fin du chat. | Oui | |
| prompt_filter_results | promptFilterResults | Filtrage de contenu pour zéro ou plus d’invites dans la requête. Dans une requête en streaming, les résultats pour différentes invitations peuvent arriver à des moments ou dans des ordres différents. | Non | |
| choix | tableau | Une liste des options pour compléter le chat. Peut être plus d’un si n c’est supérieur à 1. |
Oui | |
| créé | entier | L’horodatage Unix (en quelques secondes) de la création de la fin du chat. | Oui | |
| model | string | Le modèle utilisé pour compléter le chat. | Oui | |
| system_fingerprint | string | Cette empreinte digitale représente la configuration backend avec laquelle le modèle fonctionne. Peut être utilisé conjointement avec le seed paramètre de requête pour comprendre quand des modifications en backend ont été effectuées pouvant impacter le déterminisme. |
Non | |
| Objet | enum | Le type d’objet, qui est toujours chat.completion.Valeurs possibles : chat.completion |
Oui | |
| utilisation | completionUsage | Statistiques d’utilisation pour la demande de complétion. | Non |
createChatCompletionStreamResponse
Représente un segment diffusé d’une réponse de fin de chat retournée par le modèle, basé sur l’entrée fournie.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| ID | string | Un identifiant unique pour la fin du chat. Chaque morceau a le même ID. | Oui | |
| choix | tableau | Une liste des options pour compléter le chat. Peut contenir plus d’un élément si n est supérieur à 1. |
Oui | |
| créé | entier | L’horodatage Unix (en quelques secondes) de la création de la fin du chat. Chaque morceau a le même horodatage. | Oui | |
| model | string | Le modèle pour générer la complétion. | Oui | |
| system_fingerprint | string | Cette empreinte digitale représente la configuration backend avec laquelle le modèle fonctionne. Peut être utilisé conjointement avec le seed paramètre de requête pour comprendre quand des modifications en backend ont été effectuées pouvant impacter le déterminisme. |
Non | |
| Objet | enum | Le type d’objet, qui est toujours chat.completion.chunk.Valeurs possibles : chat.completion.chunk |
Oui |
chatCompletionStreamResponseDelta
Un delta de complétion du chat généré par les réponses du modèle en streaming.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| contenu | string | Le contenu du message du bloc. | Non | |
| function_call | Objet | Déprécié et remplacé par tool_calls. Le nom et les arguments d’une fonction à appeler, tels que générés par le modèle. |
Non | |
| tool_calls | tableau | Non | ||
| role | enum | Le rôle de l’auteur de ce message. Valeurs possibles : système, utilisateur, assistant, outil |
Non | |
| refusal | string | Le message de refus généré par le modèle. | Non |
Propriétés pour function_call
Arguments
| Nom | Catégorie | Description | Par défaut |
|---|---|---|---|
| Arguments | string | Les arguments pour appeler la fonction avec, telle que générée par le modèle au format JSON. Notez que le modèle ne génère pas toujours un JSON valide, et peut générer des paramètres non définis par votre schéma de fonction. Validez les arguments de votre code avant d’appeler votre fonction. |
name
| Nom | Catégorie | Description | Par défaut |
|---|---|---|---|
| name | string | Le nom de la fonction à appeler. |
chatCompletionMessageToolCallChunk
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| index | entier | Oui | ||
| ID | string | L’identifiant de l’appel à outils. | Non | |
| type | enum | Le type d’outil. Actuellement, seul function est pris en charge.Valeurs possibles : fonction |
Non | |
| function | Objet | Non |
Propriétés de la fonction
name
| Nom | Catégorie | Description | Par défaut |
|---|---|---|---|
| name | string | Le nom de la fonction à appeler. |
Arguments
| Nom | Catégorie | Description | Par défaut |
|---|---|---|---|
| Arguments | string | Les arguments pour appeler la fonction avec, telle que générée par le modèle au format JSON. Notez que le modèle ne génère pas toujours un JSON valide, et peut générer des paramètres non définis par votre schéma de fonction. Validez les arguments de votre code avant d’appeler votre fonction. |
chatCompletionStreamOptions
Options pour la réponse en streaming. Ne réglez cela que lorsque vous activez stream: true.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| include_usage | booléen | Si elle est définie, un segment supplémentaire sera diffusé avant le data: [DONE] message. Le usage champ sur ce chunk affiche les statistiques d’utilisation du token pour l’ensemble de la requête, et le choices champ restera toujours un tableau vide. Tous les autres chunks incluront également un usage champ, mais avec une valeur nulle. |
Non |
chatCompletionChoiceLogProbs
Enregistrez les informations de probabilité pour le choix.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| contenu | tableau | Une liste des jetons de contenu des messages avec les informations de probabilité logarithmique. | Oui | |
| refusal | tableau | Une liste de jetons de refus de message avec des informations de probabilité logarithmique. | Non |
chatCompletionTokenLogprob
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| Jeton | string | Jeton. | Oui | |
| logprob | number | La probabilité logarithmique de ce jeton. | Oui | |
| Octets | tableau | Une liste d’entiers représentant la représentation UTF-8 octets du jeton. Utile dans les cas où les caractères sont représentés par plusieurs jetons et où leurs représentations en octets doivent être combinées pour générer la représentation du texte correcte. Cela peut l’être null s’il n’y a pas de représentation en octets pour le jeton. |
Oui | |
| top_logprobs | tableau | Liste des jetons les plus probables et de leur probabilité logarithmique, à cette position de jeton. Dans de rares cas, il peut y avoir moins de top_logprobs demandes retournées. |
Oui |
Message de réponse de complétion de chat
Un message de complétion de chat généré par le modèle.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| role | chatCompletionResponseMessageRole | Le rôle de l’auteur du message de réponse. | Oui | |
| refusal | string | Le message de refus généré par le modèle. | Oui | |
| contenu | string | Le contenu du message. | Oui | |
| tool_calls | tableau | Les appels d’outils générés par le modèle, tels que les appels de fonction. | Non | |
| function_call | chatCompletionFunctionCall | Déprécié et remplacé par tool_calls. Le nom et les arguments d’une fonction à appeler, tels que générés par le modèle. |
Non | |
| context | azureChatExtensionsMessageContext | Une représentation des informations contextuelles supplémentaires disponibles lorsque des extensions de chat OpenAI d’Azure sont impliquées dans la génération d’une réponse correspondante aux complétions de conversation. Cette information de contexte n’est remplie que lorsque en utilisant une requête OpenAI Azure configurée pour utiliser une extension correspondante. |
Non |
chatCompletionResponseMessageRole
Le rôle de l’auteur du message de réponse.
Description : Le rôle de l’auteur du message de réponse.
Type : chaîne
Valeur par défaut :
Valeurs d’énumération :
- assistant
chatCompletionToolChoiceOption
Contrôle quel outil (le cas échéant) est appelé par le modèle.
none cela signifie que le modèle n’appellera aucun outil et générera un message à la place.
auto signifie que le modèle peut choisir entre générer un message ou appeler un ou plusieurs outils.
required signifie que le modèle doit appeler un ou plusieurs outils. Spécifier un outil particulier force {"type": "function", "function": {"name": "my_function"}} le modèle à appeler cet outil.
none est la norme par défaut lorsqu’aucun outil n’est présent.
auto est la norme par défaut si des outils sont présents.
Ce composant peut être l’un des suivants :
chatCompletionNamedToolChoice
Spécifie un outil que le modèle doit utiliser. À utiliser pour forcer le modèle à appeler une fonction spécifique.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| type | enum | Le type d’outil. Actuellement, seul function est pris en charge.Valeurs possibles : fonction |
Oui | |
| function | Objet | Oui |
Propriétés de la fonction
name
| Nom | Catégorie | Description | Par défaut |
|---|---|---|---|
| name | string | Le nom de la fonction à appeler. |
ParallelToolCalls
S’il faut activer l’appel de fonctions parallèles lors de l’utilisation de l’outil.
Aucune propriété définie pour ce composant.
chatCompletionMessageToolCalls
Les appels d’outils générés par le modèle, tels que les appels de fonction.
Aucune propriété définie pour ce composant.
chatCompletionFunctionCall
Déprécié et remplacé par tool_calls. Le nom et les arguments d’une fonction à appeler, tels que générés par le modèle.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| name | string | Le nom de la fonction à appeler. | Oui | |
| Arguments | string | Les arguments pour appeler la fonction avec, telle que générée par le modèle au format JSON. Notez que le modèle ne génère pas toujours un JSON valide, et peut générer des paramètres non définis par votre schéma de fonction. Validez les arguments de votre code avant d’appeler votre fonction. | Oui |
completionUsage
Statistiques d’utilisation pour la demande de complétion.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| prompt_tokens | entier | Nombre de jetons dans la consigne. | Oui | |
| completion_tokens | entier | Nombre de jetons dans la complétion générée. | Oui | |
| total_tokens | entier | Nombre total de jetons utilisés dans la requête (prompt + complétion). | Oui | |
| completion_tokens_details | Objet | Répartition des jetons utilisés dans une complétion. | Non |
Propriétés pour completion_tokens_details
jetons_de_raisonnement
| Nom | Catégorie | Description | Par défaut |
|---|---|---|---|
| jetons_de_raisonnement | entier | Des jetons générés par le modèle pour raisonner. |
chatCompletionTool
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| type | enum | Le type d’outil. Actuellement, seul function est pris en charge.Valeurs possibles : fonction |
Oui | |
| function | FunctionObject | Oui |
FunctionParameters
Les paramètres acceptés par les fonctions sont décrits comme un objet schéma JSON. Voir le guide pour des exemples, ainsi que la référence du schéma JSON pour la documentation sur le format.
Omettre parameters définit une fonction avec une liste de paramètres vide.
Aucune propriété définie pour ce composant.
FunctionObject
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| description | string | Une description de ce que fait la fonction, utilisée par le modèle pour choisir quand et comment appeler la fonction. | Non | |
| name | string | Le nom de la fonction à appeler. Doit être de A à Z, de A à Z, de 0 à 9, ou contenir des sous-traits et des titres, avec une longueur maximale de 64. | Oui | |
| parameters | FunctionParameters | Les paramètres acceptés par les fonctions sont décrits comme un objet schéma JSON.
Voir le guide pour des exemples, ainsi que la référence du schéma JSON pour la documentation sur le format. Omettre parameters définit une fonction avec une liste de paramètres vide. |
Non | |
| strict | booléen | S’il faut activer une stricte adhésion au schéma lors de la génération de l’appel de fonction. Si le modèle est réglé sur true, le modèle suivra exactement le schéma défini dans le parameters champ. Seul un sous-ensemble de JSON Schema est pris en charge lorsque strict est true. |
Non | Faux |
ResponseFormatText
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| type | enum | Le type de format de réponse défini : textValeurs possibles : texte |
Oui |
ResponseFormatJsonObject
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| type | enum | Le type de format de réponse défini : json_objectValeurs possibles : json_object |
Oui |
ResponseFormatJsonSchemaSchema
Le schéma pour le format de réponse est décrit comme un objet de schéma JSON.
Aucune propriété définie pour ce composant.
ResponseFormatJsonSchema
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| type | enum | Le type de format de réponse défini : json_schemaValeurs possibles : json_schema |
Oui | |
| json_schema | Objet | Oui |
Propriétés pour json_schema
description
| Nom | Catégorie | Description | Par défaut |
|---|---|---|---|
| description | string | Une description du format de réponse, utilisée par le modèle pour déterminer comment répondre dans ce format. |
name
| Nom | Catégorie | Description | Par défaut |
|---|---|---|---|
| name | string | Le nom du format de la réponse. Doit être de A à Z, de A à Z, de 0 à 9, ou contenir des sous-traits et des titres, avec une longueur maximale de 64. |
schema
| Nom | Catégorie | Description | Par défaut |
|---|---|---|---|
| schema | ResponseFormatJsonSchemaSchema | Le schéma pour le format de réponse est décrit comme un objet de schéma JSON. |
strict
| Nom | Catégorie | Description | Par défaut |
|---|---|---|---|
| strict | booléen | S’il faut activer une stricte adhésion au schéma lors de la génération de la sortie. Si le modèle est réglé sur vrai, le modèle suivra toujours exactement le schéma défini sur le schema terrain. Seul un sous-ensemble de JSON Schema est pris en charge lorsque strict est true. |
Faux |
chatCompletionChoiceCommon
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| index | entier | Non | ||
| finish_reason | string | Non |
créerDemandeDeTraduction
Demande de traduction.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| fichier | string | Le fichier audio à traduire. | Oui | |
| prompt | string | Un texte optionnel pour guider le style du modèle ou poursuivre un segment audio précédent. Le prompt doit être en anglais. | Non | |
| format_de_réponse | audioResponseFormat | Définit le format de la sortie. | Non | |
| Température | number | La température d’échantillonnage, comprise entre 0 et 1. Des valeurs plus élevées comme 0,8 rendent la sortie plus aléatoire, tandis que des valeurs plus basses comme 0,2 la rendent plus ciblée et déterministe. Si elle est réglée à 0, le modèle utilisera la probabilité logarithmique pour augmenter automatiquement la température jusqu’à atteindre certains seuils. | Non | 0 |
réponse audio
Réponse à la traduction ou à la transcription lorsque response_format était json
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| texte | string | Texte traduit ou transcrit. | Oui |
audioVerboseResponse
Réponse à la traduction ou à la transcription lorsque response_format était verbose_json
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| texte | string | Texte traduit ou transcrit. | Oui | |
| tâche | string | Type de tâche audio. | Non | |
| language | string | Language. | Non | |
| durée | number | Durée. | Non | |
| segments | tableau | Non |
audioResponseFormat
Définit le format de la sortie.
Description : Définit le format de la sortie.
Type : chaîne
Valeur par défaut :
Valeurs d’énumération :
- Json
- texte
- SRT
- verbose_json
- vtt
créerDemandeDeTranscription
Demande de transcription.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| fichier | string | L’objet du fichier audio à transcrire. | Oui | |
| prompt | string | Un texte optionnel pour guider le style du modèle ou poursuivre un segment audio précédent. La consigne doit correspondre au langage audio. | Non | |
| format_de_réponse | audioResponseFormat | Définit le format de la sortie. | Non | |
| Température | number | La température d’échantillonnage, comprise entre 0 et 1. Des valeurs plus élevées comme 0,8 rendent la sortie plus aléatoire, tandis que des valeurs plus basses comme 0,2 la rendent plus ciblée et déterministe. Si elle est réglée à 0, le modèle utilisera la probabilité logarithmique pour augmenter automatiquement la température jusqu’à atteindre certains seuils. | Non | 0 |
| language | string | La langue de l’audio d’entrée. Fournir le langage d’entrée au format ISO-639-1 améliorera la précision et la latence. | Non |
audioSegment
Segment de transcription ou de traduction.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| ID | entier | Identificateur de segment. | Non | |
| Chercher | number | Décalage du segment. | Non | |
| start | number | Décalage de début de segment. | Non | |
| fin | number | Décalage de fin de segment. | Non | |
| texte | string | Texte segmenté. | Non | |
| tokens | tableau | Des symboles du texte. | Non | |
| Température | number | Température. | Non | |
| avg_logprob | number | Probabilité logarithmique moyenne. | Non | |
| compression_ratio | number | Taux de compression. | Non | |
| no_speech_prob | number | Probabilité de no speech. |
Non |
imageQuality
La qualité de l’image qui sera générée.
Description : La qualité de l’image qui sera générée.
Type : chaîne
Valeur par défaut : standard
Nom Enum : Qualité
Valeurs d’énumération :
| Valeur | Description |
|---|---|
| Norme | La qualité standard crée des images avec une qualité standard. |
| hd | La qualité HD crée des images avec des détails plus fins et une plus grande cohérence à travers l’image. |
imagesResponseFormat
Le format dans lequel les images générées sont renvoyées.
Description : Le format dans lequel les images générées sont renvoyées.
Type : chaîne
Valeur par défaut : URL
Nom d’enum : ImagesResponseFormat
Valeurs d’énumération :
| Valeur | Description |
|---|---|
| url | L’URL qui permet un accès temporaire au téléchargement des images générées. |
| b64_json | Les images générées sont retournées sous forme de chaînes encodées en base64. |
taille de l’image
La taille des images générées.
Description : La taille des images générées.
Type : chaîne
Valeur par défaut : 1024x1024
Nom Enum : Taille
Valeurs d’énumération :
| Valeur | Description |
|---|---|
| 1792x1024 | La taille souhaitée de l’image générée est de 1792x1024 pixels. |
| 1024x1792 | La taille souhaitée de l’image générée est de 1024x1792 pixels. |
| 1024x1024 | La taille souhaitée de l’image générée est de 1024x1024 pixels. |
imageStyle
Le style des images générées.
Description : Le style des images générées.
Type : chaîne
Valeur par défaut : vif
Nom Enum : Style
Valeurs d’énumération :
| Valeur | Description |
|---|---|
| vivid | Vivid crée des images hyperréalistes et dramatiques. |
| Naturel | Le naturel crée des images plus naturales et moins hyperréalistes. |
demandeDeGénérationD'Images
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| prompt | string | Une description textuelle de l’image ou des images souhaitées. La longueur maximale est de 4 000 caractères. | Oui | |
| n | entier | Le nombre d’images à générer. | Non | 1 |
| size | imageSize | La taille des images générées. | Non | 1024x1024 |
| format_de_réponse | imagesResponseFormat | Le format dans lequel les images générées sont renvoyées. | Non | url |
| utilisateur | string | Un identifiant unique représentant votre utilisateur final, qui peut aider à surveiller et détecter les abus. | Non | |
| Qualité | imageQuality | La qualité de l’image qui sera générée. | Non | Norme |
| style | imageStyle | Le style des images générées. | Non | vivid |
generateImagesResponse
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| créé | entier | L’horodatage Unix lors de la création de l’opération. | Oui | |
| Données | tableau | Les données de résultat de l’opération, si elles ont réussi | Oui |
résultat d'image
L’URL de l’image ou l’image encodée si elle réussit, et une erreur sinon.
| Nom | Catégorie | Description | Obligatoire | Par défaut |
|---|---|---|---|---|
| url | string | L’URL de l’image. | Non | |
| b64_json | string | L’image codée en base64 | Non | |
| content_filter_results | dalleContentFilterResults | Informations sur les résultats du filtrage de contenu. | Non | |
| revised_prompt | string | La demande utilisée pour générer l’image, s’il y avait une révision de la requête. | Non | |
| prompt_filter_results | dalleFilterResults | Informations sur la catégorie de filtrage de contenu (haine, sexuel, violence, self_harm), si elle a été détectée, ainsi que sur le niveau de gravité (very_low, faible, moyen, élevé qui détermine l’intensité et le niveau de risque du contenu nuisible) et si elle a été filtrée ou non. Informations sur le contenu jailbreak et les jurons, s’ils ont été détectés, et si ils ont été filtrés ou non. Et des informations sur la liste de blocage des clients, si elle a été filtrée et son identifiant. | Non |
Extensions de saisie semi-automatique
Les extensions de complétion ne font pas partie de la dernière version GA de la spécification d'inférence du plan de données OpenAI d'Azure.
Chatmessage
L'objet message Chat ne fait pas partie de la dernière version GA de la spécification d'inférence du plan de données OpenAI d'Azure.
Synthèse vocale (Aperçu)
Ne fait actuellement pas partie de la dernière version Azure OpenAI GA de la spécification d’inférence du plan de données OpenAI Azure. Consultez la dernière version aperçu pour cette fonctionnalité.
Étapes suivantes
Apprenez-en plus sur les modèles et l’ajustement fin avec l’API REST. En savoir plus sur les modèles sous-jacents qui alimentent Azure OpenAI.