Modèles Foundry vendus par Azure

Les Microsoft Foundry Models du catalogue de modèles comprennent deux catégories principales, à savoir Foundry Models vendus par Azure et Foundry Models de partenaires et de la communauté. Cet article répertorie une sélection de modèles Foundry vendus par Azure, ainsi que leurs fonctionnalités, types de déploiement et les régions de disponibilité, à l’exclusion des modèles déconseillés et supprimés. Les modèles Foundry vendus par Azure sont également désignés sous le nom de Direct from Azure Models ou Azure Direct Models.

Les modèles vendus par Azure sont également hébergés par Azure et exploités par Azure dans le cadre du service Foundry Models. Ils incluent tous les modèles OpenAI Azure et les modèles spécifiques, sélectionnés à partir de principaux fournisseurs. Ces modèles sont facturés via votre abonnement Azure, couverts par des contrats de niveau de service Azure et pris en charge par Microsoft. Pour afficher la liste des modèles Foundry pris en charge par le service de l’agent Foundry, consultez Modèles pris en charge par le service d’agent et pour obtenir la liste des modèles Foundry provenant de partenaires, consultez Modèles Foundry provenant de partenaires et de la communauté.

Conseil

Utilisez les onglets en haut de cette page pour basculer entre Azure modèles OpenAI et Other model collections des fournisseurs tels que Cohere, DeepSeek, Meta, Mistral AI et xAI.

Azure OpenAI dans les modèles Foundry de Microsoft

Azure OpenAI est alimenté par un ensemble diversifié de modèles avec différentes fonctionnalités et points de prix. La disponibilité du modèle varie selon la région et le cloud.

Points forts du modèle

Modèles Description
GPT-chat-latest (version préliminaire) NOUVEAUgpt-chat-latestAperçu
Série GPT-5.5 NOUVEAUgpt-5.5
Série GPT-5.4 gpt-5.4-mini, gpt-5.4-nano, gpt-5.4, gpt-5.4-pro
Série GPT-5.3 gpt-5.3-chat, gpt-5.3-codex
Série GPT-5.2 gpt-5.2-codex, , gpt-5.2gpt-5.2-chatpréversion
Série GPT-5.1 gpt-5.1, gpt-5.1-chatpréversion, gpt-5.1-codex, gpt-5.1-codex-mini
Sora NOUVEAU sora-2
Série GPT-5 gpt-5, gpt-5-mini, , gpt-5-nanogpt-5-chat
gpt-oss Modèles de raisonnement à pondération ouverte
codex-mini Version affinée de o4-mini.
Série GPT-4.1 gpt-4.1, gpt-4.1-mini, gpt-4.1-nano
aperçu-utilisation-ordinateur Modèle expérimental conçu pour être utilisé avec l’outil informatique de l’API Responses.
Modèles de série o Modèles de raisonnement avec résolution de problèmes avancées et concentration et capacité accrues.
GPT-4o, GPT-4o mini et GPT-4 Turbo Capables modèles Azure OpenAI avec des versions multimodales, qui peuvent accepter à la fois du texte et des images à titre d’entrée.
Vecteurs d'intégration Ensemble de modèles qui peuvent convertir du texte en forme de vecteur numérique pour faciliter la similarité du texte.
Génération d’images Série de modèles qui peuvent générer des images d’origine à partir du langage naturel.
Video generation Modèle qui peut générer des scènes vidéo d’origine à partir d’instructions textuelles.
Audio Série de modèles pour la reconnaissance vocale, la traduction et la synthèse vocale. Les modèles audio GPT-4o prennent en charge soit des interactions conversationnelles à faible latence (entrée et sortie vocales), soit la génération audio.

GPT-chat-latest

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Capacités

ID de modèle Description Fenêtre de contexte Nombre maximal de jetons de sortie Données d’apprentissage (jusqu’à)
gpt-chat-latest (2026-05-05)
Aperçu
- Raisonnement
- API de complétion de conversation.
- API Réponses.
- Sorties structurées
- Fonctions, outils et appel d’outils parallèles.
128,000

Entrée : 111 616
Sortie : 16,384
16,384 Août 2025

Note

Vous pouvez également voir ce modèle appelé Par OpenAI comme GPT-5.5 Instant ou dans l’API OpenAI en tant que chat-latest. Dans Microsoft Foundry, nous introduisons gpt-chat-latest comme nom de produit pour cette version. Le modèle continue de suivre le cycle de vie de l’aperçu existant et les périodes d’avis standard. Nous évaluons également les façons de simplifier la façon dont les clients accèdent aux modèles mis à jour en continu au fil du temps, mais le comportement actuel reste inchangé au fur et à mesure que ce travail se poursuit.

GPT-5.5

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Capacités

ID de modèle Description Fenêtre de contexte Nombre maximal de jetons de sortie Données d’apprentissage (jusqu’à)
gpt-5.5 (2026-04-24) - Raisonnement
- API Réponses.
- API de complétion de conversation.
- Sorties structurées.
- Traitement du texte et de l’image.
- Fonctions, outils et appel d’outils parallèles.
- Utilisation de l’ordinateur
- Résumé complet des fonctionnalités.
1 050 000 br>
Entrée : 922 000
Sortie : 128,000
128,000 Décembre 2025

Note

Certains niveaux de quota nécessiteront des demandes de quotas pour gpt-5.5 pouvoir déployer ce modèle. Les abonnements de niveau 5 et de niveau 6 ont un quota par défaut.

GPT-5.4

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Capacités

ID de modèle Description Fenêtre de contexte Nombre maximal de jetons de sortie Données d’apprentissage (jusqu’à)
gpt-5.4 (2026-03-05) - Raisonnement
- API Réponses.
- API de complétion de conversation.
- Sorties structurées.
- Traitement du texte et de l’image.
- Fonctions, outils et appel d’outils parallèles.
- Utilisation de l’ordinateur
- Résumé complet des fonctionnalités.
1,050,000 128,000 Août 2025
gpt-5.4-pro (2026-03-05) - Raisonnement
- API Réponses.
- Traitement du texte et de l’image.
- Fonctions &outils
- Résumé complet des fonctionnalités.
1,050,000 128,000 Août 2025
gpt-5.4-mini (2026-03-17) - Raisonnement
- API Réponses.
- API de complétion de conversation.
- Sorties structurées.
- Traitement du texte et de l’image.
- Fonctions, outils et appel d’outils parallèles.
- Utilisation de l’ordinateur
- Résumé complet des fonctionnalités.
400,000

Entrée : 272 000
Sortie : 128,000
128,000 Août 2025
gpt-5.4-nano (2026-03-17) - Raisonnement
- API Réponses.
- API de complétion de conversation.
- Sorties structurées.
- Traitement du texte et de l’image.
- Fonctions, outils et appel d’outils parallèles.
- Résumé complet des fonctionnalités.
400,000

Entrée : 272 000
Sortie : 128,000
128,000 Août 2025

GPT-5.3

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Capacités

ID de modèle Description Fenêtre de contexte Nombre maximal de jetons de sortie Données d’apprentissage (jusqu’à)
gpt-5.3-codex (2026-02-24) - Raisonnement
- API Réponses.
- Sorties structurées.
- Traitement du texte et de l’image.
- Fonctions, outils et appel d’outils parallèles.
- Résumé complet des fonctionnalités.
- Optimisé pour l’extension CLI du Codex & Codex VS Code
400,000

Entrée : 272 000
Sortie : 128,000
128,000 Août 2025
gpt-5.3-chat (2026-03-03)
Aperçu
- API de complétion de conversation.
- API Réponses.
- Sorties structurées
- Fonctions, outils et appel d’outils parallèles.
128,000

Entrée : 111 616
Sortie : 16,384
16,384 Août 2025

GPT-5.2

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Capacités

ID de modèle Description Fenêtre de contexte Nombre maximal de jetons de sortie Données d’apprentissage (jusqu’à)
gpt-5.2-codex (2026-01-14) - Raisonnement
- API Réponses.
- Sorties structurées.
- Traitement du texte et de l’image.
- Fonctions, outils et appel d’outils parallèles.
- Résumé complet des fonctionnalités.
- Optimisé pour l’extension CLI du Codex & Codex VS Code
400,000

Entrée : 272 000
Sortie : 128,000
128,000
gpt-5.2 (2025-12-11) - Raisonnement
- API de complétion de conversation.
- API Réponses.
- Sorties structurées.
- Traitement du texte et de l’image.
- Fonctions, outils et appel d’outils parallèles.
- Résumé complet des fonctionnalités.
400,000

Entrée : 272 000
Sortie : 128,000
128,000 Août 2025
gpt-5.2-chat (2025-12-11)
Aperçu
- API de complétion de conversation.
- API Réponses.
- Sorties structurées
- Fonctions, outils et appel d’outils parallèles.
128,000

Entrée : 111 616
Sortie : 16,384
16,384 Août 2025
gpt-5.2-chat (2026-02-10)
Aperçu
- API de complétion de conversation.
- API Réponses.
- Sorties structurées
- Fonctions, outils et appel d’outils parallèles.
128,000

Entrée : 111 616
Sortie : 16,384
16,384 Août 2025

Attention

Nous vous déconseillons d’utiliser des modèles en préversion en production. Nous allons mettre à niveau tous les déploiements de modèles en préversion vers les versions ultérieures ou vers la dernière version stable et en disponibilité générale. Les modèles désignés en préversion ne suivent pas le cycle de vie standard du modèle Azure OpenAI.

GPT-5.1

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Capacités

ID de modèle Description Fenêtre de contexte Nombre maximal de jetons de sortie Données d’apprentissage (jusqu’à)
gpt-5.1 (2025-11-13) - Raisonnement
- API de complétion de conversation.
- API Réponses.
- Sorties structurées.
- Traitement du texte et de l’image.
- Fonctions, outils et appel d’outils parallèles.
- Résumé complet des fonctionnalités.
400,000

Entrée : 272 000
Sortie : 128,000
128,000 30 septembre 2024
gpt-5.1-chat (2025-11-13)
Aperçu
- Raisonnement
- API de complétion de conversation.
- API Réponses.
- Sorties structurées
- Fonctions, outils et appel d’outils parallèles.
128,000

Entrée : 111 616
Sortie : 16,384
16,384 30 septembre 2024
gpt-5.1-codex (2025-11-13) - API Réponses uniquement.
- Traitement du texte et de l’image
- Sorties structurées.
- Fonctions, outils et appel d’outils parallèles.
- Résumé complet des fonctionnalités
- Optimisé pour l’extension CLI du Codex & Codex VS Code
400,000

Entrée : 272 000
Sortie : 128,000
128,000 30 septembre 2024
gpt-5.1-codex-mini (2025-11-13) - API Réponses uniquement.
- Traitement du texte et de l’image
- Sorties structurées.
- Fonctions, outils et appel d’outils parallèles.
- Résumé complet des fonctionnalités
- Optimisé pour l’extension CLI du Codex & Codex VS Code
400,000

Entrée : 272 000
Sortie : 128,000
128,000 30 septembre 2024
gpt-5.1-codex-max (2025-12-04) - API Réponses uniquement.
- Traitement du texte et de l’image
- Sorties structurées.
- Fonctions, outils et appel d’outils parallèles.
- Résumé complet des fonctionnalités
- Optimisé pour l’extension CLI du Codex & Codex VS Code
400,000

Entrée : 272 000
Sortie : 128,000
128,000 30 septembre 2024

Attention

Nous vous déconseillons d’utiliser des modèles en préversion en production. Nous allons mettre à niveau tous les déploiements de modèles en préversion vers les versions ultérieures ou vers la dernière version stable et en disponibilité générale. Les modèles désignés en préversion ne suivent pas le cycle de vie standard du modèle Azure OpenAI.

Important

  • gpt-5.1 reasoning_effort est défini par défaut sur none. Lors de la mise à niveau des modèles de raisonnement précédents vers gpt-5.1, gardez à l’esprit que vous devrez peut-être mettre à jour votre code pour spécifier explicitement un niveau reasoning_effort si vous souhaitez que le raisonnement ait lieu.

  • gpt-5.1-chat ajoute des fonctionnalités de raisonnement intégrées. Comme d’autres modèles de raisonnement , il ne prend pas en charge les paramètres comme temperature. Si vous effectuez une mise à niveau de l'utilisation de gpt-5-chat (qui n'est pas un modèle de raisonnement) à gpt-5.1-chat, assurez-vous que vous supprimez les paramètres personnalisés comme temperature de votre code qui ne sont pas pris en charge par les modèles de raisonnement.

  • gpt-5.1-codex-max ajoute la prise en charge de la définition reasoning_effort de xhigh. L’effort none de raisonnement n’est pas pris en charge avec gpt-5.1-codex-max.

GPT-5

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Capacités

ID de modèle Description Fenêtre de contexte Nombre maximal de jetons de sortie Données d’apprentissage (jusqu’à)
gpt-5 (2025-08-07) - Raisonnement
- API de complétion de conversation.
- API Réponses.
- Sorties structurées.
- Traitement du texte et de l’image.
- Fonctions, outils et appel d’outils parallèles.
- Résumé complet des fonctionnalités.
400,000

Entrée : 272 000
Sortie : 128,000
128,000 30 septembre 2024
gpt-5-mini (2025-08-07) - Raisonnement
- API de complétion de conversation.
- API Réponses.
- Sorties structurées.
- Traitement du texte et de l’image.
- Fonctions, outils et appel d’outils parallèles.
- Résumé complet des fonctionnalités.
400,000

Entrée : 272 000
Sortie : 128,000
128,000 31 mai 2024
gpt-5-nano (2025-08-07) - Raisonnement
- API de complétion de conversation.
- API Réponses.
- Sorties structurées.
- Traitement du texte et de l’image.
- Fonctions, outils et appel d’outils parallèles.
- Résumé complet des fonctionnalités.
400,000

Entrée : 272 000
Sortie : 128,000
128,000 31 mai 2024
gpt-5-chat (2025-08-07)
Aperçu
- API de complétion de conversation.
- API Réponses.
- Entrée : texte/image
- Sortie : Texte uniquement
128,000 16,384 30 septembre 2024
gpt-5-chat (2025-10-03)
Préversion1
- API de complétion de conversation.
- API Réponses.
- Entrée : texte/image
- Sortie : Texte uniquement
128,000 16,384 30 septembre 2024
gpt-5-codex (2025-09-11) - API Réponses uniquement.
- Entrée : texte/image
- Sortie : Texte uniquement
- Sorties structurées.
- Traitement du texte et de l’image.
- Fonctions, outils et appel d’outils parallèles.
- Résumé complet des fonctionnalités
- Optimisé pour l’extension CLI du Codex & Codex VS Code
400,000

Entrée : 272 000
Sortie : 128,000
128,000 -
gpt-5-pro (2025-10-06) - Raisonnement
- API Réponses.
- Sorties structurées.
- Traitement du texte et de l’image.
- Fonctions et outils
- Résumé complet des fonctionnalités.
400,000

Entrée : 272 000
Sortie : 128,000
128,000 30 septembre 2024

Note

La version gpt-5-chat2025-10-03 présente une amélioration significative axée sur l’intelligence émotionnelle et les capacités de santé mentale. Cette mise à niveau intègre des jeux de données spécialisés et des stratégies de réponse affinées pour améliorer la capacité du modèle à :

  • Comprendre et interpréter le contexte émotionnel plus précisément, ce qui permet des interactions nuancées et empathiques.
  • Fournir des réponses favorables et responsables dans les conversations liées à la santé mentale, en garantissant la sensibilité et l’adhésion aux meilleures pratiques.

Ces améliorations visent à rendre la conversation GPT-5 plus sensible au contexte, centrée sur l’homme et fiable dans les scénarios où les considérations relatives au ton émotionnel et au bien-être sont essentielles.

Attention

Nous vous déconseillons d’utiliser des modèles en préversion en production. Nous allons mettre à niveau tous les déploiements de modèles en préversion vers les versions ultérieures ou vers la dernière version stable et en disponibilité générale. Les modèles désignés en préversion ne suivent pas le cycle de vie standard du modèle Azure OpenAI.

gpt-oss

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Capacités

ID de modèle Description Fenêtre de contexte Nombre maximal de jetons de sortie Données d’apprentissage (jusqu’à)
gpt-oss-120b 1 (préversion) - Texte en entrée/texte en sortie uniquement
- API de complétion de conversations
-Streaming
- Appel de fonction
- Sorties structurées
-Raisonnement
- Disponible pour le déploiement1 et via le calcul managé
131,072 131,072 31 mai 2024
gpt-oss-20b (Préversion) - Texte en entrée/texte en sortie uniquement
- API de complétion de conversations
-Streaming
- Appel de fonction
- Sorties structurées
-Raisonnement
- Disponible via managed compute et Foundry Local
131,072 131,072 31 mai 2024

1 Contrairement aux autres modèles OpenAI Azure gpt-oss-120b nécessite un projet Foundry pour déployer le modèle.

Déployer avec du code

az cognitiveservices account deployment create \
  --name "Foundry-project-resource" \
  --resource-group "test-rg" \
  --deployment-name "gpt-oss-120b" \
  --model-name "gpt-oss-120b" \
  --model-version "1" \
  --model-format "OpenAI-OSS" \
  --sku-capacity 10 \
  --sku-name "GlobalStandard"

Série GPT-4.1

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Capacités

ID de modèle Description Fenêtre de contexte Nombre maximal de jetons de sortie Données d’apprentissage (jusqu’à un certain point)
gpt-4.1 (2025-04-14) - Entrée de texte et d’image
- Sortie de texte
- API de complétions de chat
- API de Réponses
-Streaming
- Appel de fonction
- Sorties structurées (complétions de chat)
- 1,047,576
- 300 000 (déploiements managés standard et provisionnés)
- 128 000 (déploiements par lots)
32,768 31 mai 2024
gpt-4.1-nano (2025-04-14) - Entrée de texte et d’image
- Sortie de texte
- API de complétions de chat
- API de Réponses
-Streaming
- Appel de fonction
- Sorties structurées (complétions de chat)
- 1,047,576
- 300 000 (déploiements managés standard et provisionnés)
- 128 000 (déploiements par lots)
32,768 31 mai 2024
gpt-4.1-mini (2025-04-14) - Entrée de texte et d’image
- Sortie de texte
- API de complétions de chat
- API de Réponses
-Streaming
- Appel de fonction
- Sorties structurées (complétions de chat)
- 1,047,576
- 300 000 (déploiements managés standard et provisionnés)
- 128 000 (déploiements par lots)
32,768 31 mai 2024

Problème connu

Un problème connu affecte tous les modèles de série GPT 4.1. Les définitions d’appel d’outil ou de fonction volumineuses qui dépassent 300 000 jetons entraînent des échecs, même si la limite de 1 million de jetons du contexte des modèles n’a pas été atteinte.

Les erreurs peuvent varier en fonction de l’appel d’API et des caractéristiques de charge utile sous-jacentes.

Voici les messages d’erreur pour l’API Chat Completions :

  • Error code: 400 - {'error': {'message': "This model's maximum context length is 300000 tokens. However, your messages resulted in 350564 tokens (100 in the messages, 350464 in the functions). Please reduce the length of the messages or functions.", 'type': 'invalid_request_error', 'param': 'messages', 'code': 'context_length_exceeded'}}

  • Error code: 400 - {'error': {'message': "Invalid 'tools[0].function.description': string too long. Expected a string with maximum length 1048576, but got a string with length 2778531 instead.", 'type': 'invalid_request_error', 'param': 'tools[0].function.description', 'code': 'string_above_max_length'}}

Voici le message d’erreur de l’API Réponses :

  • Error code: 500 - {'error': {'message': 'The server had an error processing your request. Sorry about that! You can retry your request, or contact us through an Azure support request at: https://go.microsoft.com/fwlink/?linkid=2213926 if you keep seeing this error. (Please include the request ID d2008353-291d-428f-adc1-defb5d9fb109 in your email.)', 'type': 'server_error', 'param': None, 'code': None}}

aperçu de l'utilisation de l'ordinateur

Modèle expérimental conçu pour être utilisé avec l’outil informatique de l’API Responses.

Il peut être utilisé avec des bibliothèques tierces pour permettre au modèle de contrôler l’entrée de la souris et du clavier, tout en obtenant le contexte à partir de captures d’écran de l’environnement actuel.

Attention

Nous vous déconseillons d’utiliser des modèles en préversion en production. Nous allons mettre à niveau tous les déploiements de modèles en préversion vers les versions ultérieures ou vers la dernière version stable et en disponibilité générale. Les modèles désignés en préversion ne suivent pas le cycle de vie standard du modèle Azure OpenAI.

L’inscription est requise pour accéder computer-use-preview. L'accès est accordé en fonction des critères d'éligibilité de Microsoft. Les clients qui ont accès à d’autres modèles d’accès limité doivent toujours demander l’accès pour ce modèle.

Pour demander l’accès, allez à l’computer-use-preview application du modèle d’accès limité. Lorsque l’accès est accordé, vous devez créer un déploiement pour le modèle.

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Capacités

ID de modèle Description Fenêtre de contexte Nombre maximal de jetons de sortie Données d’apprentissage (jusqu’à un certain point)
computer-use-preview (2025-03-11) Modèle spécialisé pour utilisation avec l'outil informatique API Réponses

-Outils
-Streaming
- Texte (entrée/sortie)
- Image (entrée)
8,192 1,024 Octobre 2023

Modèles de série o

Les modèles de série o OpenAI Azure sont conçus pour aborder les tâches de raisonnement et de résolution des problèmes avec une concentration et une capacité accrues. Ces modèles passent plus de temps à traiter et à comprendre la demande de l’utilisateur, ce qui les rend exceptionnellement forts dans des domaines tels que la science, le codage et les mathématiques, par rapport aux itérations précédentes.

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Capacités

ID de modèle Description Demande maximale (jetons) Données d’apprentissage (jusqu’à un certain point)
codex-mini (2025-05-16) Version affinée de o4-mini.
- API Réponses.
- Sorties structurées.
- Traitement du texte et de l’image.
- Fonctions et outils.
Résumé complet des fonctionnalités.
Entrée : 200 000
Sortie : 100 000
31 mai 2024
o3-pro (2025-06-10) - API Réponses.
- Sorties structurées.
- Traitement du texte et de l’image.
- Fonctions et outils.
Résumé complet des fonctionnalités.
Entrée : 200 000
Sortie : 100 000
31 mai 2024
o4-mini (2025-04-16) - Nouveau modèle de raisonnement, offrant des capacités de raisonnement améliorées.
- API de complétion de conversation.
- API Réponses.
- Sorties structurées.
- Traitement du texte et de l’image.
- Fonctions et outils.
Résumé complet des fonctionnalités.
Entrée : 200 000
Sortie : 100 000
31 mai 2024
o3 (2025-04-16) - Nouveau modèle de raisonnement, offrant des capacités de raisonnement améliorées.
- API de complétion de conversation.
- API Réponses.
- Sorties structurées.
- Traitement du texte et de l’image.
- Fonctions, outils et appel d’outils parallèles.
Résumé complet des fonctionnalités.
Entrée : 200 000
Sortie : 100 000
31 mai 2024
o3-mini (2025-01-31) - Capacités de raisonnement améliorées.
- Sorties structurées.
- Traitement de texte uniquement.
- Fonctions et outils.
Entrée : 200 000
Sortie : 100 000
Octobre 2023
o1 (2024-12-17) - Capacités de raisonnement améliorées.
- Sorties structurées.
- Traitement du texte et de l’image.
- Fonctions et outils.
Entrée : 200 000
Sortie : 100 000
Octobre 2023
o1-preview 1 (2024-09-12) Ancienne version préliminaire. Entrée : 128 000
Sortie : 32 768
Octobre 2023
o1-mini 2 (2024-09-12) Une option plus rapide et plus économique dans la série o1, idéale pour les tâches de codage qui nécessitent une vitesse et une consommation de ressources plus faible.
- Déploiement global standard disponible par défaut.
- Les déploiements standard (régionaux) sont actuellement disponibles uniquement pour les clients sélectionnés qui ont reçu l’accès dans le cadre de la o1-preview version d’accès limitée.
Entrée : 128 000
Sortie : 65 536
Octobre 2023

1o1-preview est disponible uniquement pour les clients qui ont obtenu l’accès dans le cadre de l’accès limité d’origine.

2o1-mini est actuellement disponible pour tous les clients pour le déploiement Global Standard. Certains clients se sont vu accorder un accès au déploiement régional standard de o1-mini dans le cadre de la version d'accès limitée o1-preview. À ce stade, l'accès aux o1-mini déploiements standard (régionaux) n'est pas étendu.

o3-deep-research est actuellement disponible uniquement avec le service de l’agent Foundry. Pour en savoir plus, consultez les instructions de l’outil Deep Research.

Pour en savoir plus sur les modèles de série o avancés, consultez Prise en main des modèles de raisonnement.

GPT-4o et GPT-4 Turbo

GPT-4o intègre du texte et des images dans un modèle unique, ce qui lui permet de gérer plusieurs types de données simultanément. Cette approche modale améliore la précision et la réactivité dans les interactions humaines-ordinateurs. GPT-4o correspond à GPT-4 Turbo en texte et en codage en anglais tout en offrant des performances supérieures dans les tâches et les tâches de vision non-anglaises, en définissant de nouveaux benchmarks pour les fonctionnalités d’IA.

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Modèles GPT-4 et GPT-4 Turbo

Ces modèles ne peuvent être utilisés qu’avec l'API des complétions de chat. Consultez Model versions pour en savoir plus sur la façon dont Azure OpenAI gère les mises à niveau des versions du modèle. Consultez Utilisation des modèles pour découvrir comment afficher et configurer les paramètres de version du modèle de vos déploiements GPT-4.

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Capacités

ID de modèle Description Demande maximale (jetons) Données d’apprentissage (jusqu’à un certain point)
gpt-4o (2024-11-20)
GPT-4o (Omni)
- Sorties structurées.
- Traitement du texte et de l’image.
- Mode JSON.
- Appel de fonction parallèle.
- Précision et réactivité améliorées.
- Parité avec le texte anglais et les tâches de codage comparée à GPT-4 Turbo avec Vision.
- Performances supérieures dans les langues autres que l’anglais et dans les tâches de vision.
- Amélioration de la capacité d’écriture créative.
Entrée : 128 000
Sortie : 16,384
Octobre 2023
gpt-4o (2024-08-06)
GPT-4o (Omni)
- Sorties structurées.
- Traitement du texte et de l’image.
- Mode JSON.
- Appel de fonction parallèle.
- Précision et réactivité améliorées.
- Parité avec le texte anglais et les tâches de codage comparée à GPT-4 Turbo avec Vision.
- Performances supérieures dans les langues autres que l’anglais et dans les tâches de vision.
Entrée : 128 000
Sortie : 16,384
Octobre 2023
gpt-4o-mini (2024-07-18)
GPT-4o mini
- Modèle rapide, peu coûteux, idéal pour remplacer les modèles de série GPT-3.5 Turbo.
- Traitement du texte et de l’image.
- Mode JSON.
- Appel de fonction parallèle.
Entrée : 128 000
Sortie : 16,384
Octobre 2023
gpt-4o (2024-05-13)
GPT-4o (Omni)
- Traitement du texte et de l’image.
- Mode JSON.
- Appel de fonction parallèle.
- Précision et réactivité améliorées.
- Parité avec le texte anglais et les tâches de codage comparée à GPT-4 Turbo avec Vision.
- Performances supérieures dans les langues autres que l’anglais et dans les tâches de vision.
Entrée : 128 000
Sortie : 4 096
Octobre 2023
gpt-4 1 (turbo-2024-04-09)
GPT-4 Turbo avec Vision
Nouveau modèle en disponibilité générale.
- Remplacement de tous les modèles d’aperçu GPT-4 précédents (vision-preview, 1106-Preview, 0125-Preview).
- La disponibilité des fonctionnalités est actuellement différente, selon la méthode d’entrée et le type de déploiement.
Entrée : 128 000
Sortie : 4 096
Décembre 2023

1 La version provisionnée de gpt-4 la version turbo-2024-04-09 est actuellement limitée au texte uniquement. Pour plus d’informations sur les déploiements provisionnés, consultez les instructions de provisionnement.

Attention

Nous vous déconseillons d’utiliser des modèles en préversion en production. Nous allons mettre à niveau tous les déploiements de modèles en préversion vers les versions ultérieures ou vers la dernière version stable et en disponibilité générale. Les modèles désignés en préversion ne suivent pas le cycle de vie standard du modèle Azure OpenAI.

Incorporations

text-embedding-3-large est le modèle d’incorporation le plus récent et le plus capable. Vous ne pouvez pas effectuer de mise à niveau entre les modèles d’incorporation. Pour passer de l’utilisation text-embedding-ada-002 à text-embedding-3-large, vous devez générer de nouvelles incorporations.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Capacités

Les rapports d'OpenAI montrent que les tests indiquent que les modèles d'embeddings de troisième génération, tant grands que petits, offrent de meilleures performances moyennes de recherche multilingue avec la référence MIRACL. Ils maintiennent encore la performance pour les tâches en anglais avec le benchmark MTEB.

Benchmark d’évaluation text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
MOYENNE MIRACL 31.4 44.0 54.9
Moyenne MTEB 61.0 62.3 64.6

Les modèles d’incorporation de troisième génération prennent en charge la réduction de la taille de l’incorporation via un nouveau dimensions paramètre. En règle générale, les incorporations plus volumineuses sont plus coûteuses du point de vue du calcul, de la mémoire et du stockage. Lorsque vous pouvez ajuster le nombre de dimensions, vous bénéficiez d’un meilleur contrôle sur les coûts et les performances globaux. Le paramètre dimensions n'est pas pris en charge dans toutes les versions de la bibliothèque openAI 1.x Python. Pour tirer parti de ce paramètre, nous vous recommandons de procéder à la mise à niveau vers la dernière version : pip install openai --upgrade.

Les tests de référence MTEB d’OpenAI ont constaté que même lorsque les dimensions du troisième modèle de génération sont réduites à moins de 1 536 dimensions, text-embeddings-ada-002les performances restent légèrement meilleures.

Ces modèles ne peuvent être utilisés qu’avec les demandes d’API d’incorporation.

ID de modèle Demande maximale (jetons) Dimensions de sortie Données d’apprentissage (jusqu’à un certain point)
text-embedding-ada-002 (version 2) 8,192 1,536 Septembre 2021
text-embedding-ada-002 (version 1) 2,046 1,536 Septembre 2021
text-embedding-3-large 8,192 3,072 Septembre 2021
text-embedding-3-small 8,192 1,536 Septembre 2021

Note

Lorsque vous envoyez un tableau d’entrées pour l’incorporation, le nombre maximal d’éléments d’entrée dans le tableau par appel au point de terminaison d’incorporation est de 2 048.

Modèles de génération d’images

Les modèles de génération d’images génèrent des images à partir d’invites de texte que l’utilisateur fournit. Les modèles de génération d’images incluent gpt-image-1, , gpt-image-1-minigpt-image-1.5et gpt-image-2.

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

ID de modèle Requête maximale (caractères)
gpt-image-1 4,000
gpt-image-1-mini 4,000
gpt-image-1.5 4,000

Modèles de génération de vidéos

Sora est un modèle IA d’OpenAI qui peut créer des scènes vidéo réalistes et imaginatifs à partir d’instructions textuelles. Sora est actuellement en phase de préversion.

Les modèles de génération vidéo incluent sora et sora-2.

ID de modèle Requête maximale (caractères)
Sora 4,000

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Modèles audio

Les modèles audio dans Azure OpenAI sont disponibles via les API realtime, completions et audio.

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Modèles audio GPT-4o

Les modèles audio GPT-4o font partie de la famille de modèles GPT-4o et prennent en charge les interactions conversationnelles de type parole entrante, parole sortante à faible latence ou la génération audio.

Attention

Nous vous déconseillons d’utiliser des modèles en préversion en production. Nous allons mettre à niveau tous les déploiements de modèles en préversion vers les versions ultérieures ou vers la dernière version stable et en disponibilité générale. Les modèles désignés en préversion ne suivent pas le cycle de vie standard du modèle Azure OpenAI.

Les détails sur les jetons de requête maximal et les données d’apprentissage sont disponibles dans le tableau suivant :

ID de modèle Description Demande maximale (jetons) Données d’apprentissage (jusqu’à un certain point)
gpt-4o-mini-audio-preview (2024-12-17)
Aperçu
Modèle audio pour la génération audio et de texte. Entrée : 128 000
Sortie : 16,384
Septembre 2023
gpt-4o-audio-preview (2024-12-17) Modèle audio pour la génération audio et de texte. Entrée : 128 000
Sortie : 16,384
Septembre 2023
gpt-4o-realtime-preview (2025-06-03) Modèle audio pour le traitement audio en temps réel. Entrée : 32 000
Sortie : 4 096
Octobre 2023
gpt-4o-realtime-preview (2024-12-17) Modèle audio pour le traitement audio en temps réel. Entrée : 16 000
Sortie : 4 096
Octobre 2023
gpt-4o-mini-realtime-preview (2024-12-17)
Aperçu
Modèle audio pour le traitement audio en temps réel. Entrée : 128 000
Sortie : 4 096
Octobre 2023
gpt-audio(28/08/2025)
gpt-audio-mini(06-10-2025)
Modèle audio pour la génération audio et de texte. Entrée : 128 00
Sortie : 16,384
Octobre 2023
gpt-realtime (28-08-2025) (GA)
gpt-realtime-mini (2025-10-06)
gpt-realtime-mini (2025-12-15)
Modèle audio pour le traitement audio en temps réel. Entrée : 32 000
Sortie : 4 096
Octobre 2023
gpt-audio-1.5 (2026-02-23) Modèle audio pour la génération audio et de texte. Entrée : 128 00
Sortie : 16,384
Septembre 2024
gpt-realtime-1.5 (2026-02-23) Modèle audio pour le traitement audio en temps réel. Entrée : 32 000
Sortie : 4 096
Septembre 2024
gpt-realtime-2 (2026-05-07) Modèle audio pour le traitement audio en temps réel. Entrée : 32 000
Sortie : 4 096
Septembre 2024

Audio API

Les modèles audio via l’/audio API peuvent être utilisés pour la reconnaissance vocale, la traduction et la synthèse vocale.

Modèles de transcription vocale en texte

ID de modèle Description Demande maximale (taille de fichier audio)
whisper Modèle de reconnaissance vocale à usage général. 25 Mo
gpt-4o-transcribe (2025-03-20)
Aperçu
Modèle de reconnaissance vocale alimenté par GPT-4o. 25 Mo
gpt-4o-mini-transcribe (2025-03-20)
Aperçu
Modèle de reconnaissance vocale alimenté par GPT-4o mini. 25 Mo
gpt-4o-transcribe-diarize (2025-10-15)
Aperçu
Modèle de transcription vocale avec reconnaissance automatique de la parole. 25 Mo
gpt-4o-mini-transcribe (2025-12-15)
Aperçu
Modèle de transcription vocale avec reconnaissance automatique de la parole. Amélioration de la précision et de la robustesse de la transcription. 25 Mo

Modèles de traduction vocale

ID de modèle Description Demande maximale (taille de fichier audio)
whisper Modèle de reconnaissance vocale à usage général. 25 Mo

Modèles de synthèse vocale (aperçu)

ID de modèle Description
tts
Aperçu
Modèle de synthèse vocale optimisé pour la vitesse.
tts-hd
Aperçu
Modèle de synthèse vocale optimisé pour la qualité.
gpt-4o-mini-tts (2025-03-20) Modèle de synthèse vocale alimenté par GPT-4o mini.

Vous pouvez guider la voix pour parler dans un style ou un ton spécifique.
gpt-4o-mini-tts (2025-12-15) Modèle de synthèse vocale alimenté par GPT-4o mini.

Vous pouvez guider la voix pour parler dans un style ou un ton spécifique.

Réglage des modèles

Les modèles suivants sont pris en charge pour le fine-tuning :

ID de modèle Régions standard Mondiale Développeur Méthodes Statut Modalité
gpt-4o-mini
(2024-07-18)
USA Centre Nord
Suède Centre
SFT GA Texte à texte
gpt-4o
(2024-08-06)
Est des États-Unis 2
USA Centre Nord
Suède Centre
SFT, Délégué à la protection des données GA Texte et vision convertis en texte
gpt-4.1
(2025-04-14)
USA Centre Nord
Suède Centre
SFT, Délégué à la protection des données GA Texte et vision convertis en texte
gpt-4.1-mini
(2025-04-14)
USA Centre Nord
Suède Centre
SFT, Délégué à la protection des données GA Texte à texte
gpt-4.1-nano (2025-04-14) USA Centre Nord
Suède Centre
SFT, Délégué à la protection des données GA Texte à texte
o4-mini
(2025-04-16)
Est des États-Unis 2
Suède Centre
RFT GA Texte à texte
gpt-5
(2025-08-07)
USA Centre Nord
Suède Centre
RFT Préversion privée Texte à texte
Ministral-3B
(2411)
Non pris en charge SFT Aperçu public Texte à texte
Qwen-32B Non pris en charge SFT Aperçu public Texte à texte
Llama-3.3-70B-Instruct Non pris en charge SFT Aperçu public Texte à texte
gpt-oss-20b Non pris en charge SFT Aperçu public Texte à texte

Ou vous pouvez ajuster un modèle précédemment affiné, mis en forme comme base-model.ft-{jobid}.

Note

Les modèles open source (Ministral-3B, Qwen-32B, Llama-3.3-70B-Instruct, gpt-oss-20b) ne sont pris en charge que sur les ressources Foundry et dans la nouvelle interface utilisateur de Foundry.

Note

La formation globale offre une formation plus abordable par jeton, mais n’offre pas de résidence des données. Il est actuellement disponible pour les ressources Foundry dans les régions suivantes :

  • Australie Est
  • Brésil Sud
  • Centre du Canada
  • Canada Est
  • USA Est
  • USA Est 2
  • France Central
  • Allemagne Centre-Ouest
  • Italie Nord
  • Japon Est (sans support de vision)
  • Corée Centrale
  • USA Centre Nord
  • Norvège Est
  • Pologne Centre (pas de support 4.1-nano)
  • Asie Sud-Est
  • Afrique du Sud Nord
  • USA Centre Sud
  • Inde sud
  • Espagne Centre
  • Suède Centre
  • Suisse Ouest
  • Suisse Nord
  • Royaume-Uni Sud
  • Europe Ouest
  • USA Ouest
  • USA Ouest 3

Assistants (préversion)

Pour assistants, vous avez besoin d’une combinaison d’un modèle pris en charge et d’une région prise en charge. Certains outils et fonctionnalités nécessitent les derniers modèles. Les modèles suivants sont disponibles dans l’API Assistants, le Kit de développement logiciel (SDK) et Foundry. Le tableau suivant concerne le déploiement standard. Pour plus d’informations sur la disponibilité de l’unité de débit approvisionnée, consultez les modèles de débit approvisionné. Les modèles et régions répertoriés peuvent être utilisés avec assistants v1 et v2. Vous pouvez utiliser des modèles Global Standard s’ils sont pris en charge dans les régions suivantes.

Région gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, 0613 gpt-4, 1106-Aperçu gpt-4, 0125-Aperçu gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613
australiaeast - - - - -
eastus - - - -
eastus2 - - - -
francecentral - - - - - -
japaneast - - - - - - - - -
norwayeast - - - - - - - - - - -
Inde du Sud - - - - - - - - -
swedencentral - -
uksouth - - - - - -
westus - - - - -
westus3 - - - - - -

Mise hors service du modèle

Pour obtenir les informations les plus récentes sur les mises hors service des modèles, reportez-vous à la planification de mise hors service du modèle.

Modèles Black Forest Labs vendus par Azure

Les modèles FLUX Black Forest Labs (BFL) apportent une génération d’images de pointe à Microsoft Foundry, ce qui vous permet de générer et de modifier des images de haute qualité à partir d’invites de texte et d’images de référence. Les modèles FLUX prennent en charge une gamme de fonctionnalités, notamment la génération d'images à partir de texte, la modification d'images à partir de plusieurs références, et la génération et modification contextuelles.

Vous pouvez exécuter ces modèles via l'API fournisseur de services BFL et via les points de terminaison images/générations et images/modifications.

Pour utiliser des modèles FLUX dans Foundry, consultez Deploy et utiliser des modèles FLUX dans Microsoft Foundry.

Modèle Type &point de terminaison d’API Capacités Type de déploiement (disponibilité de la région)
FLUX.2-flex
Aperçu
Génération d’images
- API du fournisseur de services BFL : <resource-name>/providers/blackforestlabs/v1/flux-2-flex
- Entrée : texte et image (32 000 jetons et jusqu’à 10 imagesi)
- Sortie: Une image
- Appel d’outils : Non
- Formats de réponse : Image (PNG et JPG)
- Principales fonctionnalités : contrôle précis ; prise en charge de plusieurs références pour un maximum de 10 images
- Paramètres supplémentaires :
guidance: contrôle à quel point le résultat suit l’invite. Minimum : 1,5, maximum : 10, valeur par défaut : 4,5. Plus élevé = suit l’invite de plus près.
steps: nombre d’étapes d’inférence. Maximum : 50, valeur par défaut : 50. Plus haut = plus de détails, plus lent.
- Standard global (toutes les régions)
FLUX.2-pro
Aperçu
Génération d’images
- API du fournisseur de services BFL : <resource-name>/providers/blackforestlabs/v1/flux-2-pro
- Entrée : texte et image (32 000 jetons et jusqu’à 8 imagesii)
- Sortie: Une image
- Appel d’outils : Non
- Formats de réponse : Image (PNG et JPG)
- Fonctionnalités clés : Prise en charge multi-référence pour jusqu’à 8 images ; plus fondée sur les connaissances réelles ; une plus grande flexibilité de sortie ; performances améliorées
- Paramètres supplémentaires :(Dans l’API spécifique au fournisseur uniquement) prend en charge tous les paramètres.
- Standard global (toutes les régions)
FLUX.1-Kontext-pro
Aperçu
Génération d’images
- API d’image : https://<resource-name>/openai/deployments/{deployment-id}/images/generations
Et
https://<resource-name>/openai/deployments/{deployment-id}/images/edits

- API du fournisseur de services BFL : <resource-name>/providers/blackforestlabs/v1/flux-kontext-pro?api-version=preview
- Entrée : texte et image (5 000 jetons et 1 image)
- Sortie: Une image
- Appel d’outils : Non
- Formats de réponse : Image (PNG et JPG)
- Fonctionnalités clés : Cohérence des caractères, modification avancée
- Paramètres supplémentaires :(Dans l’API spécifique au fournisseur uniquement)seed, aspect ratio, input_image, prompt_unsampling, safety_toleranceoutput_format
- Standard global (toutes les régions)
FLUX-1.1-pro
Aperçu
Génération d’images
- API d’image : https://<resource-name>/openai/deployments/{deployment-id}/images/generations

- API du fournisseur de services BFL : <resource-name>/providers/blackforestlabs/v1/flux-pro-1.1?api-version=preview
- Entrée : texte (5 000 jetons et 1 image)
- Sortie: Une image
- Appel d’outils : Non
- Formats de réponse : Image (PNG et JPG)
- Fonctionnalités clés : Vitesse d’inférence rapide, adhésion rapide forte, tarification concurrentielle, génération évolutive
- Paramètres supplémentaires :(Dans l’API spécifique au fournisseur uniquement)width, height, prompt_unsampling, seed, safety_toleranceoutput_format
- Standard global (toutes les régions)

i,ii La prise en charge de plusieurs images de référence est disponible pour FLUX.2 [pro] (préversion) et FLUX.2 [flex] (préversion) à l’aide de l’API, mais pas dans le terrain de jeu.

Modèles cohésés vendus par Azure

La famille de modèles Cohere comprend différents modèles optimisés pour différents cas d’usage, notamment les complétions de conversation, le reclassement/la classification de texte et les incorporations (embeddings). Les modèles Cohere sont optimisés pour différents cas d’usage qui incluent le raisonnement, la synthèse et la réponse aux questions.

Modèle Type Capacités Type de déploiement (disponibilité de la région)
Cohere-rerank-v4.0-pro classification de texte (réorganisation) - Entrée : texte
- Sortie : texte
- Langues :en, , fr, esit, , , dept-brjazh-cnarvihiruidnl
- Appel d’outils : Non
- Formats de réponse : JSON
- Standard global (toutes les régions)
- Calcul managé
Cohere-rerank-v4.0-fast classification de texte (réorganisation) - Entrée : texte
- Sortie : texte
- Langues :en, , fr, esit, , , dept-brjazh-cnarvihiruidnl
- Appel d’outils : Non
- Formats de réponse : JSON
- Standard global (toutes les régions)
- Calcul managé
Cohere-command-a chat-completion - Entrée : texte (131 072 jetons)
- Sortie : texte (8 182 jetons)
- Langues :en, , fr, esit, de, pt-brjakozh-cnetar
- Appel d’outils : Oui
- Formats de réponse : Texte, JSON
- Standard global (toutes les régions)
embed-v-4-0 incorporations - Entrée : texte (512 jetons) et images (2MM pixels)
- Sortie : Vecteur (256, 512, 1024, 1536 dimensions)
- Langues :en, , fr, esit, de, pt-brjakozh-cnetar
- Standard global (toutes les régions)

Modèles DeepSeek vendus par Azure

La famille DeepSeek de modèles comprend plusieurs modèles de raisonnement, qui excellent au niveau des tâches de raisonnement à l’aide d’un processus de formation pas à pas, tel que le langage, le raisonnement scientifique et les tâches de codage.

Modèle Type Capacités Type de déploiement (disponibilité de la région)
DeepSeek-V4-Pro
Aperçu
chat-completion
(avec le contenu du raisonnement)
- Entrée : texte (1 000 000 jetons)
- Sortie : texte (384 000 jetons)
- Traduction:en Et zh
- Appel d’outils : Non
- Formats de réponse : Texte, JSON
- Standard global (toutes les régions)
DeepSeek-V4-Flash
Aperçu
chat-completion
(avec le contenu du raisonnement)
- Entrée : texte (1 000 000 jetons)
- Sortie : texte (384 000 jetons)
- Traduction:en Et zh
- Appel d’outils : Non
- Formats de réponse : Texte, JSON
- Standard global (toutes les régions)
DeepSeek-V3.2-Speciale
Aperçu
chat-completion
(avec le contenu du raisonnement)
- Entrée : texte (128 000 jetons)
- Sortie : texte (128 000 jetons)
- Traduction:en Et zh
- Appel d’outils : Non
- Formats de réponse : Texte, JSON
- Standard global (toutes les régions)
DeepSeek-V3.2
Aperçu
chat-completion
(avec le contenu du raisonnement)
- Entrée : texte (128 000 jetons)
- Sortie : texte (128 000 jetons)
- Traduction:en Et zh
- Appel d’outils : Non
- Formats de réponse : Texte, JSON
- Standard global (toutes les régions)
DeepSeek-V3.1
Aperçu
chat-completion
(avec le contenu du raisonnement)
- Entrée : texte (131 072 jetons)
- Sortie : texte (131 072 jetons)
- Traduction:en Et zh
- Appel d’outils : Oui
- Formats de réponse : Texte, JSON
- Standard global (toutes les régions)
DeepSeek-R1-0528
Aperçu
chat-completion
(avec le contenu du raisonnement)
- Entrée : texte (163 840 jetons)
- Sortie : texte (163 840 jetons)
- Traduction:en Et zh
- Appel d’outils : Non
- Formats de réponse : Texte
- Standard global (toutes les régions)
- Disponible globalement (toutes les régions)
DeepSeek-V3-0324
Aperçu
chat-completion - Entrée : texte (131 072 jetons)
- Sortie : texte (131 072 jetons)
- Traduction:en Et zh
- Appel d’outils : Oui
- Formats de réponse : Texte, JSON
- Standard global (toutes les régions)
- Disponible globalement (toutes les régions)
DeepSeek-R1 chat-completion
(avec le contenu du raisonnement)
- Entrée : texte (163 840 jetons)
- Sortie : texte (163 840 jetons)
- Traduction:en Et zh
- Appel d’outils : Non
- Formats de réponse : Texte
- Standard global (toutes les régions)
- Disponible globalement (toutes les régions)

Modèles meta vendus par Azure

Les modèles et outils Meta Llama sont une collection de modèles de texte et de raisonnement d’image générés préentraînés et affinés. Les méta-modèles sont mis à l’échelle pour inclure :

  • Petits modèles de langage (SLMs) tels que les modèles 1B et 3B Base et Instruct pour l’inférence sur l’appareil et en périphérie.
  • Modèles de langage de taille moyenne (LLMs) tels que 7B, 8B et 70B Base et Instruct
  • Modèles hautes performances comme Meta Llama 3.1-405B Instruct pour la génération de données synthétiques et les cas d’usage de la distillation.
Modèle Type Capacités Type de déploiement (disponibilité de la région)
Llama-4-Maverick-17B-128E-Instruct-FP8
Aperçu
chat-completion - Entrée : texte et images (jetons 1M)
- Sortie : texte (1 000 000 jetons)
- Langues :ar, , en, fr, dehiiditptestlthvi
- Appel d’outils : Non
- Formats de réponse : Texte
- Standard global (toutes les régions)
Llama-3.3-70B-Instruct
Aperçu
chat-completion - Entrée : texte (128 000 jetons)
- Sortie : texte (8 192 jetons)
- Langues :en, , de, frit, pt, hi, es, etth
- Appel d’outils : Non
- Formats de réponse : Texte
- Standard global (toutes les régions)
- Disponible globalement (toutes les régions)

Plusieurs modèles meta sont également disponibles auprès des partenaires et de la communauté.

modèles Microsoft vendus par Azure

Les modèles Microsoft incluent différents groupes de modèles tels que le modèle Routeur, les modèles MAI, les modèles Phi, les modèles d'IA pour les soins de santé, etc. Plusieurs modèles Microsoft sont également disponibles par les partenaires et la communauté.

Pour utiliser MAI-Image-2e et MAI-Image-2 modèles de génération de texte à image dans Foundry, consultez Déployer et utiliser des modèles MAI dans Microsoft Foundry.

Modèle Type Capacités Type de déploiement (disponibilité de la région)
MAI-Image-2e
Aperçu
Texte à image. Pour plus d’informations, consultez le point de terminaison de l’API . - Entrée : texte
- Sortie: Une image
- Longueur du contexte : 32 000 tokens
- Appel d’outils : Non
- Formats de réponse : Image (PNG)
- Traduction:en
- Fonctionnalités clés : Génération de texte à image de haute qualité ; synthèse d’images photoréalistes avec une structure visuelle cohérente ; adapté aux images de produits, aux visuels marketing, aux ressources de marque et aux flux de travail créatifs commerciaux.
- Paramètres :width, , heightprompt
Minimum 768×768 pixels ; nombre maximal de pixels 1 048 576 (équivalent à 1024×1024). L’une ou l’autre dimension peut dépasser 1024 tant que le nombre total de pixels reste dans la limite (par exemple, 768×1365).
- Standard global (USA Centre Ouest, USA Est, USA Ouest, Europe Ouest, Suède Centre, Inde Sud)
MAI-Image-2
Aperçu
Texte à image. Pour plus d’informations, consultez le point de terminaison de l’API . - Entrée : texte
- Sortie: Une image
- Longueur du contexte : 32 000 tokens
- Appel d’outils : Non
- Formats de réponse : Image (PNG)
- Traduction:en
- Fonctionnalités clés : Génération de texte à image de haute qualité ; synthèse d’images photoréalistes avec une structure visuelle cohérente ; adapté aux images de produits, aux visuels marketing, aux ressources de marque et aux flux de travail créatifs commerciaux.
- Paramètres :width, , heightprompt
Minimum 768×768 pixels ; nombre maximal de pixels 1 048 576 (équivalent à 1024×1024). L’une ou l’autre dimension peut dépasser 1024 tant que le nombre total de pixels reste dans la limite (par exemple, 768×1365).
- Standard global (USA Centre Ouest, USA Est, USA Ouest, Europe Ouest, Suède Centre, Inde Sud)
model-router 1 chat-completion Plus d'informations dans l'aperçu du modèle de routeur.
- Entrée : texte, image
- Sortie : texte (nombre maximal de jetons de sortie varie de2)
Fenêtre contextuelle : 200 0003
- Traduction:en
- Standard global (USA Est 2, Suède Centre)
– Zone de données standard4 (USA Est 2, Suède Centre)

Version du modèle de routeur2025-11-18. Les versions antérieures (2025-08-07 et 2025-05-19) sont également disponibles.

2Le nombre de jetons de sortie maximum varie pour les modèles sous-jacents dans le routeur de modèle. Par exemple, 32 768 (GPT-4.1 series), 100 000 (o4-mini), 128 000 (gpt-5 reasoning models) et 16 384 (gpt-5-chat).

3Fenêtres contextuelles plus volumineuses sont compatibles avec certains des modèles sous-jacents du routeur de modèle. Cela signifie qu’un appel d’API avec un contexte plus large réussit uniquement si l’invite est acheminée vers l’un de ces modèles. Sinon, l’appel échoue.

4 La facturation des déploiements de routeurs de modèle standard de zone de données ne commence pas plus tôt que le 1er novembre 2025.

Modèles Mistral vendus par Azure

Modèle Type Capacités Type de déploiement (disponibilité de la région)
mistral-document-ai-2512 Image à texte - Entrée : images ou pages PDF (30 pages, fichier PDF max. 30 Mo)
- Sortie : texte
- Traduction:en
- Appel d’outils : non
- Formats de réponse : Texte, JSON, Markdown
- Standard global (toutes les régions)
- Norme de zone de données (États-Unis et UE)
mistral-document-ai-2505
Aperçu
Image à texte - Entrée : images ou pages PDF (30 pages, fichier PDF max. 30 Mo)
- Sortie : texte
- Traduction:en
- Appel d’outils : non
- Formats de réponse : Texte, JSON, Markdown
- Standard global (toutes les régions)
- Norme de zone de données (États-Unis et UE)
Mistral-Large-3
Aperçu
chat-completion - Entrée : texte, image
- Sortie : texte
- Langues :en, , fr, de, esitptnlzhjakoar
- Appel d’outils : Oui
- Formats de réponse : Texte, JSON
- Standard global (toutes les régions)
- Norme de zone de données (États-Unis et UE)

Plusieurs modèles Mistral sont également disponibles auprès des partenaires et de la communauté.

Modèles IA Moonshot vendus par Azure

Les modèles IA Moonshot incluent Kimi K2.6 (aperçu) et Kimi K2.5 (aperçu), des modèles de raisonnement multimodal qui acceptent des textes et des images.

Modèle Type Capacités Type de déploiement (disponibilité de la région)
Kimi-K2.6
Aperçu
chat-completion
(avec le contenu du raisonnement)
- Entrée : texte et image (262 144 jetons)
- Résultat : texte (262 144 jetons)
- Traduction:en Et zh
- Appel d’outils : Oui
- Formats de réponse : Texte
- Standard global (toutes les régions)
Kimi-K2.5
Aperçu
chat-completion
(avec le contenu du raisonnement)
- Entrée : texte et image (262 144 jetons)
- Résultat : texte (262 144 jetons)
- Traduction:en Et zh
- Appel d’outils : Oui
- Formats de réponse : Texte
- Standard global (toutes les régions)

Consultez cette collection de modèles dans le portail Foundry.

Modèles xAI vendus par Azure

Les modèles Grok de xAI dans Les modèles Foundry incluent un ensemble diversifié de modèles de raisonnement et de non-raisonnement conçus pour les cas d’usage d’entreprise tels que l’extraction de données, le codage, la synthèse de texte et les applications agentiques.

L’inscription est requise pour l’accès àgrok-code-fast-1 la Version Préliminaire et grok-4.

Modèle Type Capacités Type de déploiement (disponibilité de la région)
grok-4.3
Aperçu
chat-completion - Entrée : texte (200 000 jetons)
- Sortie : texte (8 192 jetons)
- Traduction:en
- Appel d’outils : oui
- Formats de réponse : texte
- Standard global (toutes les régions)
grok-4-20-reasoning
Aperçu
chat-completion - Entrée : texte (262 000 jetons)
- Sortie : texte (8 192 jetons)
- Traduction:en
- Appel d’outils : oui
- Formats de réponse : texte
- Standard global (toutes les régions)
grok-4-20-non-reasoning
Aperçu
chat-completion - Entrée : texte (262 000 jetons)
- Sortie : texte (8 192 jetons)
- Traduction:en
- Appel d’outils : oui
- Formats de réponse : texte
- Standard global (toutes les régions)
grok-4.1-fast-reasoning
Aperçu
chat-completion - Entrée : texte, image (128 000 jetons)
- Sortie : texte (128 000 jetons)
- Traduction:en
- Appel d’outils : oui
- Formats de réponse : texte
- Standard global (toutes les régions)
grok-4.1-fast-non-reasoning
Aperçu
chat-completion - Entrée : texte, image (128 000 jetons)
- Sortie : texte (128 000 jetons)
- Traduction:en
- Appel d’outils : oui
- Formats de réponse : texte
- Standard global (toutes les régions)
grok-4 chat-completion - Entrée : texte (262 000 jetons)
- Sortie : texte (8 192 jetons)
- Traduction:en
- Appel d’outils : oui
- Formats de réponse : texte
- Standard global (toutes les régions)
grok-code-fast-1
Aperçu
chat-completion - Entrée : texte (256 000 jetons)
- Sortie : texte (8 192 jetons)
- Traduction:en
- Appel d’outils : oui
- Formats de réponse : texte
- Standard global (toutes les régions)

Disponibilité de la région de modèle par type de déploiement

Microsoft Foundry fournit aux clients des choix sur la structure d’hébergement qui correspond à leurs modèles d’entreprise et d’utilisation. Le service propose deux catégories de déploiement principales :

  • Standard : dispose d’une option de déploiement globale, le routage du trafic globalement pour fournir un débit plus élevé.
  • Provisioned : offre également une option de déploiement globale, permettant aux clients d’acheter et de déployer des unités de débit approvisionnées sur Azure infrastructure mondiale.

D’autres catégories de déploiement, comme batch , sont également disponibles. Pour en savoir plus sur tous les types de déploiement de modèles disponibles, consultez Types de déploiement pour Microsoft modèles Foundry.

Disponibilité globale du modèle Standard

Région FLUX.2-flex FLUX.2-pro FLUX.1-Kontext-pro FLUX-1.1-pro Cohere-rerank-v4.0-pro Cohere-rerank-v4.0-fast cohere-command-a embed-v-4-0 DeepSeek-V3.2-Speciale DeepSeek-V3.2 DeepSeek-V3.1 DeepSeek-R1-0528 DeepSeek-V3-0324 DeepSeek-R1 Llama-4-Maverick-17B-128E-Instruct-FP8 Llama-3.3-70B-Instruct MAI-Image-2 model-router mistral-document-ai-2512 mistral-document-ai-2505 Mistral-Large-3 Kimi-K2.5 grok-4-1-raisonnement-rapide grok-4-1-fast-non-reasoning grok-4-fast-reasoning grok-4-fast-non-reasoning grok-3 grok-3-mini
australiaeast - -
brésilsouth - -
canadacentral - -
canadaeast - -
centralus - -
eastus -
eastus2 -
francecentral - -
allemagnewestcentral - -
italynorth - -
japaneast - -
Japon Ouest - -
koreacentral - -
northcentralus - -
norwayeast - -
polognecentral - -
southafricanorth - -
southcentralus - -
Inde du Sud -
spaincentral - -
swedencentral
SuisseNord - -
switzerlandwest - -
uaenorth - -
uksouth - -
westcentralus -
westeurope -
westus -
westus2 - -
westus3 - -