Modèles Foundry vendus par Azure

Les Microsoft Foundry Models du catalogue de modèles comprennent deux catégories principales, à savoir Foundry Models vendus par Azure et Foundry Models de partenaires et de la communauté. Cet article répertorie une sélection de modèles Foundry vendus par Azure, ainsi que leurs fonctionnalités, types de déploiement et les régions de disponibilité, à l’exclusion des modèles déconseillés et supprimés. Les modèles Foundry vendus par Azure sont également désignés sous le nom de Direct from Azure Models ou Azure Direct Models.

Les modèles vendus par Azure sont également hébergés par Azure et exploités par Azure dans le cadre du service Foundry Models. Ils incluent tous les modèles OpenAI Azure et les modèles spécifiques, sélectionnés à partir de principaux fournisseurs. Ces modèles sont facturés via votre abonnement Azure, couverts par des contrats de niveau de service Azure et pris en charge par Microsoft. Pour afficher la liste des modèles Foundry pris en charge par le service de l’agent Foundry, consultez Modèles pris en charge par le service d’agent et pour obtenir la liste des modèles Foundry provenant de partenaires, consultez Modèles Foundry provenant de partenaires et de la communauté.

Conseil

Utilisez les onglets en haut de cette page pour basculer entre Azure modèles OpenAI et Other model collections des fournisseurs tels que Cohere, DeepSeek, Meta, Mistral AI et xAI.

Azure OpenAI dans les modèles Foundry de Microsoft

Azure OpenAI est alimenté par un ensemble diversifié de modèles avec différentes fonctionnalités et points de prix. La disponibilité du modèle varie selon la région et le cloud.

Pour consulter la disponibilité par région d’Azure OpenAI dans les modèles Microsoft Foundry regroupés par catégorie de déploiement, consultez Disponibilité par région des modèles Foundry vendus par Azure.
Pour la disponibilité des modèles dans Azure Government, reportez-vous à Azure OpenAI dans Azure Government.

Points forts du modèle

Modèles	Description
GPT-chat-latest (version préliminaire)	NOUVEAU`gpt-chat-latest`Aperçu
Série GPT-5.5	NOUVEAU`gpt-5.5`
Série GPT-5.4	`gpt-5.4-mini`, `gpt-5.4-nano`, `gpt-5.4`, `gpt-5.4-pro`
Série GPT-5.3	`gpt-5.3-chat`, `gpt-5.3-codex`
Série GPT-5.2	`gpt-5.2-codex`, , `gpt-5.2gpt-5.2-chat`préversion
Série GPT-5.1	`gpt-5.1`, `gpt-5.1-chat`préversion, `gpt-5.1-codex`, `gpt-5.1-codex-mini`
Sora	NOUVEAU sora-2
Série GPT-5	`gpt-5`, `gpt-5-mini`, , `gpt-5-nanogpt-5-chat`
gpt-oss	Modèles de raisonnement à pondération ouverte
codex-mini	Version affinée de `o4-mini`.
Série GPT-4.1	`gpt-4.1`, `gpt-4.1-mini`, `gpt-4.1-nano`
aperçu-utilisation-ordinateur	Modèle expérimental conçu pour être utilisé avec l’outil informatique de l’API Responses.
Modèles de série o	Modèles de raisonnement avec résolution de problèmes avancées et concentration et capacité accrues.
GPT-4o, GPT-4o mini et GPT-4 Turbo	Capables modèles Azure OpenAI avec des versions multimodales, qui peuvent accepter à la fois du texte et des images à titre d’entrée.
Vecteurs d'intégration	Ensemble de modèles qui peuvent convertir du texte en forme de vecteur numérique pour faciliter la similarité du texte.
Génération d’images	Série de modèles qui peuvent générer des images d’origine à partir du langage naturel.
`Video generation`	Modèle qui peut générer des scènes vidéo d’origine à partir d’instructions textuelles.
Audio	Série de modèles pour la reconnaissance vocale, la traduction et la synthèse vocale. Les modèles audio GPT-4o prennent en charge soit des interactions conversationnelles à faible latence (entrée et sortie vocales), soit la génération audio.

GPT-chat-latest

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Capacités

ID de modèle	Description	Fenêtre de contexte	Nombre maximal de jetons de sortie	Données d’apprentissage (jusqu’à)
`gpt-chat-latest` (2026-05-05) Aperçu	- Raisonnement - API de complétion de conversation. - API Réponses. - Sorties structurées - Fonctions, outils et appel d’outils parallèles.	128,000 Entrée : 111 616 Sortie : 16,384	16,384	Août 2025

Note

Vous pouvez également voir ce modèle appelé Par OpenAI comme GPT-5.5 Instant ou dans l’API OpenAI en tant que chat-latest. Dans Microsoft Foundry, nous introduisons gpt-chat-latest comme nom de produit pour cette version. Le modèle continue de suivre le cycle de vie de l’aperçu existant et les périodes d’avis standard. Nous évaluons également les façons de simplifier la façon dont les clients accèdent aux modèles mis à jour en continu au fil du temps, mais le comportement actuel reste inchangé au fur et à mesure que ce travail se poursuit.

GPT-5.5

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Capacités

ID de modèle	Description	Fenêtre de contexte	Nombre maximal de jetons de sortie	Données d’apprentissage (jusqu’à)
`gpt-5.5` (2026-04-24)	- Raisonnement - API Réponses. - API de complétion de conversation. - Sorties structurées. - Traitement du texte et de l’image. - Fonctions, outils et appel d’outils parallèles. - Utilisation de l’ordinateur - Résumé complet des fonctionnalités.	1 050 000 br> Entrée : 922 000 Sortie : 128,000	128,000	Décembre 2025

Note

Certains niveaux de quota nécessiteront des demandes de quotas pour gpt-5.5 pouvoir déployer ce modèle. Les abonnements de niveau 5 et de niveau 6 ont un quota par défaut.

GPT-5.4

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Capacités

ID de modèle	Description	Fenêtre de contexte	Nombre maximal de jetons de sortie	Données d’apprentissage (jusqu’à)
`gpt-5.4` (2026-03-05)	- Raisonnement - API Réponses. - API de complétion de conversation. - Sorties structurées. - Traitement du texte et de l’image. - Fonctions, outils et appel d’outils parallèles. - Utilisation de l’ordinateur - Résumé complet des fonctionnalités.	1,050,000	128,000	Août 2025
`gpt-5.4-pro` (2026-03-05)	- Raisonnement - API Réponses. - Traitement du texte et de l’image. - Fonctions &outils - Résumé complet des fonctionnalités.	1,050,000	128,000	Août 2025
`gpt-5.4-mini` (2026-03-17)	- Raisonnement - API Réponses. - API de complétion de conversation. - Sorties structurées. - Traitement du texte et de l’image. - Fonctions, outils et appel d’outils parallèles. - Utilisation de l’ordinateur - Résumé complet des fonctionnalités.	400,000 Entrée : 272 000 Sortie : 128,000	128,000	Août 2025
`gpt-5.4-nano` (2026-03-17)	- Raisonnement - API Réponses. - API de complétion de conversation. - Sorties structurées. - Traitement du texte et de l’image. - Fonctions, outils et appel d’outils parallèles. - Résumé complet des fonctionnalités.	400,000 Entrée : 272 000 Sortie : 128,000	128,000	Août 2025

GPT-5.3

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Capacités

ID de modèle	Description	Fenêtre de contexte	Nombre maximal de jetons de sortie	Données d’apprentissage (jusqu’à)
`gpt-5.3-codex` (2026-02-24)	- Raisonnement - API Réponses. - Sorties structurées. - Traitement du texte et de l’image. - Fonctions, outils et appel d’outils parallèles. - Résumé complet des fonctionnalités. - Optimisé pour l’extension CLI du Codex & Codex VS Code	400,000 Entrée : 272 000 Sortie : 128,000	128,000	Août 2025
`gpt-5.3-chat` (2026-03-03) Aperçu	- API de complétion de conversation. - API Réponses. - Sorties structurées - Fonctions, outils et appel d’outils parallèles.	128,000 Entrée : 111 616 Sortie : 16,384	16,384	Août 2025

GPT-5.2

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Capacités

ID de modèle	Description	Fenêtre de contexte	Nombre maximal de jetons de sortie	Données d’apprentissage (jusqu’à)
`gpt-5.2-codex` (2026-01-14)	- Raisonnement - API Réponses. - Sorties structurées. - Traitement du texte et de l’image. - Fonctions, outils et appel d’outils parallèles. - Résumé complet des fonctionnalités. - Optimisé pour l’extension CLI du Codex & Codex VS Code	400,000 Entrée : 272 000 Sortie : 128,000	128,000
`gpt-5.2` (2025-12-11)	- Raisonnement - API de complétion de conversation. - API Réponses. - Sorties structurées. - Traitement du texte et de l’image. - Fonctions, outils et appel d’outils parallèles. - Résumé complet des fonctionnalités.	400,000 Entrée : 272 000 Sortie : 128,000	128,000	Août 2025
`gpt-5.2-chat` (2025-12-11) Aperçu	- API de complétion de conversation. - API Réponses. - Sorties structurées - Fonctions, outils et appel d’outils parallèles.	128,000 Entrée : 111 616 Sortie : 16,384	16,384	Août 2025
`gpt-5.2-chat` (2026-02-10) Aperçu	- API de complétion de conversation. - API Réponses. - Sorties structurées - Fonctions, outils et appel d’outils parallèles.	128,000 Entrée : 111 616 Sortie : 16,384	16,384	Août 2025

Attention

Nous vous déconseillons d’utiliser des modèles en préversion en production. Nous allons mettre à niveau tous les déploiements de modèles en préversion vers les versions ultérieures ou vers la dernière version stable et en disponibilité générale. Les modèles désignés en préversion ne suivent pas le cycle de vie standard du modèle Azure OpenAI.

GPT-5.1

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Capacités

ID de modèle	Description	Fenêtre de contexte	Nombre maximal de jetons de sortie	Données d’apprentissage (jusqu’à)
`gpt-5.1` (2025-11-13)	- Raisonnement - API de complétion de conversation. - API Réponses. - Sorties structurées. - Traitement du texte et de l’image. - Fonctions, outils et appel d’outils parallèles. - Résumé complet des fonctionnalités.	400,000 Entrée : 272 000 Sortie : 128,000	128,000	30 septembre 2024
`gpt-5.1-chat` (2025-11-13) Aperçu	- Raisonnement - API de complétion de conversation. - API Réponses. - Sorties structurées - Fonctions, outils et appel d’outils parallèles.	128,000 Entrée : 111 616 Sortie : 16,384	16,384	30 septembre 2024
`gpt-5.1-codex` (2025-11-13)	- API Réponses uniquement. - Traitement du texte et de l’image - Sorties structurées. - Fonctions, outils et appel d’outils parallèles. - Résumé complet des fonctionnalités - Optimisé pour l’extension CLI du Codex & Codex VS Code	400,000 Entrée : 272 000 Sortie : 128,000	128,000	30 septembre 2024
`gpt-5.1-codex-mini` (2025-11-13)	- API Réponses uniquement. - Traitement du texte et de l’image - Sorties structurées. - Fonctions, outils et appel d’outils parallèles. - Résumé complet des fonctionnalités - Optimisé pour l’extension CLI du Codex & Codex VS Code	400,000 Entrée : 272 000 Sortie : 128,000	128,000	30 septembre 2024
`gpt-5.1-codex-max` (2025-12-04)	- API Réponses uniquement. - Traitement du texte et de l’image - Sorties structurées. - Fonctions, outils et appel d’outils parallèles. - Résumé complet des fonctionnalités - Optimisé pour l’extension CLI du Codex & Codex VS Code	400,000 Entrée : 272 000 Sortie : 128,000	128,000	30 septembre 2024

Attention

Important

gpt-5.1 reasoning_effort est défini par défaut sur none. Lors de la mise à niveau des modèles de raisonnement précédents vers gpt-5.1, gardez à l’esprit que vous devrez peut-être mettre à jour votre code pour spécifier explicitement un niveau reasoning_effort si vous souhaitez que le raisonnement ait lieu.
gpt-5.1-chat ajoute des fonctionnalités de raisonnement intégrées. Comme d’autres modèles de raisonnement , il ne prend pas en charge les paramètres comme temperature. Si vous effectuez une mise à niveau de l'utilisation de gpt-5-chat (qui n'est pas un modèle de raisonnement) à gpt-5.1-chat, assurez-vous que vous supprimez les paramètres personnalisés comme temperature de votre code qui ne sont pas pris en charge par les modèles de raisonnement.
gpt-5.1-codex-max ajoute la prise en charge de la définition reasoning_effort de xhigh. L’effort none de raisonnement n’est pas pris en charge avec gpt-5.1-codex-max.

GPT-5

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Capacités

ID de modèle	Description	Fenêtre de contexte	Nombre maximal de jetons de sortie	Données d’apprentissage (jusqu’à)
`gpt-5` (2025-08-07)	- Raisonnement - API de complétion de conversation. - API Réponses. - Sorties structurées. - Traitement du texte et de l’image. - Fonctions, outils et appel d’outils parallèles. - Résumé complet des fonctionnalités.	400,000 Entrée : 272 000 Sortie : 128,000	128,000	30 septembre 2024
`gpt-5-mini` (2025-08-07)	- Raisonnement - API de complétion de conversation. - API Réponses. - Sorties structurées. - Traitement du texte et de l’image. - Fonctions, outils et appel d’outils parallèles. - Résumé complet des fonctionnalités.	400,000 Entrée : 272 000 Sortie : 128,000	128,000	31 mai 2024
`gpt-5-nano` (2025-08-07)	- Raisonnement - API de complétion de conversation. - API Réponses. - Sorties structurées. - Traitement du texte et de l’image. - Fonctions, outils et appel d’outils parallèles. - Résumé complet des fonctionnalités.	400,000 Entrée : 272 000 Sortie : 128,000	128,000	31 mai 2024
`gpt-5-chat` (2025-08-07) Aperçu	- API de complétion de conversation. - API Réponses. - Entrée : texte/image - Sortie : Texte uniquement	128,000	16,384	30 septembre 2024
`gpt-5-chat` (2025-10-03) Préversion¹	- API de complétion de conversation. - API Réponses. - Entrée : texte/image - Sortie : Texte uniquement	128,000	16,384	30 septembre 2024
`gpt-5-codex` (2025-09-11)	- API Réponses uniquement. - Entrée : texte/image - Sortie : Texte uniquement - Sorties structurées. - Traitement du texte et de l’image. - Fonctions, outils et appel d’outils parallèles. - Résumé complet des fonctionnalités - Optimisé pour l’extension CLI du Codex & Codex VS Code	400,000 Entrée : 272 000 Sortie : 128,000	128,000	-
`gpt-5-pro` (2025-10-06)	- Raisonnement - API Réponses. - Sorties structurées. - Traitement du texte et de l’image. - Fonctions et outils - Résumé complet des fonctionnalités.	400,000 Entrée : 272 000 Sortie : 128,000	128,000	30 septembre 2024

Note

La version gpt-5-chat2025-10-03 présente une amélioration significative axée sur l’intelligence émotionnelle et les capacités de santé mentale. Cette mise à niveau intègre des jeux de données spécialisés et des stratégies de réponse affinées pour améliorer la capacité du modèle à :

Comprendre et interpréter le contexte émotionnel plus précisément, ce qui permet des interactions nuancées et empathiques.
Fournir des réponses favorables et responsables dans les conversations liées à la santé mentale, en garantissant la sensibilité et l’adhésion aux meilleures pratiques.

Ces améliorations visent à rendre la conversation GPT-5 plus sensible au contexte, centrée sur l’homme et fiable dans les scénarios où les considérations relatives au ton émotionnel et au bien-être sont essentielles.

Attention

gpt-oss

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Capacités

ID de modèle	Description	Fenêtre de contexte	Nombre maximal de jetons de sortie	Données d’apprentissage (jusqu’à)
`gpt-oss-120b` ¹ (préversion)	- Texte en entrée/texte en sortie uniquement - API de complétion de conversations -Streaming - Appel de fonction - Sorties structurées -Raisonnement - Disponible pour le déploiement¹ et via le calcul managé	131,072	131,072	31 mai 2024
`gpt-oss-20b` (Préversion)	- Texte en entrée/texte en sortie uniquement - API de complétion de conversations -Streaming - Appel de fonction - Sorties structurées -Raisonnement - Disponible via managed compute et Foundry Local	131,072	131,072	31 mai 2024

¹ Contrairement aux autres modèles OpenAI Azure gpt-oss-120b nécessite un projet Foundry pour déployer le modèle.

Déployer avec du code

az cognitiveservices account deployment create \
  --name "Foundry-project-resource" \
  --resource-group "test-rg" \
  --deployment-name "gpt-oss-120b" \
  --model-name "gpt-oss-120b" \
  --model-version "1" \
  --model-format "OpenAI-OSS" \
  --sku-capacity 10 \
  --sku-name "GlobalStandard"

Série GPT-4.1

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Capacités

ID de modèle	Description	Fenêtre de contexte	Nombre maximal de jetons de sortie	Données d’apprentissage (jusqu’à un certain point)
`gpt-4.1` (2025-04-14)	- Entrée de texte et d’image - Sortie de texte - API de complétions de chat - API de Réponses -Streaming - Appel de fonction - Sorties structurées (complétions de chat)	- 1,047,576 - 300 000 (déploiements managés standard et provisionnés) - 128 000 (déploiements par lots)	32,768	31 mai 2024
`gpt-4.1-nano` (2025-04-14)	- Entrée de texte et d’image - Sortie de texte - API de complétions de chat - API de Réponses -Streaming - Appel de fonction - Sorties structurées (complétions de chat)	- 1,047,576 - 300 000 (déploiements managés standard et provisionnés) - 128 000 (déploiements par lots)	32,768	31 mai 2024
`gpt-4.1-mini` (2025-04-14)	- Entrée de texte et d’image - Sortie de texte - API de complétions de chat - API de Réponses -Streaming - Appel de fonction - Sorties structurées (complétions de chat)	- 1,047,576 - 300 000 (déploiements managés standard et provisionnés) - 128 000 (déploiements par lots)	32,768	31 mai 2024

Problème connu

Un problème connu affecte tous les modèles de série GPT 4.1. Les définitions d’appel d’outil ou de fonction volumineuses qui dépassent 300 000 jetons entraînent des échecs, même si la limite de 1 million de jetons du contexte des modèles n’a pas été atteinte.

Les erreurs peuvent varier en fonction de l’appel d’API et des caractéristiques de charge utile sous-jacentes.

Voici les messages d’erreur pour l’API Chat Completions :

Error code: 400 - {'error': {'message': "This model's maximum context length is 300000 tokens. However, your messages resulted in 350564 tokens (100 in the messages, 350464 in the functions). Please reduce the length of the messages or functions.", 'type': 'invalid_request_error', 'param': 'messages', 'code': 'context_length_exceeded'}}
Error code: 400 - {'error': {'message': "Invalid 'tools[0].function.description': string too long. Expected a string with maximum length 1048576, but got a string with length 2778531 instead.", 'type': 'invalid_request_error', 'param': 'tools[0].function.description', 'code': 'string_above_max_length'}}

Voici le message d’erreur de l’API Réponses :

Error code: 500 - {'error': {'message': 'The server had an error processing your request. Sorry about that! You can retry your request, or contact us through an Azure support request at: https://go.microsoft.com/fwlink/?linkid=2213926 if you keep seeing this error. (Please include the request ID d2008353-291d-428f-adc1-defb5d9fb109 in your email.)', 'type': 'server_error', 'param': None, 'code': None}}

aperçu de l'utilisation de l'ordinateur

Modèle expérimental conçu pour être utilisé avec l’outil informatique de l’API Responses.

Il peut être utilisé avec des bibliothèques tierces pour permettre au modèle de contrôler l’entrée de la souris et du clavier, tout en obtenant le contexte à partir de captures d’écran de l’environnement actuel.

Attention

L’inscription est requise pour accéder computer-use-preview. L'accès est accordé en fonction des critères d'éligibilité de Microsoft. Les clients qui ont accès à d’autres modèles d’accès limité doivent toujours demander l’accès pour ce modèle.

Pour demander l’accès, allez à l’computer-use-preview application du modèle d’accès limité. Lorsque l’accès est accordé, vous devez créer un déploiement pour le modèle.

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Capacités

ID de modèle	Description	Fenêtre de contexte	Nombre maximal de jetons de sortie	Données d’apprentissage (jusqu’à un certain point)
`computer-use-preview` (2025-03-11)	Modèle spécialisé pour utilisation avec l'outil informatique API Réponses -Outils -Streaming - Texte (entrée/sortie) - Image (entrée)	8,192	1,024	Octobre 2023

Modèles de série o

Les modèles de série o OpenAI Azure sont conçus pour aborder les tâches de raisonnement et de résolution des problèmes avec une concentration et une capacité accrues. Ces modèles passent plus de temps à traiter et à comprendre la demande de l’utilisateur, ce qui les rend exceptionnellement forts dans des domaines tels que la science, le codage et les mathématiques, par rapport aux itérations précédentes.

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Capacités

ID de modèle	Description	Demande maximale (jetons)	Données d’apprentissage (jusqu’à un certain point)
`codex-mini` (2025-05-16)	Version affinée de `o4-mini`. - API Réponses. - Sorties structurées. - Traitement du texte et de l’image. - Fonctions et outils. Résumé complet des fonctionnalités.	Entrée : 200 000 Sortie : 100 000	31 mai 2024
`o3-pro` (2025-06-10)	- API Réponses. - Sorties structurées. - Traitement du texte et de l’image. - Fonctions et outils. Résumé complet des fonctionnalités.	Entrée : 200 000 Sortie : 100 000	31 mai 2024
`o4-mini` (2025-04-16)	- Nouveau modèle de raisonnement, offrant des capacités de raisonnement améliorées. - API de complétion de conversation. - API Réponses. - Sorties structurées. - Traitement du texte et de l’image. - Fonctions et outils. Résumé complet des fonctionnalités.	Entrée : 200 000 Sortie : 100 000	31 mai 2024
`o3` (2025-04-16)	- Nouveau modèle de raisonnement, offrant des capacités de raisonnement améliorées. - API de complétion de conversation. - API Réponses. - Sorties structurées. - Traitement du texte et de l’image. - Fonctions, outils et appel d’outils parallèles. Résumé complet des fonctionnalités.	Entrée : 200 000 Sortie : 100 000	31 mai 2024
`o3-mini` (2025-01-31)	- Capacités de raisonnement améliorées. - Sorties structurées. - Traitement de texte uniquement. - Fonctions et outils.	Entrée : 200 000 Sortie : 100 000	Octobre 2023
`o1` (2024-12-17)	- Capacités de raisonnement améliorées. - Sorties structurées. - Traitement du texte et de l’image. - Fonctions et outils.	Entrée : 200 000 Sortie : 100 000	Octobre 2023
`o1-preview` ¹ (2024-09-12)	Ancienne version préliminaire.	Entrée : 128 000 Sortie : 32 768	Octobre 2023
`o1-mini` ² (2024-09-12)	Une option plus rapide et plus économique dans la série o1, idéale pour les tâches de codage qui nécessitent une vitesse et une consommation de ressources plus faible. - Déploiement global standard disponible par défaut. - Les déploiements standard (régionaux) sont actuellement disponibles uniquement pour les clients sélectionnés qui ont reçu l’accès dans le cadre de la `o1-preview` version d’accès limitée.	Entrée : 128 000 Sortie : 65 536	Octobre 2023

¹o1-preview est disponible uniquement pour les clients qui ont obtenu l’accès dans le cadre de l’accès limité d’origine.

²o1-mini est actuellement disponible pour tous les clients pour le déploiement Global Standard. Certains clients se sont vu accorder un accès au déploiement régional standard de o1-mini dans le cadre de la version d'accès limitée o1-preview. À ce stade, l'accès aux o1-mini déploiements standard (régionaux) n'est pas étendu.

o3-deep-research est actuellement disponible uniquement avec le service de l’agent Foundry. Pour en savoir plus, consultez les instructions de l’outil Deep Research.

Pour en savoir plus sur les modèles de série o avancés, consultez Prise en main des modèles de raisonnement.

GPT-4o et GPT-4 Turbo

GPT-4o intègre du texte et des images dans un modèle unique, ce qui lui permet de gérer plusieurs types de données simultanément. Cette approche modale améliore la précision et la réactivité dans les interactions humaines-ordinateurs. GPT-4o correspond à GPT-4 Turbo en texte et en codage en anglais tout en offrant des performances supérieures dans les tâches et les tâches de vision non-anglaises, en définissant de nouveaux benchmarks pour les fonctionnalités d’IA.

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Modèles GPT-4 et GPT-4 Turbo

Ces modèles ne peuvent être utilisés qu’avec l'API des complétions de chat. Consultez Model versions pour en savoir plus sur la façon dont Azure OpenAI gère les mises à niveau des versions du modèle. Consultez Utilisation des modèles pour découvrir comment afficher et configurer les paramètres de version du modèle de vos déploiements GPT-4.

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Capacités

ID de modèle	Description	Demande maximale (jetons)	Données d’apprentissage (jusqu’à un certain point)
`gpt-4o` (2024-11-20) GPT-4o (Omni)	- Sorties structurées. - Traitement du texte et de l’image. - Mode JSON. - Appel de fonction parallèle. - Précision et réactivité améliorées. - Parité avec le texte anglais et les tâches de codage comparée à GPT-4 Turbo avec Vision. - Performances supérieures dans les langues autres que l’anglais et dans les tâches de vision. - Amélioration de la capacité d’écriture créative.	Entrée : 128 000 Sortie : 16,384	Octobre 2023
`gpt-4o` (2024-08-06) GPT-4o (Omni)	- Sorties structurées. - Traitement du texte et de l’image. - Mode JSON. - Appel de fonction parallèle. - Précision et réactivité améliorées. - Parité avec le texte anglais et les tâches de codage comparée à GPT-4 Turbo avec Vision. - Performances supérieures dans les langues autres que l’anglais et dans les tâches de vision.	Entrée : 128 000 Sortie : 16,384	Octobre 2023
`gpt-4o-mini` (2024-07-18) GPT-4o mini	- Modèle rapide, peu coûteux, idéal pour remplacer les modèles de série GPT-3.5 Turbo. - Traitement du texte et de l’image. - Mode JSON. - Appel de fonction parallèle.	Entrée : 128 000 Sortie : 16,384	Octobre 2023
`gpt-4o` (2024-05-13) GPT-4o (Omni)	- Traitement du texte et de l’image. - Mode JSON. - Appel de fonction parallèle. - Précision et réactivité améliorées. - Parité avec le texte anglais et les tâches de codage comparée à GPT-4 Turbo avec Vision. - Performances supérieures dans les langues autres que l’anglais et dans les tâches de vision.	Entrée : 128 000 Sortie : 4 096	Octobre 2023
`gpt-4` ¹ (turbo-2024-04-09) GPT-4 Turbo avec Vision	Nouveau modèle en disponibilité générale. - Remplacement de tous les modèles d’aperçu GPT-4 précédents (`vision-preview`, `1106-Preview`, `0125-Preview`). - La disponibilité des fonctionnalités est actuellement différente, selon la méthode d’entrée et le type de déploiement.	Entrée : 128 000 Sortie : 4 096	Décembre 2023

¹ La version provisionnée de gpt-4 la version turbo-2024-04-09 est actuellement limitée au texte uniquement. Pour plus d’informations sur les déploiements provisionnés, consultez les instructions de provisionnement.

Attention

Incorporations

text-embedding-3-large est le modèle d’incorporation le plus récent et le plus capable. Vous ne pouvez pas effectuer de mise à niveau entre les modèles d’incorporation. Pour passer de l’utilisation text-embedding-ada-002 à text-embedding-3-large, vous devez générer de nouvelles incorporations.

text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Capacités

Les rapports d'OpenAI montrent que les tests indiquent que les modèles d'embeddings de troisième génération, tant grands que petits, offrent de meilleures performances moyennes de recherche multilingue avec la référence MIRACL. Ils maintiennent encore la performance pour les tâches en anglais avec le benchmark MTEB.

Benchmark d’évaluation	`text-embedding-ada-002`	`text-embedding-3-small`	`text-embedding-3-large`
MOYENNE MIRACL	31.4	44.0	54.9
Moyenne MTEB	61.0	62.3	64.6

Les modèles d’incorporation de troisième génération prennent en charge la réduction de la taille de l’incorporation via un nouveau dimensions paramètre. En règle générale, les incorporations plus volumineuses sont plus coûteuses du point de vue du calcul, de la mémoire et du stockage. Lorsque vous pouvez ajuster le nombre de dimensions, vous bénéficiez d’un meilleur contrôle sur les coûts et les performances globaux. Le paramètre dimensions n'est pas pris en charge dans toutes les versions de la bibliothèque openAI 1.x Python. Pour tirer parti de ce paramètre, nous vous recommandons de procéder à la mise à niveau vers la dernière version : pip install openai --upgrade.

Les tests de référence MTEB d’OpenAI ont constaté que même lorsque les dimensions du troisième modèle de génération sont réduites à moins de 1 536 dimensions, text-embeddings-ada-002les performances restent légèrement meilleures.

Ces modèles ne peuvent être utilisés qu’avec les demandes d’API d’incorporation.

ID de modèle	Demande maximale (jetons)	Dimensions de sortie	Données d’apprentissage (jusqu’à un certain point)
`text-embedding-ada-002` (version 2)	8,192	1,536	Septembre 2021
`text-embedding-ada-002` (version 1)	2,046	1,536	Septembre 2021
`text-embedding-3-large`	8,192	3,072	Septembre 2021
`text-embedding-3-small`	8,192	1,536	Septembre 2021

Note

Lorsque vous envoyez un tableau d’entrées pour l’incorporation, le nombre maximal d’éléments d’entrée dans le tableau par appel au point de terminaison d’incorporation est de 2 048.

Modèles de génération d’images

Les modèles de génération d’images génèrent des images à partir d’invites de texte que l’utilisateur fournit. Les modèles de génération d’images incluent gpt-image-1, , gpt-image-1-minigpt-image-1.5et gpt-image-2.

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

ID de modèle	Requête maximale (caractères)
`gpt-image-1`	4,000
`gpt-image-1-mini`	4,000
`gpt-image-1.5`	4,000

Modèles de génération de vidéos

Sora est un modèle IA d’OpenAI qui peut créer des scènes vidéo réalistes et imaginatifs à partir d’instructions textuelles. Sora est actuellement en phase de préversion.

Les modèles de génération vidéo incluent sora et sora-2.

ID de modèle	Requête maximale (caractères)
Sora	4,000

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Modèles audio

Les modèles audio dans Azure OpenAI sont disponibles via les API realtime, completions et audio.

Pour connaître la disponibilité des modèles dans toutes les régions, regroupées par catégorie de déploiement, consultez Disponibilité des modèles Foundry vendus par Azure.

Modèles audio GPT-4o

Les modèles audio GPT-4o font partie de la famille de modèles GPT-4o et prennent en charge les interactions conversationnelles de type parole entrante, parole sortante à faible latence ou la génération audio.

Attention

Les détails sur les jetons de requête maximal et les données d’apprentissage sont disponibles dans le tableau suivant :

ID de modèle	Description	Demande maximale (jetons)	Données d’apprentissage (jusqu’à un certain point)
`gpt-4o-mini-audio-preview` (2024-12-17) Aperçu	Modèle audio pour la génération audio et de texte.	Entrée : 128 000 Sortie : 16,384	Septembre 2023
`gpt-4o-audio-preview` (2024-12-17)	Modèle audio pour la génération audio et de texte.	Entrée : 128 000 Sortie : 16,384	Septembre 2023
`gpt-4o-realtime-preview` (2025-06-03)	Modèle audio pour le traitement audio en temps réel.	Entrée : 32 000 Sortie : 4 096	Octobre 2023
`gpt-4o-realtime-preview` (2024-12-17)	Modèle audio pour le traitement audio en temps réel.	Entrée : 16 000 Sortie : 4 096	Octobre 2023
`gpt-4o-mini-realtime-preview` (2024-12-17) Aperçu	Modèle audio pour le traitement audio en temps réel.	Entrée : 128 000 Sortie : 4 096	Octobre 2023
`gpt-audio`(28/08/2025) `gpt-audio-mini`(06-10-2025)	Modèle audio pour la génération audio et de texte.	Entrée : 128 00 Sortie : 16,384	Octobre 2023
`gpt-realtime` (28-08-2025) (GA) `gpt-realtime-mini` (2025-10-06) `gpt-realtime-mini` (2025-12-15)	Modèle audio pour le traitement audio en temps réel.	Entrée : 32 000 Sortie : 4 096	Octobre 2023
`gpt-audio-1.5` (2026-02-23)	Modèle audio pour la génération audio et de texte.	Entrée : 128 00 Sortie : 16,384	Septembre 2024
`gpt-realtime-1.5` (2026-02-23)	Modèle audio pour le traitement audio en temps réel.	Entrée : 32 000 Sortie : 4 096	Septembre 2024
`gpt-realtime-2` (2026-05-07)	Modèle audio pour le traitement audio en temps réel.	Entrée : 32 000 Sortie : 4 096	Septembre 2024

Audio API

Les modèles audio via l’/audio API peuvent être utilisés pour la reconnaissance vocale, la traduction et la synthèse vocale.

Modèles de transcription vocale en texte

ID de modèle	Description	Demande maximale (taille de fichier audio)
`whisper`	Modèle de reconnaissance vocale à usage général.	25 Mo
`gpt-4o-transcribe` (2025-03-20) Aperçu	Modèle de reconnaissance vocale alimenté par GPT-4o.	25 Mo
`gpt-4o-mini-transcribe` (2025-03-20) Aperçu	Modèle de reconnaissance vocale alimenté par GPT-4o mini.	25 Mo
`gpt-4o-transcribe-diarize` (2025-10-15) Aperçu	Modèle de transcription vocale avec reconnaissance automatique de la parole.	25 Mo
`gpt-4o-mini-transcribe` (2025-12-15) Aperçu	Modèle de transcription vocale avec reconnaissance automatique de la parole. Amélioration de la précision et de la robustesse de la transcription.	25 Mo

Modèles de traduction vocale

ID de modèle	Description	Demande maximale (taille de fichier audio)
`whisper`	Modèle de reconnaissance vocale à usage général.	25 Mo

Modèles de synthèse vocale (aperçu)

ID de modèle	Description
`tts` Aperçu	Modèle de synthèse vocale optimisé pour la vitesse.
`tts-hd` Aperçu	Modèle de synthèse vocale optimisé pour la qualité.
`gpt-4o-mini-tts` (2025-03-20)	Modèle de synthèse vocale alimenté par GPT-4o mini. Vous pouvez guider la voix pour parler dans un style ou un ton spécifique.
`gpt-4o-mini-tts` (2025-12-15)	Modèle de synthèse vocale alimenté par GPT-4o mini. Vous pouvez guider la voix pour parler dans un style ou un ton spécifique.

Réglage des modèles

Les modèles suivants sont pris en charge pour le fine-tuning :

ID de modèle	Régions standard	Mondiale	Développeur	Méthodes	Statut	Modalité
`gpt-4o-mini` (2024-07-18)	USA Centre Nord Suède Centre	✅	✅	SFT	GA	Texte à texte
`gpt-4o` (2024-08-06)	Est des États-Unis 2 USA Centre Nord Suède Centre	✅	✅	SFT, Délégué à la protection des données	GA	Texte et vision convertis en texte
`gpt-4.1` (2025-04-14)	USA Centre Nord Suède Centre	✅	✅	SFT, Délégué à la protection des données	GA	Texte et vision convertis en texte
`gpt-4.1-mini` (2025-04-14)	USA Centre Nord Suède Centre	✅	✅	SFT, Délégué à la protection des données	GA	Texte à texte
`gpt-4.1-nano` (2025-04-14)	USA Centre Nord Suède Centre	✅	✅	SFT, Délégué à la protection des données	GA	Texte à texte
`o4-mini` (2025-04-16)	Est des États-Unis 2 Suède Centre	✅	❌	RFT	GA	Texte à texte
`gpt-5` (2025-08-07)	USA Centre Nord Suède Centre	✅	✅	RFT	Préversion privée	Texte à texte
`Ministral-3B` (2411)	Non pris en charge	✅	❌	SFT	Aperçu public	Texte à texte
`Qwen-32B`	Non pris en charge	✅	❌	SFT	Aperçu public	Texte à texte
`Llama-3.3-70B-Instruct`	Non pris en charge	✅	❌	SFT	Aperçu public	Texte à texte
`gpt-oss-20b`	Non pris en charge	✅	❌	SFT	Aperçu public	Texte à texte

Ou vous pouvez ajuster un modèle précédemment affiné, mis en forme comme base-model.ft-{jobid}.

Note

Les modèles open source (Ministral-3B, Qwen-32B, Llama-3.3-70B-Instruct, gpt-oss-20b) ne sont pris en charge que sur les ressources Foundry et dans la nouvelle interface utilisateur de Foundry.

Note

La formation globale offre une formation plus abordable par jeton, mais n’offre pas de résidence des données. Il est actuellement disponible pour les ressources Foundry dans les régions suivantes :

Australie Est
Brésil Sud
Centre du Canada
Canada Est
USA Est
USA Est 2
France Central
Allemagne Centre-Ouest
Italie Nord
Japon Est (sans support de vision)
Corée Centrale
USA Centre Nord
Norvège Est
Pologne Centre (pas de support 4.1-nano)
Asie Sud-Est
Afrique du Sud Nord
USA Centre Sud
Inde sud
Espagne Centre
Suède Centre
Suisse Ouest
Suisse Nord
Royaume-Uni Sud
Europe Ouest
USA Ouest
USA Ouest 3

Assistants (préversion)

Pour assistants, vous avez besoin d’une combinaison d’un modèle pris en charge et d’une région prise en charge. Certains outils et fonctionnalités nécessitent les derniers modèles. Les modèles suivants sont disponibles dans l’API Assistants, le Kit de développement logiciel (SDK) et Foundry. Le tableau suivant concerne le déploiement standard. Pour plus d’informations sur la disponibilité de l’unité de débit approvisionnée, consultez les modèles de débit approvisionné. Les modèles et régions répertoriés peuvent être utilisés avec assistants v1 et v2. Vous pouvez utiliser des modèles Global Standard s’ils sont pris en charge dans les régions suivantes.

Région	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4, 0613	gpt-4, 1106-Aperçu	gpt-4, 0125-Aperçu	gpt-4, turbo-2024-04-09	gpt-4-32k, 0613	gpt-35-turbo, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125	gpt-35-turbo-16k, 0613
australiaeast	-	-	-	✅	✅	-	-	✅	✅	✅	✅	✅
eastus	✅	✅	✅	-	-	✅	✅	-	✅	-	✅	✅
eastus2	✅	✅	✅	-	✅	-	✅	-	✅	-	✅	✅
francecentral	-	-	-	✅	✅	-	-	✅	✅	✅	-	✅
japaneast	-	-	-	-	-	-	-	-	✅	-	✅	✅
norwayeast	-	-	-	-	✅	-	-	-	-	-	-	-
Inde du Sud	-	-	-	-	✅	-	-	-	-	✅	✅	-
swedencentral	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	-	✅
uksouth	-	-	-	-	✅	✅	-	-	✅	✅	✅	✅
westus	✅	✅	✅	-	✅	-	✅	-	-	✅	✅	-
westus3	✅	✅	✅	-	✅	-	✅	-	-	-	✅	-

Mise hors service du modèle

Pour obtenir les informations les plus récentes sur les mises hors service des modèles, reportez-vous à la planification de mise hors service du modèle.

Modèles Black Forest Labs vendus par Azure

Les modèles FLUX Black Forest Labs (BFL) apportent une génération d’images de pointe à Microsoft Foundry, ce qui vous permet de générer et de modifier des images de haute qualité à partir d’invites de texte et d’images de référence. Les modèles FLUX prennent en charge une gamme de fonctionnalités, notamment la génération d'images à partir de texte, la modification d'images à partir de plusieurs références, et la génération et modification contextuelles.

Vous pouvez exécuter ces modèles via l'API fournisseur de services BFL et via les points de terminaison images/générations et images/modifications.

Pour utiliser des modèles FLUX dans Foundry, consultez Deploy et utiliser des modèles FLUX dans Microsoft Foundry.

L’inscription est requise pour l’accès à FLUX.2 [flex] (préversion).

Modèle	Type &point de terminaison d’API	Capacités	Type de déploiement (disponibilité de la région)
`FLUX.2-flex` Aperçu	Génération d’images - API du fournisseur de services BFL : `<resource-name>/providers/blackforestlabs/v1/flux-2-flex`	- Entrée : texte et image (32 000 jetons et jusqu’à 10 imagesⁱ) - Sortie: Une image - Appel d’outils : Non - Formats de réponse : Image (PNG et JPG) - Principales fonctionnalités : contrôle précis ; prise en charge de plusieurs références pour un maximum de 10 images - Paramètres supplémentaires : `guidance`: contrôle à quel point le résultat suit l’invite. Minimum : 1,5, maximum : 10, valeur par défaut : 4,5. Plus élevé = suit l’invite de plus près. `steps`: nombre d’étapes d’inférence. Maximum : 50, valeur par défaut : 50. Plus haut = plus de détails, plus lent.	- Standard global (toutes les régions)
`FLUX.2-pro` Aperçu	Génération d’images - API du fournisseur de services BFL : `<resource-name>/providers/blackforestlabs/v1/flux-2-pro`	- Entrée : texte et image (32 000 jetons et jusqu’à 8 imagesⁱⁱ) - Sortie: Une image - Appel d’outils : Non - Formats de réponse : Image (PNG et JPG) - Fonctionnalités clés : Prise en charge multi-référence pour jusqu’à 8 images ; plus fondée sur les connaissances réelles ; une plus grande flexibilité de sortie ; performances améliorées - Paramètres supplémentaires :(Dans l’API spécifique au fournisseur uniquement) prend en charge tous les paramètres.	- Standard global (toutes les régions)
`FLUX.1-Kontext-pro` Aperçu	Génération d’images - API d’image : `https://<resource-name>/openai/deployments/{deployment-id}/images/generations` Et `https://<resource-name>/openai/deployments/{deployment-id}/images/edits` - API du fournisseur de services BFL : `<resource-name>/providers/blackforestlabs/v1/flux-kontext-pro?api-version=preview`	- Entrée : texte et image (5 000 jetons et 1 image) - Sortie: Une image - Appel d’outils : Non - Formats de réponse : Image (PNG et JPG) - Fonctionnalités clés : Cohérence des caractères, modification avancée - Paramètres supplémentaires :(Dans l’API spécifique au fournisseur uniquement)`seed`, `aspect ratio`, `input_image`, `prompt_unsampling`, `safety_toleranceoutput_format`	- Standard global (toutes les régions)
`FLUX-1.1-pro` Aperçu	Génération d’images - API d’image : `https://<resource-name>/openai/deployments/{deployment-id}/images/generations` - API du fournisseur de services BFL : `<resource-name>/providers/blackforestlabs/v1/flux-pro-1.1?api-version=preview`	- Entrée : texte (5 000 jetons et 1 image) - Sortie: Une image - Appel d’outils : Non - Formats de réponse : Image (PNG et JPG) - Fonctionnalités clés : Vitesse d’inférence rapide, adhésion rapide forte, tarification concurrentielle, génération évolutive - Paramètres supplémentaires :(Dans l’API spécifique au fournisseur uniquement)`width`, `height`, `prompt_unsampling`, `seed`, `safety_toleranceoutput_format`	- Standard global (toutes les régions)

^i,ii La prise en charge de plusieurs images de référence est disponible pour FLUX.2 [pro] (préversion) et FLUX.2 [flex] (préversion) à l’aide de l’API, mais pas dans le terrain de jeu.

Modèles cohésés vendus par Azure

La famille de modèles Cohere comprend différents modèles optimisés pour différents cas d’usage, notamment les complétions de conversation, le reclassement/la classification de texte et les incorporations (embeddings). Les modèles Cohere sont optimisés pour différents cas d’usage qui incluent le raisonnement, la synthèse et la réponse aux questions.

Modèle	Type	Capacités	Type de déploiement (disponibilité de la région)
`Cohere-rerank-v4.0-pro`	classification de texte (réorganisation)	- Entrée : texte - Sortie : texte - Langues :`en`, , `fr`, `esit`, , , `dept-brjazh-cnarvihiruidnl` - Appel d’outils : Non - Formats de réponse : JSON	- Standard global (toutes les régions) - Calcul managé
`Cohere-rerank-v4.0-fast`	classification de texte (réorganisation)	- Entrée : texte - Sortie : texte - Langues :`en`, , `fr`, `esit`, , , `dept-brjazh-cnarvihiruidnl` - Appel d’outils : Non - Formats de réponse : JSON	- Standard global (toutes les régions) - Calcul managé
`Cohere-command-a`	chat-completion	- Entrée : texte (131 072 jetons) - Sortie : texte (8 182 jetons) - Langues :`en`, , `fr`, `esit`, `de`, `pt-brjakozh-cn`et`ar` - Appel d’outils : Oui - Formats de réponse : Texte, JSON	- Standard global (toutes les régions)
`embed-v-4-0`	incorporations	- Entrée : texte (512 jetons) et images (2MM pixels) - Sortie : Vecteur (256, 512, 1024, 1536 dimensions) - Langues :`en`, , `fr`, `esit`, `de`, `pt-brjakozh-cn`et`ar`	- Standard global (toutes les régions)

Modèles DeepSeek vendus par Azure

La famille DeepSeek de modèles comprend plusieurs modèles de raisonnement, qui excellent au niveau des tâches de raisonnement à l’aide d’un processus de formation pas à pas, tel que le langage, le raisonnement scientifique et les tâches de codage.

Modèle	Type	Capacités	Type de déploiement (disponibilité de la région)
`DeepSeek-V4-Pro` Aperçu	chat-completion (avec le contenu du raisonnement)	- Entrée : texte (1 000 000 jetons) - Sortie : texte (384 000 jetons) - Traduction:`en` Et `zh` - Appel d’outils : Non - Formats de réponse : Texte, JSON	- Standard global (toutes les régions)
`DeepSeek-V4-Flash` Aperçu	chat-completion (avec le contenu du raisonnement)	- Entrée : texte (1 000 000 jetons) - Sortie : texte (384 000 jetons) - Traduction:`en` Et `zh` - Appel d’outils : Non - Formats de réponse : Texte, JSON	- Standard global (toutes les régions)
`DeepSeek-V3.2-Speciale` Aperçu	chat-completion (avec le contenu du raisonnement)	- Entrée : texte (128 000 jetons) - Sortie : texte (128 000 jetons) - Traduction:`en` Et `zh` - Appel d’outils : Non - Formats de réponse : Texte, JSON	- Standard global (toutes les régions)
`DeepSeek-V3.2` Aperçu	chat-completion (avec le contenu du raisonnement)	- Entrée : texte (128 000 jetons) - Sortie : texte (128 000 jetons) - Traduction:`en` Et `zh` - Appel d’outils : Non - Formats de réponse : Texte, JSON	- Standard global (toutes les régions)
`DeepSeek-V3.1` Aperçu	chat-completion (avec le contenu du raisonnement)	- Entrée : texte (131 072 jetons) - Sortie : texte (131 072 jetons) - Traduction:`en` Et `zh` - Appel d’outils : Oui - Formats de réponse : Texte, JSON	- Standard global (toutes les régions)
`DeepSeek-R1-0528` Aperçu	chat-completion (avec le contenu du raisonnement)	- Entrée : texte (163 840 jetons) - Sortie : texte (163 840 jetons) - Traduction:`en` Et `zh` - Appel d’outils : Non - Formats de réponse : Texte	- Standard global (toutes les régions) - Disponible globalement (toutes les régions)
`DeepSeek-V3-0324` Aperçu	chat-completion	- Entrée : texte (131 072 jetons) - Sortie : texte (131 072 jetons) - Traduction:`en` Et `zh` - Appel d’outils : Oui - Formats de réponse : Texte, JSON	- Standard global (toutes les régions) - Disponible globalement (toutes les régions)
`DeepSeek-R1`	chat-completion (avec le contenu du raisonnement)	- Entrée : texte (163 840 jetons) - Sortie : texte (163 840 jetons) - Traduction:`en` Et `zh` - Appel d’outils : Non - Formats de réponse : Texte	- Standard global (toutes les régions) - Disponible globalement (toutes les régions)

Modèles meta vendus par Azure

Les modèles et outils Meta Llama sont une collection de modèles de texte et de raisonnement d’image générés préentraînés et affinés. Les méta-modèles sont mis à l’échelle pour inclure :

Petits modèles de langage (SLMs) tels que les modèles 1B et 3B Base et Instruct pour l’inférence sur l’appareil et en périphérie.
Modèles de langage de taille moyenne (LLMs) tels que 7B, 8B et 70B Base et Instruct
Modèles hautes performances comme Meta Llama 3.1-405B Instruct pour la génération de données synthétiques et les cas d’usage de la distillation.

Modèle	Type	Capacités	Type de déploiement (disponibilité de la région)
`Llama-4-Maverick-17B-128E-Instruct-FP8` Aperçu	chat-completion	- Entrée : texte et images (jetons 1M) - Sortie : texte (1 000 000 jetons) - Langues :`ar`, , `en`, `fr`, `dehiiditptestlthvi` - Appel d’outils : Non - Formats de réponse : Texte	- Standard global (toutes les régions)
`Llama-3.3-70B-Instruct` Aperçu	chat-completion	- Entrée : texte (128 000 jetons) - Sortie : texte (8 192 jetons) - Langues :`en`, , `de`, `frit`, `pt`, `hi`, `es`, et`th` - Appel d’outils : Non - Formats de réponse : Texte	- Standard global (toutes les régions) - Disponible globalement (toutes les régions)

Plusieurs modèles meta sont également disponibles auprès des partenaires et de la communauté.

modèles Microsoft vendus par Azure

Les modèles Microsoft incluent différents groupes de modèles tels que le modèle Routeur, les modèles MAI, les modèles Phi, les modèles d'IA pour les soins de santé, etc. Plusieurs modèles Microsoft sont également disponibles par les partenaires et la communauté.

Pour utiliser MAI-Image-2e et MAI-Image-2 modèles de génération de texte à image dans Foundry, consultez Déployer et utiliser des modèles MAI dans Microsoft Foundry.

Modèle	Type	Capacités	Type de déploiement (disponibilité de la région)
`MAI-Image-2e` Aperçu	Texte à image. Pour plus d’informations, consultez le point de terminaison de l’API .	- Entrée : texte - Sortie: Une image - Longueur du contexte : 32 000 tokens - Appel d’outils : Non - Formats de réponse : Image (PNG) - Traduction:`en` - Fonctionnalités clés : Génération de texte à image de haute qualité ; synthèse d’images photoréalistes avec une structure visuelle cohérente ; adapté aux images de produits, aux visuels marketing, aux ressources de marque et aux flux de travail créatifs commerciaux. - Paramètres :`width`, , `heightprompt` Minimum 768×768 pixels ; nombre maximal de pixels 1 048 576 (équivalent à 1024×1024). L’une ou l’autre dimension peut dépasser 1024 tant que le nombre total de pixels reste dans la limite (par exemple, 768×1365).	- Standard global (USA Centre Ouest, USA Est, USA Ouest, Europe Ouest, Suède Centre, Inde Sud)
`MAI-Image-2` Aperçu	Texte à image. Pour plus d’informations, consultez le point de terminaison de l’API .	- Entrée : texte - Sortie: Une image - Longueur du contexte : 32 000 tokens - Appel d’outils : Non - Formats de réponse : Image (PNG) - Traduction:`en` - Fonctionnalités clés : Génération de texte à image de haute qualité ; synthèse d’images photoréalistes avec une structure visuelle cohérente ; adapté aux images de produits, aux visuels marketing, aux ressources de marque et aux flux de travail créatifs commerciaux. - Paramètres :`width`, , `heightprompt` Minimum 768×768 pixels ; nombre maximal de pixels 1 048 576 (équivalent à 1024×1024). L’une ou l’autre dimension peut dépasser 1024 tant que le nombre total de pixels reste dans la limite (par exemple, 768×1365).	- Standard global (USA Centre Ouest, USA Est, USA Ouest, Europe Ouest, Suède Centre, Inde Sud)
`model-router` ¹	chat-completion	Plus d'informations dans l'aperçu du modèle de routeur. - Entrée : texte, image - Sortie : texte (nombre maximal de jetons de sortie varie de²) Fenêtre contextuelle : 200 000³ - Traduction:`en`	- Standard global (USA Est 2, Suède Centre) – Zone de données standard⁴ (USA Est 2, Suède Centre)

^{Version du modèle de routeur}2025-11-18. Les versions antérieures (2025-08-07 et 2025-05-19) sont également disponibles.

²Le nombre de jetons de sortie maximum varie pour les modèles sous-jacents dans le routeur de modèle. Par exemple, 32 768 (GPT-4.1 series), 100 000 (o4-mini), 128 000 (gpt-5 reasoning models) et 16 384 (gpt-5-chat).

³Fenêtres contextuelles plus volumineuses sont compatibles avec certains des modèles sous-jacents du routeur de modèle. Cela signifie qu’un appel d’API avec un contexte plus large réussit uniquement si l’invite est acheminée vers l’un de ces modèles. Sinon, l’appel échoue.

⁴ La facturation des déploiements de routeurs de modèle standard de zone de données ne commence pas plus tôt que le 1er novembre 2025.

Modèles Mistral vendus par Azure

Modèle	Type	Capacités	Type de déploiement (disponibilité de la région)
`mistral-document-ai-2512`	Image à texte	- Entrée : images ou pages PDF (30 pages, fichier PDF max. 30 Mo) - Sortie : texte - Traduction:`en` - Appel d’outils : non - Formats de réponse : Texte, JSON, Markdown	- Standard global (toutes les régions) - Norme de zone de données (États-Unis et UE)
`mistral-document-ai-2505` Aperçu	Image à texte	- Entrée : images ou pages PDF (30 pages, fichier PDF max. 30 Mo) - Sortie : texte - Traduction:`en` - Appel d’outils : non - Formats de réponse : Texte, JSON, Markdown	- Standard global (toutes les régions) - Norme de zone de données (États-Unis et UE)
`Mistral-Large-3` Aperçu	chat-completion	- Entrée : texte, image - Sortie : texte - Langues :`en`, , `fr`, `de`, `esitptnlzhjakoar` - Appel d’outils : Oui - Formats de réponse : Texte, JSON	- Standard global (toutes les régions) - Norme de zone de données (États-Unis et UE)

Plusieurs modèles Mistral sont également disponibles auprès des partenaires et de la communauté.

Modèles IA Moonshot vendus par Azure

Les modèles IA Moonshot incluent Kimi K2.6 (aperçu) et Kimi K2.5 (aperçu), des modèles de raisonnement multimodal qui acceptent des textes et des images.

Modèle	Type	Capacités	Type de déploiement (disponibilité de la région)
`Kimi-K2.6` Aperçu	chat-completion (avec le contenu du raisonnement)	- Entrée : texte et image (262 144 jetons) - Résultat : texte (262 144 jetons) - Traduction:`en` Et `zh` - Appel d’outils : Oui - Formats de réponse : Texte	- Standard global (toutes les régions)
`Kimi-K2.5` Aperçu	chat-completion (avec le contenu du raisonnement)	- Entrée : texte et image (262 144 jetons) - Résultat : texte (262 144 jetons) - Traduction:`en` Et `zh` - Appel d’outils : Oui - Formats de réponse : Texte	- Standard global (toutes les régions)

Consultez cette collection de modèles dans le portail Foundry.

Modèles xAI vendus par Azure

Les modèles Grok de xAI dans Les modèles Foundry incluent un ensemble diversifié de modèles de raisonnement et de non-raisonnement conçus pour les cas d’usage d’entreprise tels que l’extraction de données, le codage, la synthèse de texte et les applications agentiques.

L’inscription est requise pour l’accès àgrok-code-fast-1 la Version Préliminaire et grok-4.

Modèle	Type	Capacités	Type de déploiement (disponibilité de la région)
`grok-4.3` Aperçu	chat-completion	- Entrée : texte (200 000 jetons) - Sortie : texte (8 192 jetons) - Traduction:`en` - Appel d’outils : oui - Formats de réponse : texte	- Standard global (toutes les régions)
`grok-4-20-reasoning` Aperçu	chat-completion	- Entrée : texte (262 000 jetons) - Sortie : texte (8 192 jetons) - Traduction:`en` - Appel d’outils : oui - Formats de réponse : texte	- Standard global (toutes les régions)
`grok-4-20-non-reasoning` Aperçu	chat-completion	- Entrée : texte (262 000 jetons) - Sortie : texte (8 192 jetons) - Traduction:`en` - Appel d’outils : oui - Formats de réponse : texte	- Standard global (toutes les régions)
`grok-4.1-fast-reasoning` Aperçu	chat-completion	- Entrée : texte, image (128 000 jetons) - Sortie : texte (128 000 jetons) - Traduction:`en` - Appel d’outils : oui - Formats de réponse : texte	- Standard global (toutes les régions)
`grok-4.1-fast-non-reasoning` Aperçu	chat-completion	- Entrée : texte, image (128 000 jetons) - Sortie : texte (128 000 jetons) - Traduction:`en` - Appel d’outils : oui - Formats de réponse : texte	- Standard global (toutes les régions)
`grok-4`	chat-completion	- Entrée : texte (262 000 jetons) - Sortie : texte (8 192 jetons) - Traduction:`en` - Appel d’outils : oui - Formats de réponse : texte	- Standard global (toutes les régions)
`grok-code-fast-1` Aperçu	chat-completion	- Entrée : texte (256 000 jetons) - Sortie : texte (8 192 jetons) - Traduction:`en` - Appel d’outils : oui - Formats de réponse : texte	- Standard global (toutes les régions)

Disponibilité de la région de modèle par type de déploiement

Microsoft Foundry fournit aux clients des choix sur la structure d’hébergement qui correspond à leurs modèles d’entreprise et d’utilisation. Le service propose deux catégories de déploiement principales :

Standard : dispose d’une option de déploiement globale, le routage du trafic globalement pour fournir un débit plus élevé.
Provisioned : offre également une option de déploiement globale, permettant aux clients d’acheter et de déployer des unités de débit approvisionnées sur Azure infrastructure mondiale.

D’autres catégories de déploiement, comme batch , sont également disponibles. Pour en savoir plus sur tous les types de déploiement de modèles disponibles, consultez Types de déploiement pour Microsoft modèles Foundry.

Disponibilité globale du modèle Standard

Région	FLUX.2-flex	FLUX.2-pro	FLUX.1-Kontext-pro	FLUX-1.1-pro	Cohere-rerank-v4.0-pro	Cohere-rerank-v4.0-fast	cohere-command-a	embed-v-4-0	DeepSeek-V3.2-Speciale	DeepSeek-V3.2	DeepSeek-V3.1	DeepSeek-R1-0528	DeepSeek-V3-0324	DeepSeek-R1	Llama-4-Maverick-17B-128E-Instruct-FP8	Llama-3.3-70B-Instruct	MAI-Image-2	model-router	mistral-document-ai-2512	mistral-document-ai-2505	Mistral-Large-3	Kimi-K2.5	grok-4-1-raisonnement-rapide	grok-4-1-fast-non-reasoning	grok-4-fast-reasoning	grok-4-fast-non-reasoning	grok-3	grok-3-mini
australiaeast	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
brésilsouth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
canadacentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
canadaeast	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
centralus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
francecentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
allemagnewestcentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
italynorth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
japaneast	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Japon Ouest	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
koreacentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
northcentralus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
norwayeast	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
polognecentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
southafricanorth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
southcentralus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Inde du Sud	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
spaincentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
swedencentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
SuisseNord	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
switzerlandwest	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
uaenorth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
uksouth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westcentralus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westeurope	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus3	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅

Disponibilité globale du modèle managé provisionné

Région	DeepSeek-R1-0528	DeepSeek-V3-0324	DeepSeek-R1	Llama-3.3-70B-Instruct
australiaeast	✅	✅	✅	✅
brésilsouth	✅	✅	✅	✅
canadacentral	✅	✅	✅	✅
canadaeast	✅	✅	✅	✅
centralus	✅	✅	✅	✅
eastus	✅	✅	✅	✅
eastus2	✅	✅	✅	✅
francecentral	✅	✅	✅	✅
allemagnewestcentral	✅	✅	✅	✅
italynorth	✅	✅	✅	✅
japaneast	✅	✅	✅	✅
Japon Ouest	✅	✅	✅	✅
koreacentral	✅	✅	✅	✅
northcentralus	✅	✅	✅	✅
norwayeast	✅	✅	✅	✅
polognecentral	✅	✅	✅	✅
southafricanorth	✅	✅	✅	✅
southcentralus	✅	✅	✅	✅
Inde du Sud	✅	✅	✅	✅
spaincentral	✅	✅	✅	✅
swedencentral	✅	✅	✅	✅
SuisseNord	✅	✅	✅	✅
switzerlandwest	✅	✅	✅	✅
uaenorth	✅	✅	✅	✅
uksouth	✅	✅	✅	✅
westcentralus	✅	✅	✅	✅
westeurope	✅	✅	✅	✅
westus	✅	✅	✅	✅
westus2	✅	✅	✅	✅
westus3	✅	✅	✅	✅

Disponibilité du modèle Standard de zone de données

Région	FLUX.2-pro	FLUX.1-Kontext-pro	FLUX-1.1-pro	model-router	mistral-document-ai-2512	mistral-document-ai-2505	Mistral-Large-3	grok-4-1-raisonnement-rapide	grok-4-1-fast-non-reasoning	grok-4-fast-reasoning	grok-4-fast-non-reasoning	grok-3	grok-3-mini
centralus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
francecentral	✅	✅	✅	-	✅	✅	✅	-	-	-	-	-	-
allemagnewestcentral	✅	✅	✅	-	✅	✅	✅	-	-	-	-	-	-
italynorth	✅	✅	✅	-	✅	✅	✅	-	-	-	-	-	-
northcentralus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
polognecentral	✅	✅	✅	-	✅	✅	✅	-	-	-	-	-	-
southcentralus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
spaincentral	✅	✅	✅	-	✅	✅	✅	-	-	-	-	-	-
swedencentral	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-	-
westcentralus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
westeurope	✅	✅	✅	-	✅	✅	✅	-	-	-	-	-	-
westus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus2	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus3	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅

Commentaires

Cette page a-t-elle été utile ?

Last updated on 2026-05-20

Modèles Foundry vendus par Azure

Azure OpenAI dans les modèles Foundry de Microsoft

Points forts du modèle

GPT-chat-latest

Capacités

GPT-5.5

Capacités

GPT-5.4

Capacités

GPT-5.3

Capacités

GPT-5.2

Capacités

GPT-5.1

Capacités

GPT-5

Capacités

gpt-oss

Capacités

Déployer avec du code

Série GPT-4.1

Capacités

Problème connu

aperçu de l'utilisation de l'ordinateur

Capacités

Modèles de série o

Capacités

GPT-4o et GPT-4 Turbo

Modèles GPT-4 et GPT-4 Turbo

Capacités

Incorporations

Capacités

Modèles de génération d’images

Modèles de génération de vidéos

Modèles audio

Modèles audio GPT-4o

Audio API

Modèles de transcription vocale en texte

Modèles de traduction vocale

Modèles de synthèse vocale (aperçu)

Réglage des modèles

Assistants (préversion)

Mise hors service du modèle

Contenu connexe

Modèles Black Forest Labs vendus par Azure

Modèles cohésés vendus par Azure

Modèles DeepSeek vendus par Azure

Modèles meta vendus par Azure

modèles Microsoft vendus par Azure

Modèles Mistral vendus par Azure

Modèles IA Moonshot vendus par Azure

Modèles xAI vendus par Azure

Disponibilité de la région de modèle par type de déploiement

Disponibilité globale du modèle Standard

Contenu connexe

Commentaires

Ressources supplémentaires