Foundry Models verkocht door Azure

Microsoft Foundry Models in de modelcatalogus bestaan uit twee hoofdcategorieën, namelijk Foundry Models verkocht door Azure en Foundry Models van partners en community. In dit artikel vindt u een selectie van Foundry-modellen die worden verkocht door Azure, samen met hun mogelijkheden, deploymenttypen en beschikbaarheidsregio's, met uitzondering van afgeschafte en buiten gebruik gestelde modellen. Foundry Models verkocht door Azure worden ook wel Direct van Azure Models of Azure Direct Models genoemd.

Modellen die door Azure worden verkocht, worden ook gehost door Azure en beheerd door Azure als onderdeel van de Foundry Models-service. Ze omvatten alle Azure OpenAI-modellen en specifieke, geselecteerde modellen van toonaangevende aanbieders. Deze modellen worden gefactureerd via uw Azure-abonnement, gedekt door Azure serviceovereenkomsten en ondersteund door Microsoft. Als u een lijst wilt zien van Foundry-modellen die worden ondersteund door de Foundry Agent Service, raadpleegt u Modellen die door Agent Service worden ondersteund. Voor een lijst met Foundry-modellen van partners raadpleegt u Foundry-modellen van partners en de community.

Tip

Gebruik de tabbladen boven aan deze pagina om te schakelen tussen Azure OpenAI-modellen en Overig modelverzamelingen van providers zoals Cohere, DeepSeek, Meta, Mistral AI en xAI.

Azure OpenAI in Microsoft Foundry-modellen

Azure OpenAI wordt mogelijk gemaakt door een diverse set modellen met verschillende mogelijkheden en prijspunten. De beschikbaarheid van modellen verschilt per regio en cloud.

Hoogtepunten van het model

Modellen Beschrijving
GPT-chat-latest (preview) NIEUWgpt-chat-latestVoorbeeld
GPT-5.5 serie NIEUWgpt-5.5
GPT-5.4 serie gpt-5.4-mini,gpt-5.4-nano,gpt-5.4,gpt-5.4-pro
GPT-5.3 serie gpt-5.3-chat, gpt-5.3-codex
GPT-5.2 serie gpt-5.2-codex, , gpt-5.2gpt-5.2-chatPreview
GPT-5.1 serie gpt-5.1, gpt-5.1-chatPreview, gpt-5.1-codex, gpt-5.1-codex-mini
Sora NIEUWE sora-2
GPT-5 serie gpt-5, , gpt-5-minigpt-5-nano, gpt-5-chatPreview
gpt-oss modellen met open gewichtsredenering
codex-mini Fijnafgestelde versie van o4-mini.
GPT-4.1 serie gpt-4.1, gpt-4.1-mini, gpt-4.1-nano
computergebruik-preview Een experimenteel model dat is getraind voor gebruik met de computergebruikstool van de Responses API.
o-serie modellen Redeneringsmodellen met geavanceerde probleemoplossing en meer focus en mogelijkheden.
GPT-4o, GPT-4o mini en GPT-4 Turbo Geschikt Azure OpenAI-modellen met multimodale versies, die zowel tekst als afbeeldingen als invoer kunnen accepteren.
Embeddings Een set modellen waarmee tekst kan worden omgezet in numerieke vectorvorm om de gelijkenis van tekst te vergemakkelijken.
Afbeeldingen genereren Een reeks modellen waarmee oorspronkelijke afbeeldingen uit natuurlijke taal kunnen worden gegenereerd.
Video generation Een model dat oorspronkelijke videoscènes kan genereren op basis van tekstinstructies.
Audio Een reeks modellen voor spraak naar tekst, vertaling en tekst naar spraak. GPT-4o-audiomodellen ondersteunen ofwel gespreksinteracties met lage latentie van spraak in, spraak uit of audiogeneratie.

GPT-chat-latest

Zie Region-beschikbaarheid voor Foundry-modellen die worden verkocht door Azure voor beschikbaarheid van modellen in alle regio's, gegroepeerd op implementatiecategorie.

Mogelijkheden

Model-ID Beschrijving Contextvenster Maximaal aantal outputtokens Trainingsgegevens (maximaal)
gpt-chat-latest (2026-05-05)
Voorbeeld
- Redenering
- Api voor voltooiing van chat.
- Antwoord-API.
- Gestructureerde uitvoer
- Functies, hulpprogramma's en parallelle aanroepen van hulpprogramma's.
128,000

Invoer: 111.616
Uitvoer: 16.384
16,384 augustus 2025

Opmerking

Mogelijk ziet u dit model ook waarnaar wordt verwezen door OpenAI als GPT-5.5 Instant of in de OpenAI-API als chat-latest. In Microsoft Foundry introduceren we gpt-chat-latest als productnaam voor deze release. Het model blijft de bestaande levenscyclus van preview en standaardmeldingsperioden volgen. We evalueren ook manieren om te vereenvoudigen hoe klanten voortdurend bijgewerkte modellen in de loop van de tijd openen, maar het huidige gedrag blijft ongewijzigd terwijl dat werk voortduurt.

GPT-5.5

Zie Region-beschikbaarheid voor Foundry-modellen die worden verkocht door Azure voor beschikbaarheid van modellen in alle regio's, gegroepeerd op implementatiecategorie.

Mogelijkheden

Model-ID Beschrijving Contextvenster Maximaal aantal uitvoertokens Trainingsgegevens (maximaal)
gpt-5.5 (2026-04-24) - Redenering
- Antwoord-API.
- Api voor voltooiing van chat.
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies, hulpprogramma's en parallelle aanroepen van hulpprogramma's.
- Computergebruik
- Volledig overzicht van de mogelijkheden.
1.050.000 br>
Invoer: 922.000
Uitvoer: 128.000
128,000 December 2025

Opmerking

Voor sommige quotumlagen zijn quotumaanvragen vereist om gpt-5.5 dit model te kunnen implementeren. Abonnementen op laag 5 en laag 6 hebben standaard een quotum.

GPT-5.4

Zie Region-beschikbaarheid voor Foundry-modellen die worden verkocht door Azure voor beschikbaarheid van modellen in alle regio's, gegroepeerd op implementatiecategorie.

Mogelijkheden

Model-ID Beschrijving Contextvenster Maximaal aantal uitvoertokens Trainingsgegevens (maximaal)
gpt-5.4 (2026-03-05) - Redenatie
- Antwoord-API.
- Api voor voltooiing van chat.
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies, hulpprogramma's en parallelle aanroepen van hulpprogramma's.
- Computergebruik
- Volledig overzicht van de mogelijkheden.
1,050,000 128,000 augustus 2025
gpt-5.4-pro (2026-03-05) - Redenatie
- Antwoord-API.
- Tekst- en afbeeldingsverwerking.
- Functies en hulpprogramma's
- Volledig overzicht van de mogelijkheden.
1,050,000 128,000 augustus 2025
gpt-5.4-mini (2026-03-17) - Redenatie
- Antwoord-API.
- Api voor voltooiing van chat.
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies, hulpprogramma's en parallelle aanroepen van hulpprogramma's.
- Computergebruik
- Volledig overzicht van de mogelijkheden.
400,000

Invoer: 272.000
Uitvoer: 128.000
128,000 augustus 2025
gpt-5.4-nano (2026-03-17) - Redenatie
- Antwoord-API.
- Api voor voltooiing van chat.
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies, hulpprogramma's en parallelle aanroepen van hulpprogramma's.
- Volledig overzicht van de mogelijkheden.
400,000

Invoer: 272.000
Uitvoer: 128.000
128,000 augustus 2025

GPT-5.3

Zie Region-beschikbaarheid voor Foundry-modellen die worden verkocht door Azure voor beschikbaarheid van modellen in alle regio's, gegroepeerd op implementatiecategorie.

Mogelijkheden

Model-ID Beschrijving Contextvenster Maximaal aantal uitvoertokens Trainingsgegevens (maximaal)
gpt-5.3-codex (2026-02-24) - Redenatie
- Antwoord-API.
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies, hulpprogramma's en parallelle aanroepen van hulpprogramma's.
- Volledig overzicht van de mogelijkheden.
- Geoptimaliseerd voor Codex CLI & Codex VS Code-extensie
400,000

Invoer: 272.000
Uitvoer: 128.000
128,000 augustus 2025
gpt-5.3-chat (2026-03-03)
Voorbeeld
- Api voor voltooiing van chat.
- Antwoord-API.
- Gestructureerde uitvoer
- Functies, hulpprogramma's en parallelle aanroepen van hulpprogramma's.
128,000

Invoer: 111.616
Uitvoer: 16.384
16,384 augustus 2025

GPT-5.2

Zie Region-beschikbaarheid voor Foundry-modellen die worden verkocht door Azure voor beschikbaarheid van modellen in alle regio's, gegroepeerd op implementatiecategorie.

Mogelijkheden

Model-ID Beschrijving Contextvenster Maximaal aantal uitvoertokens Trainingsgegevens (maximaal)
gpt-5.2-codex (2026-01-14) - Redenatie
- Antwoord-API.
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies, hulpprogramma's en parallelle aanroepen van hulpprogramma's.
- Volledig overzicht van de mogelijkheden.
- Geoptimaliseerd voor Codex CLI & Codex VS Code-extensie
400,000

Invoer: 272.000
Uitvoer: 128.000
128,000
gpt-5.2 (2025-12-11) - Redenatie
- Api voor voltooiing van chat.
- Antwoord-API.
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies, hulpprogramma's en parallelle aanroepen van hulpprogramma's.
- Volledig overzicht van de mogelijkheden.
400,000

Invoer: 272.000
Uitvoer: 128.000
128,000 augustus 2025
gpt-5.2-chat (2025-12-11)
Voorbeeld
- Api voor voltooiing van chat.
- Antwoord-API.
- Gestructureerde uitvoer
- Functies, hulpprogramma's en parallelle aanroepen van hulpprogramma's.
128,000

Invoer: 111.616
Uitvoer: 16.384
16,384 augustus 2025
gpt-5.2-chat (2026-02-10)
Voorbeeld
- Api voor voltooiing van chat.
- Antwoord-API.
- Gestructureerde uitvoer
- Functies, hulpprogramma's en parallelle aanroepen van hulpprogramma's.
128,000

Invoer: 111.616
Uitvoer: 16.384
16,384 augustus 2025

Voorzichtigheid

We raden u niet aan preview-modellen in productie te gebruiken. Alle implementaties van preview-modellen worden bijgewerkt naar toekomstige preview-versies of naar de nieuwste stabiele, algemeen beschikbare versie. Modellen die zijn aangewezen preview volgen niet de standaardlevenscyclus van Azure OpenAI-model.

GPT-5.1

Zie Region-beschikbaarheid voor Foundry-modellen die worden verkocht door Azure voor beschikbaarheid van modellen in alle regio's, gegroepeerd op implementatiecategorie.

Mogelijkheden

Model-ID Beschrijving Contextvenster Maximaal aantal uitvoertokens Trainingsgegevens (maximaal)
gpt-5.1 (2025-11-13) - Redenering
- Api voor voltooiing van chat.
- Antwoord-API.
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies, hulpprogramma's en parallelle aanroepen van hulpprogramma's.
- Volledig overzicht van de mogelijkheden.
400,000

Invoer: 272.000
Uitvoer: 128.000
128,000 30 september 2024
gpt-5.1-chat (2025-11-13)
Voorbeeld
- Redenering
- Api voor voltooiing van chat.
- Antwoord-API.
- Gestructureerde uitvoer
- Functies, hulpprogramma's en parallelle aanroepen van hulpprogramma's.
128,000

Invoer: 111.616
Uitvoer: 16.384
16,384 30 september 2024
gpt-5.1-codex (2025-11-13) - Alleen antwoord-API .
- Tekst- en afbeeldingsverwerking
- Gestructureerde uitvoer.
- Functies, hulpprogramma's en parallelle aanroepen van hulpprogramma's.
- Volledig overzicht van de mogelijkheden
- Geoptimaliseerd voor Codex CLI & Codex VS Code-extensie
400,000

Invoer: 272.000
Uitvoer: 128.000
128,000 30 september 2024
gpt-5.1-codex-mini (2025-11-13) - Alleen antwoord-API .
- Tekst- en afbeeldingsverwerking
- Gestructureerde uitvoer.
- Functies, hulpprogramma's en parallelle aanroepen van hulpprogramma's.
- Volledig overzicht van de mogelijkheden
- Geoptimaliseerd voor Codex CLI & Codex VS Code-extensie
400,000

Invoer: 272.000
Uitvoer: 128.000
128,000 30 september 2024
gpt-5.1-codex-max (2025-12-04) - Alleen antwoord-API .
- Tekst- en afbeeldingsverwerking
- Gestructureerde uitvoer.
- Functies, hulpprogramma's en parallelle aanroepen van hulpprogramma's.
- Volledig overzicht van de mogelijkheden
- Geoptimaliseerd voor Codex CLI & Codex VS Code-extensie
400,000

Invoer: 272.000
Uitvoer: 128.000
128,000 30 september 2024

Voorzichtigheid

We raden u niet aan preview-modellen in productie te gebruiken. Alle implementaties van preview-modellen worden bijgewerkt naar toekomstige preview-versies of naar de nieuwste stabiele, algemeen beschikbare versie. Modellen die zijn aangewezen preview volgen niet de standaardlevenscyclus van Azure OpenAI-model.

Belangrijk

  • gpt-5.1 reasoning_effort is standaard ingesteld op none. Wanneer u een upgrade uitvoert van eerdere redeneringsmodellen naar gpt-5.1, moet u mogelijk uw code bijwerken om expliciet een reasoning_effort niveau door te geven als u redenering wilt uitvoeren.

  • gpt-5.1-chat voegt ingebouwde redeneringsmogelijkheden toe. Net als andere redeneringsmodellen biedt het geen ondersteuning voor parameters zoals temperature. Als u overstapt van het gebruik van gpt-5-chat (dat geen reasoningmodel is) naar gpt-5.1-chat, zorg er dan voor dat u alle aangepaste parameters, zoals temperature, uit uw code verwijdert die niet worden ondersteund door reasoningmodellen.

  • gpt-5.1-codex-max voegt ondersteuning voor instelling reasoning_effort toe aan xhigh. Redeneringsinspanningen none worden niet ondersteund met gpt-5.1-codex-max.

GPT-5

Zie Region-beschikbaarheid voor Foundry-modellen die worden verkocht door Azure voor beschikbaarheid van modellen in alle regio's, gegroepeerd op implementatiecategorie.

Mogelijkheden

Model-ID Beschrijving Contextvenster Maximaal aantal uitvoertokens Trainingsgegevens (maximaal)
gpt-5 (2025-08-07) - Redenatie
- Api voor voltooiing van chat.
- Antwoord-API.
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies, hulpprogramma's en parallelle aanroepen van hulpprogramma's.
- Volledig overzicht van de mogelijkheden.
400,000

Invoer: 272.000
Uitvoer: 128.000
128,000 30 september 2024
gpt-5-mini (2025-08-07) - Redenatie
- Api voor voltooiing van chat.
- Antwoord-API.
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies, hulpprogramma's en parallelle aanroepen van hulpprogramma's.
- Volledig overzicht van de mogelijkheden.
400,000

Invoer: 272.000
Uitvoer: 128.000
128,000 31 mei 2024
gpt-5-nano (2025-08-07) - Redenatie
- Api voor voltooiing van chat.
- Antwoord-API.
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies, hulpprogramma's en parallelle aanroepen van hulpprogramma's.
- Volledig overzicht van de mogelijkheden.
400,000

Invoer: 272.000
Uitvoer: 128.000
128,000 31 mei 2024
gpt-5-chat (2025-08-07)
Voorbeeld
- Api voor voltooiing van chat.
- Antwoord-API.
- Invoer: Tekst/afbeelding
- Uitvoer: alleen tekst
128,000 16,384 30 september 2024
gpt-5-chat (2025-10-03)
Preview1
- Api voor voltooiing van chat.
- Antwoord-API.
- Invoer: Tekst/afbeelding
- Uitvoer: alleen tekst
128,000 16,384 30 september 2024
gpt-5-codex (2025-09-11) - Alleen antwoord-API .
- Invoer: Tekst/afbeelding
- Uitvoer: alleen tekst
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies, hulpprogramma's en parallelle aanroepen van hulpprogramma's.
- Volledig overzicht van de mogelijkheden
- Geoptimaliseerd voor Codex CLI & Codex VS Code-extensie
400,000

Invoer: 272.000
Uitvoer: 128.000
128,000 -
gpt-5-pro (2025-10-06) - Redenatie
- Antwoord-API.
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies en hulpprogramma's
- Volledig overzicht van de mogelijkheden.
400,000

Invoer: 272.000
Uitvoer: 128.000
128,000 30 september 2024

Opmerking

1gpt-5-chat versie 2025-10-03 introduceert een aanzienlijke verbetering gericht op emotionele intelligentie en mentale gezondheid mogelijkheden. Deze upgrade integreert gespecialiseerde gegevenssets en verfijnde responsstrategieën om het vermogen van het model te verbeteren om:

  • Emotionele context nauwkeuriger begrijpen en interpreteren , waardoor genuanceerde en empathische interacties mogelijk zijn.
  • Bied ondersteunende, verantwoordelijke reacties in gesprekken met betrekking tot geestelijke gezondheid, waardoor gevoeligheid en naleving van best practices worden gewaarborgd.

Deze verbeteringen hebben tot doel GPT-5-chat meer contextbewust, mensgericht en betrouwbaar te maken in scenario's waarin emotionele toon- en welzijnsoverwegingen essentieel zijn.

Voorzichtigheid

We raden u niet aan preview-modellen in productie te gebruiken. Alle implementaties van preview-modellen worden bijgewerkt naar toekomstige preview-versies of naar de nieuwste stabiele, algemeen beschikbare versie. Modellen die zijn aangewezen preview volgen niet de standaardlevenscyclus van Azure OpenAI-model.

gpt-oss

Zie Region-beschikbaarheid voor Foundry-modellen die worden verkocht door Azure voor beschikbaarheid van modellen in alle regio's, gegroepeerd op implementatiecategorie.

Mogelijkheden

Model-ID Beschrijving Contextvenster Maximaal aantal uitvoertokens Trainingsgegevens (maximaal)
gpt-oss-120b 1 (Preview) - Alleen tekstinvoer/-uitvoer
- API voor voltooiing van chat
-Streaming
- functieaanroepen
- Gestructureerde uitvoer
- Redenering
- Beschikbaar voor implementatie1 en via beheerde rekenkracht
131,072 131,072 31 mei 2024
gpt-oss-20b (Voorbeeld) - Alleen tekstinvoer/tekstuitvoer
- API voor voltooiing van chat
-Streaming
- functieaanroepen
- Gestructureerde uitvoer
- Redenering
- Beschikbaar via beheerde rekenkracht en Foundry Local
131,072 131,072 31 mei 2024

1 In tegenstelling tot andere Azure OpenAI-modellen gpt-oss-120b is een Foundry-project vereist om het model te implementeren.

Implementeren met code

az cognitiveservices account deployment create \
  --name "Foundry-project-resource" \
  --resource-group "test-rg" \
  --deployment-name "gpt-oss-120b" \
  --model-name "gpt-oss-120b" \
  --model-version "1" \
  --model-format "OpenAI-OSS" \
  --sku-capacity 10 \
  --sku-name "GlobalStandard"

GPT-4.1 serie

Zie Region-beschikbaarheid voor Foundry-modellen die worden verkocht door Azure voor beschikbaarheid van modellen in alle regio's, gegroepeerd op implementatiecategorie.

Mogelijkheden

Model-ID Beschrijving Contextvenster Maximum aantal uitvoertokens Trainingsgegevens (maximaal)
gpt-4.1 (2025-04-14) - Invoer van tekst en afbeelding
- Tekstuitvoer
- API voor voltooiing van chat
- Antwoord-API
-Streaming
- Functieaanroepen
- Gestructureerde uitvoer (chataanvullingen)
- 1,047,576
- 300.000 (standaard en geprovisioneerde beheerde implementaties)
- 128.000 (batchuitrolacties)
32,768 31 mei 2024
gpt-4.1-nano (2025-04-14) - Invoer van tekst en afbeelding
- Tekstuitvoer
- API voor voltooiing van chat
- Antwoord-API
-Streaming
- Functieaanroepen
- Gestructureerde uitvoerresultaten (chataanvullingen)
- 1,047,576
- 300.000 (standaard en geprovisioneerde beheerde implementaties)
- 128.000 (batchuitrols)
32,768 31 mei 2024
gpt-4.1-mini (2025-04-14) - Invoer van tekst en afbeelding
- Tekstuitvoer
- API voor voltooiing van chat
- Antwoord-API
-Streaming
- functieaanroepen
- Gestructureerde uitvoer (chataanvullingen)
- 1,047,576
- 300.000 (standaard en ingerichte beheerde implementaties)
- 128.000 (batchuitrol)
32,768 31 mei 2024

Bekend probleem

Een bekend probleem heeft invloed op alle GPT 4.1-seriemodellen. Grote hulpprogramma- of functie-aanroepdefinities die meer dan 300.000 tokens overschrijden, leiden tot fouten, ook al is de limiet van 1 miljoen tokencontexten van de modellen niet bereikt.

De fouten kunnen variëren afhankelijk van de API-aanroep en de kenmerken van de onderliggende payload.

Hier volgen de foutberichten voor de API voor chatvoltooiingen:

  • Error code: 400 - {'error': {'message': "This model's maximum context length is 300000 tokens. However, your messages resulted in 350564 tokens (100 in the messages, 350464 in the functions). Please reduce the length of the messages or functions.", 'type': 'invalid_request_error', 'param': 'messages', 'code': 'context_length_exceeded'}}

  • Error code: 400 - {'error': {'message': "Invalid 'tools[0].function.description': string too long. Expected a string with maximum length 1048576, but got a string with length 2778531 instead.", 'type': 'invalid_request_error', 'param': 'tools[0].function.description', 'code': 'string_above_max_length'}}

Dit is het foutbericht voor de Antwoorden-API:

  • Error code: 500 - {'error': {'message': 'The server had an error processing your request. Sorry about that! You can retry your request, or contact us through an Azure support request at: https://go.microsoft.com/fwlink/?linkid=2213926 if you keep seeing this error. (Please include the request ID d2008353-291d-428f-adc1-defb5d9fb109 in your email.)', 'type': 'server_error', 'param': None, 'code': None}}

preview van computergebruik

Een experimenteel model dat is getraind voor gebruik met het hulpprogramma voor computergebruik van de Responses API.

Het kan worden gebruikt met bibliotheken van derden om het model toe te staan om muis- en toetsenbordinvoer te beheren, terwijl context wordt opgehaald uit schermopnamen van de huidige omgeving.

Voorzichtigheid

We raden u niet aan preview-modellen in productie te gebruiken. Alle implementaties van preview-modellen worden bijgewerkt naar toekomstige preview-versies of naar de nieuwste stabiele, algemeen beschikbare versie. Modellen die zijn aangewezen preview volgen niet de standaardlevenscyclus van Azure OpenAI-model.

Registratie is vereist voor toegang computer-use-preview. Toegang wordt verleend op basis van de geschiktheidscriteria van Microsoft. Klanten die toegang hebben tot andere modellen met beperkte toegang, moeten nog steeds toegang aanvragen voor dit model.

Als u toegang wilt aanvragen, gaat u naar computer-use-preview de toepassing voor een beperkt toegangsmodel. Wanneer toegang wordt verleend, moet u een implementatie voor het model maken.

Zie Region-beschikbaarheid voor Foundry-modellen die worden verkocht door Azure voor beschikbaarheid van modellen in alle regio's, gegroepeerd op implementatiecategorie.

Mogelijkheden

Model-ID Beschrijving Contextvenster Maximum aantal uitvoertokens Trainingsgegevens (maximaal)
computer-use-preview (2025-03-11) Gespecialiseerd model voor gebruik met het hulpprogramma voor computergebruik van de Responses API

- Hulpmiddelen
-Streaming
- Tekst (invoer/uitvoer)
- Afbeelding (invoer)
8,192 1,024 Oktober 2023

o-serie modellen

De Azure OpenAI o-serie modellen zijn ontworpen om redeneringen en probleemoplossingstaken aan te pakken met meer focus en mogelijkheden. Deze modellen besteden meer tijd aan het verwerken en begrijpen van de aanvraag van de gebruiker, waardoor ze uitzonderlijk sterk zijn op gebieden zoals wetenschap, codering en wiskunde, vergeleken met eerdere iteraties.

Zie Region-beschikbaarheid voor Foundry-modellen die worden verkocht door Azure voor beschikbaarheid van modellen in alle regio's, gegroepeerd op implementatiecategorie.

Mogelijkheden

Model-ID Beschrijving Maximum aantal aanvragen (tokens) Trainingsgegevens (maximaal)
codex-mini (2025-05-16) Fijnafgestelde versie van o4-mini.
- Antwoord-API.
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies en hulpprogramma's.
Volledig overzicht van de mogelijkheden.
Invoer: 200.000
Uitvoer: 100.000
31 mei 2024
o3-pro (2025-06-10) - Antwoord-API.
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies en hulpprogramma's.
Volledig overzicht van de mogelijkheden.
Invoer: 200.000
Uitvoer: 100.000
31 mei 2024
o4-mini (2025-04-16) - Nieuw redeneringsmodel, met verbeterde redeneringsmogelijkheden.
- Api voor voltooiing van chat.
- Antwoord-API.
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies en hulpprogramma's.
Volledig overzicht van de mogelijkheden.
Invoer: 200.000
Uitvoer: 100.000
31 mei 2024
o3 (2025-04-16) - Nieuw redeneringsmodel, met verbeterde redeneringsmogelijkheden.
- Api voor voltooiing van chat.
- Antwoord-API.
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies, hulpprogramma's en parallelle aanroepen van hulpprogramma's.
Volledig overzicht van de mogelijkheden.
Invoer: 200.000
Uitvoer: 100.000
31 mei 2024
o3-mini (2025-01-31) - Verbeterde redeneringsmogelijkheden.
- Gestructureerde uitvoer.
- Alleen tekstverwerking.
- Functies en hulpprogramma's.
Invoer: 200.000
Uitvoer: 100.000
Oktober 2023
o1 (2024-12-17) - Verbeterde redeneringsmogelijkheden.
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- Functies en hulpprogramma's.
Invoer: 200.000
Uitvoer: 100.000
Oktober 2023
o1-preview 1 (2024-09-12) Oudere preview-versie. Invoer: 128.000
Uitvoer: 32.768
Oktober 2023
o1-mini 2 (2024-09-12) Een snellere en rendabelere optie in de o1-serie, ideaal voor het coderen van taken waarvoor snelheid en lager resourceverbruik nodig zijn.
- Wereldwijde standaardimplementatie is standaard beschikbaar.
- Standaardimplementaties (regionaal) zijn momenteel alleen beschikbaar voor bepaalde klanten die toegang hebben ontvangen als onderdeel van de o1-preview versie met beperkte toegang.
Invoer: 128.000
Uitvoer: 65.536
Oktober 2023

1o1-preview is alleen beschikbaar voor klanten aan wie toegang is verleend als onderdeel van de oorspronkelijke beperkte toegangsronde.

2o1-mini is momenteel beschikbaar voor alle klanten voor wereldwijde standaardimplementatie. Bepaalde klanten kregen standaard- (regionale) implementatietoegang tot o1-mini als onderdeel van de o1-preview release met beperkte toegang. Op dit moment wordt de toegang tot o1-mini regionale standaardimplementaties niet verder uitgebreid.

o3-deep-research is momenteel alleen beschikbaar met Foundry Agent Service. Voor meer informatie, zie de Deep Research-toolrichtlijnen.

Zie Aan de slag met redeneringsmodellen voor meer informatie over geavanceerde o-seriemodellen.

GPT-4o en GPT-4 Turbo

GPT-4o integreert tekst en afbeeldingen in één model, waardoor het meerdere gegevenstypen tegelijk kan verwerken. Deze multimodale benadering verbetert de nauwkeurigheid en reactiesnelheid in interacties tussen menselijke computers. GPT-4o komt overeen met GPT-4 Turbo in het Engels tekst- en coderingstaken en biedt superieure prestaties in niet-Engelse taaltaken en visietaken, waardoor nieuwe benchmarks voor AI-mogelijkheden worden ingesteld.

Zie Region-beschikbaarheid voor Foundry-modellen die worden verkocht door Azure voor beschikbaarheid van modellen in alle regio's, gegroepeerd op implementatiecategorie.

GPT-4- en GPT-4 Turbo-modellen

Deze modellen kunnen alleen worden gebruikt met de API voor chatvoltooiingen. Zie Modelversies voor meer informatie over hoe Azure OpenAI modelversie-upgrades verwerkt. Zie Werken met modellen voor meer informatie over het weergeven en configureren van de modelversie-instellingen van uw GPT-4-implementaties.

Zie Region-beschikbaarheid voor Foundry-modellen die worden verkocht door Azure voor beschikbaarheid van modellen in alle regio's, gegroepeerd op implementatiecategorie.

Mogelijkheden

Model-ID Beschrijving Maximum aantal aanvragen (tokens) Trainingsgegevens (maximaal)
gpt-4o (2024-11-20)
GPT-4o (Omni)
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- JSON-modus.
- Parallelle functie aanroepen.
- Verbeterde nauwkeurigheid en reactiesnelheid.
- Pariteit met Engelse tekst- en coderingstaken vergeleken met GPT-4 Turbo met Vision.
- Superieure prestaties in niet-Engelstalige talen en bij visietaken.
- Verbeterde creatieve schrijfvaardigheid.
Invoer: 128.000
Uitvoer: 16.384
Oktober 2023
gpt-4o (2024-08-06)
GPT-4o (Omni)
- Gestructureerde uitvoer.
- Tekst- en afbeeldingsverwerking.
- JSON-modus.
- Parallelle functie aanroepen.
- Verbeterde nauwkeurigheid en reactiesnelheid.
- Pariteit met Engelse tekst- en coderingstaken vergeleken met GPT-4 Turbo met Vision.
- Superieure prestaties in niet-Engelse talen en bij visietaken.
Invoer: 128.000
Uitvoer: 16.384
Oktober 2023
gpt-4o-mini (2024-07-18)
GPT-4o mini
- Snel, goedkoop, geschikt model ideaal voor het vervangen van GPT-3.5 Turbo-modellen.
- Tekst- en afbeeldingsverwerking.
- JSON-modus.
- Parallelle functie aanroepen.
Invoer: 128.000
Uitvoer: 16.384
Oktober 2023
gpt-4o (2024-05-13)
GPT-4o (Omni)
- Tekst- en afbeeldingsverwerking.
- JSON-modus.
- Parallelle functie aanroepen.
- Verbeterde nauwkeurigheid en reactiesnelheid.
- Pariteit met Engelse tekst- en coderingstaken vergeleken met GPT-4 Turbo met Vision.
- Superieure prestaties in andere talen dan het Engels en bij visietaken.
Invoer: 128.000
Uitvoer: 4.096
Oktober 2023
gpt-4 1 (turbo-2024-04-09)
GPT-4 Turbo met beeldherkenning
Nieuw algemeen beschikbaar model.
- Vervanging voor alle vorige GPT-4 preview-modellen (vision-preview, 1106-Preview, 0125-Preview).
- De beschikbaarheid van functies verschilt momenteel, afhankelijk van de invoermethode en het implementatietype.
Invoer: 128.000
Uitvoer: 4.096
December 2023

1 De ingerichte versie van gpt-4 de versie turbo-2024-04-09 is momenteel beperkt tot alleen tekst. Zie Richtlijnen voor geprovisioneerde implementaties voor meer informatie over geprovisioneerde implementaties.

Voorzichtigheid

We raden u niet aan om preview-modellen in productie te gebruiken. Alle implementaties van preview-modellen worden bijgewerkt naar toekomstige preview-versies of naar de nieuwste stabiele, algemeen beschikbare versie. Modellen die zijn aangewezen preview volgen niet de standaardlevenscyclus van Azure OpenAI-model.

Insluitingen

text-embedding-3-large is het meest recente en meest geschikte insluitmodel. U kunt geen upgrade uitvoeren tussen insluitingsmodellen. Als u wilt overstappen van gebruik text-embedding-ada-002 naar text-embedding-3-large, moet u nieuwe insluitingen genereren.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

Zie Region-beschikbaarheid voor Foundry-modellen die worden verkocht door Azure voor beschikbaarheid van modellen in alle regio's, gegroepeerd op implementatiecategorie.

Mogelijkheden

OpenAI meldt dat uit tests blijkt dat zowel de grote als de kleine embeddingmodellen van de derde generatie betere gemiddelde meertalige retrievalprestaties bieden met de MIRACL-benchmark. Ze behouden nog steeds hun prestaties op Engelse taken met de MTEB-benchmark.

Evaluatiebenchmark text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
MIRACL-gemiddelde 31,4 44.0 54.9
MTEB-gemiddelde 61.0 62.3 64.6

De insluitingsmodellen van de derde generatie ondersteunen het verminderen van de grootte van het insluiten via een nieuwe dimensions parameter. Meestal zijn grotere insluitingen duurder vanuit het perspectief van rekenkracht, geheugen en opslag. Wanneer u het aantal dimensies kunt aanpassen, krijgt u meer controle over de totale kosten en prestaties. De parameter dimensions wordt niet ondersteund in alle versies van de OpenAI 1.x-Python-bibliotheek. Als u wilt profiteren van deze parameter, raden we u aan om een upgrade uit te voeren naar de nieuwste versie: pip install openai --upgrade.

De MTEB-benchmarktests van OpenAI hebben vastgesteld dat zelfs wanneer de afmetingen van het derde generatiemodel worden verlaagd tot minder dan de 1536 dimensies van text-embeddings-ada-002, de prestaties iets beter blijven.

Deze modellen kunnen alleen worden gebruikt met API-aanvragen voor insluiten.

Model-ID Maximum aantal aanvragen (tokens) Uitvoerdimensies Trainingsgegevens (maximaal)
text-embedding-ada-002 (versie 2) 8,192 1,536 Sep 2021
text-embedding-ada-002 (versie 1) 2,046 1,536 Sep 2021
text-embedding-3-large 8,192 3,072 Sep 2021
text-embedding-3-small 8,192 1,536 Sep 2021

Opmerking

Wanneer u een matrix met invoer verzendt voor insluiten, is het maximum aantal invoeritems in de matrix per aanroep naar het eindpunt voor insluiten 2048.

Modellen voor het genereren van afbeeldingen

De modellen voor het genereren van afbeeldingen genereren afbeeldingen op basis van tekstprompts die de gebruiker biedt. Modellen voor het genereren van afbeeldingen zijn onder andere gpt-image-1, gpt-image-1-mini, gpt-image-1.5 en gpt-image-2.

Zie Region-beschikbaarheid voor Foundry-modellen die worden verkocht door Azure voor beschikbaarheid van modellen in alle regio's, gegroepeerd op implementatiecategorie.

Model-ID Maximum aantal aanvragen (tekens)
gpt-image-1 4,000
gpt-image-1-mini 4,000
gpt-image-1.5 4,000

Modellen voor het genereren van video's

Sora is een AI-model van OpenAI dat realistische en fantasierijke videoscènes kan maken op basis van tekstinstructies. Sora bevindt zich in voorbeeldweergave.

Modellen voor het genereren van video's omvatten sora en sora-2.

Model-ID Maximum aantal aanvragen (tekens)
Sora 4,000

Zie Region-beschikbaarheid voor Foundry-modellen die worden verkocht door Azure voor beschikbaarheid van modellen in alle regio's, gegroepeerd op implementatiecategorie.

Audiomodellen

Audiomodellen in Azure OpenAI zijn beschikbaar via de API's realtime, completions en audio.

Zie Region-beschikbaarheid voor Foundry-modellen die worden verkocht door Azure voor beschikbaarheid van modellen in alle regio's, gegroepeerd op implementatiecategorie.

GPT-4o-audiomodellen

De GPT-4o-audiomodellen maken deel uit van de GPT-4o-modelfamilie en ondersteunen ofwel lage latentie, spraak in, gespreksinteracties of audiogeneratie.

Voorzichtigheid

We raden u niet aan preview-modellen in productie te gebruiken. Alle implementaties van preview-modellen worden bijgewerkt naar toekomstige preview-versies of naar de nieuwste stabiele, algemeen beschikbare versie. Modellen die zijn aangewezen preview volgen niet de standaardlevenscyclus van Azure OpenAI-model.

Details over maximum aantal aanvraagtokens en trainingsgegevens zijn beschikbaar in de volgende tabel:

Model-ID Beschrijving Maximum aantal aanvragen (tokens) Trainingsgegevens (maximaal)
gpt-4o-mini-audio-preview (2024-12-17)
Voorbeeld
Audiomodel voor het genereren van audio en tekst. Invoer: 128.000
Uitvoer: 16.384
2023 september
gpt-4o-audio-preview (2024-12-17) Audiomodel voor het genereren van audio en tekst. Invoer: 128.000
Uitvoer: 16.384
2023 september
gpt-4o-realtime-preview (2025-06-03) Audiomodel voor realtime audioverwerking. Invoer: 32.000
Uitvoer: 4.096
Oktober 2023
gpt-4o-realtime-preview (2024-12-17) Audiomodel voor realtime audioverwerking. Invoer: 16.000
Uitvoer: 4.096
Oktober 2023
gpt-4o-mini-realtime-preview (2024-12-17)
Voorbeeld
Audiomodel voor realtime audioverwerking. Invoer: 128.000
Uitvoer: 4.096
Oktober 2023
gpt-audio(28-08-2025)
gpt-audio-mini(06-10-2025)
Audiomodel voor het genereren van audio en tekst. Invoer: 128.00
Uitvoer: 16.384
Oktober 2023
gpt-realtime (2025-08-28) (GA)
gpt-realtime-mini (2025-10-06)
gpt-realtime-mini (2025-12-15)
Audiomodel voor realtime audioverwerking. Invoer: 32.00
Uitvoer: 4.096
Oktober 2023
gpt-audio-1.5 (2026-02-23) Audiomodel voor het genereren van audio en tekst. Invoer: 128.00
Uitvoer: 16.384
2024 september
gpt-realtime-1.5 (2026-02-23) Audiomodel voor realtime audioverwerking. Invoer: 32.00
Uitvoer: 4.096
2024 september

Audio-API

De audiomodellen via de /audio API kunnen worden gebruikt voor spraak naar tekst, vertaling en tekst naar spraak.

Spraak-naar-tekstmodellen

Model-ID Beschrijving Maximale aanvraag (bestandsgrootte van audio)
whisper Spraakherkenningsmodel voor algemeen gebruik. 25 MB
gpt-4o-transcribe (2025-03-20)
Voorbeeld
Spraak-naar-tekstmodel mogelijk gemaakt door GPT-4o. 25 MB
gpt-4o-mini-transcribe (2025-03-20)
Voorbeeld
Spraak-naar-tekstmodel mogelijk gemaakt door GPT-4o mini. 25 MB
gpt-4o-transcribe-diarize (2025-10-15)
Voorbeeld
Spraak-naar-tekstmodel met automatische spraakherkenning. 25 MB
gpt-4o-mini-transcribe (2025-12-15)
Voorbeeld
Spraak-naar-tekstmodel met automatische spraakherkenning. Verbeterde transcriptienauwkeurigheid en robuustheid. 25 MB

Spraakomzettingsmodellen

Model-ID Beschrijving Maximale aanvraag (bestandsgrootte van audio)
whisper Spraakherkenningsmodel voor algemeen gebruik. 25 MB

Tekst-naar-spraak-modellen (preview)

Model-ID Beschrijving
tts
Voorbeeld
Tekst-naar-spraak-model geoptimaliseerd voor snelheid.
tts-hd
Voorbeeld
Tekst-naar-spraak-model geoptimaliseerd voor kwaliteit.
gpt-4o-mini-tts (2025-03-20) Tekst-naar-spraak model mogelijk gemaakt door GPT-4o mini.

U kunt de stem begeleiden om te spreken in een specifieke stijl of toon.
gpt-4o-mini-tts (2025-12-15) Tekst-naar-spraak model mogelijk gemaakt door GPT-4o mini.

U kunt de stem begeleiden om te spreken in een specifieke stijl of toon.

Modellen verfijnen

De volgende modellen worden ondersteund voor het afstemmen:

Model-ID Standaardregio’s Wereldwijd Ontwikkelaar Methoden Status Modaliteit
gpt-4o-mini
(2024-07-18)
VS - noord-centraal
Zweden - centraal
SFT GA Tekst naar tekst
gpt-4o
(2024-08-06)
VS - oost 2
VS - noord-centraal
Zweden - centraal
SFT (Secure File Transfer), DPO (Data Protection Officer) GA Tekst en visie op tekst
gpt-4.1
(2025-04-14)
VS - noord-centraal
Zweden - centraal
SFT (Secure File Transfer), DPO (Data Protection Officer) GA Tekst en visie op tekst
gpt-4.1-mini
(2025-04-14)
VS - noord-centraal
Zweden - centraal
SFT (Secure File Transfer), DPO (Data Protection Officer) GA Tekst naar tekst
gpt-4.1-nano (2025-04-14) VS - noord-centraal
Zweden - centraal
SFT (Secure File Transfer), DPO (Data Protection Officer) GA Tekst naar tekst
o4-mini
(2025-04-16)
VS - oost 2
Zweden - centraal
RFT GA Tekst naar tekst
gpt-5
(2025-08-07)
VS - noord-centraal
Zweden - centraal
RFT Privévoorbeeld Tekst naar tekst
Ministral-3B
(2411)
Niet ondersteund SFT Openbare previewversie Tekst naar tekst
Qwen-32B Niet ondersteund SFT Openbare previewversie Tekst naar tekst
Llama-3.3-70B-Instruct Niet ondersteund SFT Openbare previewversie Tekst naar tekst
gpt-oss-20b Niet ondersteund SFT Openbare previewversie Tekst naar tekst

Of u kunt een eerder fijnafgesteld model verder verfijnen, in de notatie base-model.ft-{jobid}.

Opmerking

Opensource-modellen (Ministral-3B, Qwen-32B, Llama-3.3-70B-Instruct, gpt-oss-20b) worden alleen ondersteund op Foundry-resources en in de nieuwe Foundry UI.

Opmerking

Wereldwijde training biedt goedkopere training per token, maar biedt geen gegevensresidentie. Het is momenteel beschikbaar voor Foundry-resources in de volgende regio's:

  • Australië - oost
  • Brazilië - zuid
  • Canada - centraal
  • Canada Oost
  • Oost-VS
  • Oost-VS 2
  • Frankrijk - centraal
  • Duitsland - west-centraal
  • Italië - noord
  • Japan - oost (geen vision-ondersteuning)
  • Korea Centraal
  • VS - noord-centraal
  • Noorwegen - oost
  • Polen - centraal (geen 4.1-nano-ondersteuning)
  • Azië - zuidoost
  • Zuid-Afrika - noord
  • Zuid-centraal VS
  • Zuid-India
  • Spanje - centraal
  • Zweden - centraal
  • West-Zwitserland
  • Zwitserland - noord
  • UK - Zuid
  • West-Europa
  • Westelijke VS
  • VS West 3

Assistenten (previewversie)

Voor assistenten hebt u een combinatie van een ondersteund model en een ondersteunde regio nodig. Voor bepaalde hulpprogramma's en mogelijkheden zijn de nieuwste modellen vereist. De volgende modellen zijn beschikbaar in de Assistants-API, SDK en Foundry. De volgende tabel is bedoeld voor de standaardimplementatie. Zie Ingerichte doorvoermodellen voor meer informatie over de beschikbaarheid van ingerichte doorvoereenheden. De vermelde modellen en regio's kunnen worden gebruikt met zowel Assistenten v1 als v2. U kunt Global Standard-modellen gebruiken als ze worden ondersteund in de volgende regio's.

Regio gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, 0613 gpt-4, 1106-Voorbeeld gpt-4, 0125-Preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613
australiaeast - - - - -
eastus - - - -
eastus2 - - - -
francecentral - - - - - -
japaneast - - - - - - - - -
norwayeast - - - - - - - - - - -
Zuid-India - - - - - - - - -
swedencentral - -
uksouth - - - - - -
westus - - - - -
westus3 - - - - - -

Buitengebruikstelling van model

Raadpleeg het schema voor buitengebruikstelling van modellen voor de meest recente informatie over buitengebruikstelling van modellen.

Black Forest Labs-modellen verkocht door Azure

Black Forest Labs (BFL) FLUX-modellen brengen geavanceerde generatie van afbeeldingen naar Microsoft Foundry, zodat u afbeeldingen van hoge kwaliteit kunt genereren en bewerken op basis van tekstprompts en referentieafbeeldingen. FLUX-modellen ondersteunen een scala aan mogelijkheden, waaronder het genereren van tekst-naar-afbeelding, het bewerken van afbeeldingen met meerdere verwijzingen en het genereren en bewerken van contexten.

U kunt deze modellen gebruiken via de API van de BFL-serviceprovider en via de images/generations- en images/edits-endpoints.

Zie Deploy en gebruik FLUX-modellen in Microsoft Foundry om met FLUX-modellen te werken in Foundry.

Model Type & API-eindpunt Mogelijkheden Implementatietype (beschikbaarheid van regio's)
FLUX.2-flex
Voorbeeld
Afbeeldingen genereren
- BFL-serviceprovider-API: <resource-name>/providers/blackforestlabs/v1/flux-2-flex
- Invoer: tekst en afbeelding (32.000 tokens en maximaal 10 afbeeldingeni)
- Output: Eén afbeelding
- Aanroepen van hulpprogramma's: No
- Antwoordindelingen: Afbeelding (PNG en JPG)
- Belangrijke functies: Nauwkeurige controle; ondersteuning voor meerdere referentieafbeeldingen voor maximaal 10 afbeeldingen
- Aanvullende parameters:
guidance: Bepaalt hoe nauwkeurig de uitvoer de prompt volgt. Minimum: 1,5, maximum: 10, standaard: 4,5. Hoger = nauwkeurigere navolging van de prompt.
steps: Aantal deductiestappen. Maximum: 50, standaard: 50. Hoger = meer details, langzamer.
- Algemene standaard (alle regio's)
FLUX.2-pro
Voorbeeld
Afbeeldingen genereren
- BFL-serviceprovider-API: <resource-name>/providers/blackforestlabs/v1/flux-2-pro
- Invoer: tekst en afbeelding (32.000 tokens en maximaal 8 afbeeldingenii)
- Output: Eén afbeelding
- Aanroepen van hulpprogramma's: No
- Antwoordindelingen: Afbeelding (PNG en JPG)
- Belangrijkste functies: Ondersteuning voor maximaal 8 referentieafbeeldingen; sterker gebaseerd op kennis van de echte wereld; meer flexibiliteit in de uitvoer; verbeterde prestaties
- Aanvullende parameters:(alleen in providerspecifieke API) ondersteunt alle parameters.
- Algemene standaard (alle regio's)
FLUX.1-Kontext-pro
Voorbeeld
Afbeeldingen genereren
- Afbeeldings-API: https://<resource-name>/openai/deployments/{deployment-id}/images/generations
en
https://<resource-name>/openai/deployments/{deployment-id}/images/edits

- BFL-serviceprovider-API: <resource-name>/providers/blackforestlabs/v1/flux-kontext-pro?api-version=preview
- Invoer: tekst en afbeelding (5.000 tokens en 1 afbeelding)
- Output: Eén afbeelding
- Aanroepen van hulpprogramma's: No
- Antwoordindelingen: Afbeelding (PNG en JPG)
- Belangrijke functies: Tekenconsistentie, geavanceerd bewerken
- Aanvullende parameters:(Alleen providerspecifieke API)seed, aspect ratio, , input_image, prompt_unsampling, , safety_toleranceoutput_format
- Algemene standaard (alle regio's)
FLUX-1.1-pro
Voorbeeld
Afbeeldingen genereren
- Afbeeldings-API: https://<resource-name>/openai/deployments/{deployment-id}/images/generations

- BFL-serviceprovider-API: <resource-name>/providers/blackforestlabs/v1/flux-pro-1.1?api-version=preview
- Invoer: tekst (5.000 tokens en 1 afbeelding)
- Output: Eén afbeelding
- Aanroepen van hulpprogramma's: No
- Antwoordindelingen: Afbeelding (PNG en JPG)
- Belangrijke functies: Snelle deductiesnelheid, sterke naleving van prompts, concurrerende prijzen, schaalbare generatie
- Aanvullende parameters:(Alleen providerspecifieke API)width, height, , prompt_unsampling, seed, , safety_toleranceoutput_format
- Algemene standaard (alle regio's)

i,ii Ondersteuning voor meerdere referentieafbeeldingen is beschikbaar voor FLUX.2 [pro] (preview) en FLUX.2 [flex] (preview) met behulp van de API, maar niet in de speeltuin.

Cohere-modellen die worden verkocht door Azure

De cohere-serie met modellen bevat verschillende modellen die zijn geoptimaliseerd voor verschillende gebruiksvoorbeelden, waaronder chatvoltooiingen, herrankering/tekstclassificatie en insluitingen. Cohere-modellen zijn geoptimaliseerd voor verschillende gebruiksvoorbeelden, waaronder redenering, samenvatting en antwoord op vragen.

Model Type Mogelijkheden Implementatietype (beschikbaarheid van regio's)
Cohere-rerank-v4.0-pro tekstclassificatie (opnieuw rangschikking) - Invoer: tekst
- Uitvoer: tekst
- Talen:en, fr, es, it, de, pt-br, ja, zh-cn, ar, vi, hi, ru, id en nl
- Aanroepen van hulpprogramma's: No
- Antwoordindelingen: JSON
- Algemene standaard (alle regio's)
- Beheerde rekenkracht
Cohere-rerank-v4.0-fast tekstclassificatie (opnieuw rangschikking) - Invoer: tekst
- Uitvoer: tekst
- Talen:en, fr, es, it, de, pt-br, ja, zh-cn, ar, vi, hi, ru, id, en nl
- Aanroepen van hulpprogramma's: No
- Antwoordindelingen: JSON
- Algemene standaard (alle regio's)
- Beheerde rekenkracht
Cohere-command-a chataanvulling - Invoer: tekst (131.072 tokens)
- Uitvoer: tekst (8.182 tokens)
- Talen:en, fr, es, it, de, pt-br, ja, ko, zh-cn, en ar
- Aanroepen van hulpprogramma's: Ja
- Antwoordindelingen: Tekst, JSON
- Algemene standaard (alle regio's)
embed-v-4-0 embeddings - Invoer: tekst (512 tokens) en afbeeldingen (2MM pixels)
- Output: Vector (256, 512, 1024, 1536 dim.)
- Talen:en, fr, es, it, de, pt-br, ja, ko, zh-cn, en ar
- Algemene standaard (alle regio's)

DeepSeek-modellen die worden verkocht door Azure

De DeepSeek-serie met modellen bevat verschillende redeneringsmodellen, die excelleren bij het redeneren van taken met behulp van een stapsgewijs trainingsproces, zoals taal, wetenschappelijke redenering en coderingstaken.

Model Type Mogelijkheden Implementatietype (beschikbaarheid van regio's)
DeepSeek-V4-Pro
Voorbeeld
chataanvulling
(met redeneringsinhoud)
- Invoer: tekst (1.000.000 tokens)
- Uitvoer: tekst (384.000 tokens)
- Talen:en en zh
- Aanroepen van hulpprogramma's: No
- Antwoordindelingen: Tekst, JSON
- Algemene standaard (alle regio's)
DeepSeek-V4-Flash
Voorbeeld
chat-aanvulling
(met redeneringsinhoud)
- Invoer: tekst (1.000.000 tokens)
- Uitvoer: tekst (384.000 tokens)
- Talen:en en zh
- Aanroepen van hulpprogramma's: No
- Antwoordindelingen: Tekst, JSON
- Algemene standaard (alle regio's)
DeepSeek-V3.2-Speciale
Voorbeeld
chat-aanvulling
(met redeneringsinhoud)
- Invoer: tekst (128.000 tokens)
- Uitvoer: tekst (128.000 tokens)
- Talen:en en zh
- Aanroepen van hulpprogramma's: No
- Antwoordindelingen: Tekst, JSON
- Algemene standaard (alle regio's)
DeepSeek-V3.2
Voorbeeld
chataanvulling
(met redeneringsinhoud)
- Invoer: tekst (128.000 tokens)
- Uitvoer: tekst (128.000 tokens)
- Talen:en en zh
- Aanroepen van hulpprogramma's: No
- Antwoordindelingen: Tekst, JSON
- Algemene standaard (alle regio's)
DeepSeek-V3.1
Voorbeeld
chataanvulling
(met redeneringsinhoud)
- Invoer: tekst (131.072 tokens)
- Uitvoer: tekst (131.072 tokens)
- Talen:en en zh
- Aanroepen van hulpprogramma's: Ja
- Antwoordindelingen: Tekst, JSON
- Algemene standaard (alle regio's)
DeepSeek-R1-0528
Voorbeeld
chataanvulling
(met redeneringsinhoud)
- Invoer: tekst (163.840 tokens)
- Uitvoer: tekst (163.840 tokens)
- Talen:en en zh
- Aanroepen van hulpprogramma's: No
- Antwoordindelingen: Tekst
- Algemene standaard (alle regio's)
- Wereldwijd ingericht (alle regio's)
DeepSeek-V3-0324
Voorbeeld
chat-aanvulling - Invoer: tekst (131.072 tokens)
- Uitvoer: tekst (131.072 tokens)
- Talen:en en zh
- Aanroepen van hulpprogramma's: Ja
- Antwoordindelingen: Tekst, JSON
- Algemene standaard (alle regio's)
- Wereldwijd ingericht (alle regio's)
DeepSeek-R1 chataanvulling
(met redeneringsinhoud)
- Invoer: tekst (163.840 tokens)
- Uitvoer: tekst (163.840 tokens)
- Talen:en en zh
- Aanroepen van hulpprogramma's: No
- Antwoordindelingen: Tekst
- Algemene standaard (alle regio's)
- Wereldwijd ingericht (alle regio's)

Modellen van Meta die worden verkocht door Azure

Meta Llama-modellen en -hulpprogramma's zijn een verzameling vooraf getrainde en verfijnde AI-tekst- en afbeeldingsredenmodellen. Metamodellen variëren in schaal om het volgende op te nemen:

  • Kleine taalmodellen (SLM’s), zoals 1B- en 3B-Base- en Instruct-modellen, voor inferentie op apparaten en aan de rand van het netwerk
  • Middelgrote grote taalmodellen (LLM's) zoals 7B, 8B en 70B Base- en Instruct-modellen
  • Krachtige modellen zoals Meta Llama 3.1-405B Instruct voor toepassingen op het gebied van synthetische gegevensgeneratie en distillatie.
Model Type Mogelijkheden Implementatietype (beschikbaarheid van regio's)
Llama-4-Maverick-17B-128E-Instruct-FP8
Voorbeeld
chataanvulling - Invoer: tekst en afbeeldingen (1M-tokens)
- Uitvoer: tekst (1M-tokens)
- Talen:ar, en, fr, de, hi, id, it, pt, es, tl, th en vi
- Aanroepen van hulpprogramma's: No
- Antwoordindelingen: Tekst
- Algemene standaard (alle regio's)
Llama-3.3-70B-Instruct
Voorbeeld
chataanvulling - Invoer: tekst (128.000 tokens)
- Uitvoer: tekst (8.192 tokens)
- Talen:en, de, fr, it, pt, hi, es en th
- Aanroepen van hulpprogramma's: No
- Antwoordindelingen: Tekst
- Algemene standaard (alle regio's)
- Wereldwijd ingericht (alle regio's)

Er zijn ook verschillende Meta-modellen beschikbaar van partners en community's.

Microsoft modellen die worden verkocht door Azure

Microsoft modellen omvatten verschillende modelgroepen, zoals Model Router, MAI-modellen, Phi-modellen, AI-modellen voor gezondheidszorg en meer. Er zijn ook verschillende Microsoft modellen beschikbaar van partners en community.

Om met MAI-Image-2e- en MAI-Image-2-tekst-naar-afbeeldinggeneratiemodellen in Foundry te werken, raadpleegt u MAI-modellen implementeren en gebruiken in Microsoft Foundry.

Model Type Mogelijkheden Implementatietype (beschikbaarheid van regio's)
MAI-Image-2e
Voorbeeld
Tekst naar afbeelding. Zie HET API-eindpunt voor meer informatie. - Invoer: tekst
- Output: Eén afbeelding
- Contextlengte: 32.000 tokens
- Aanroepen van hulpprogramma's: No
- Antwoordindelingen: Afbeelding (PNG)
- Talen:en
- Belangrijke functies: Generatie van tekst-naar-afbeelding van hoge kwaliteit; fotorealistische afbeeldingssynthese met consistente visuele structuur; geschikt voor productafbeeldingen, marketingvisuals, merkactiva en commerciële creatieve werkstromen.
- Parameters:width, , heightprompt
Minimaal 768×768 pixels; maximumaantal pixels 1.048.576 (gelijk aan 1024×1024). Beide dimensies kunnen groter zijn dan 1024 zolang het totale aantal pixels binnen de limiet blijft (bijvoorbeeld 768×1365).
- Wereldwijde standaard (VS - west-centraal, VS - oost, VS - west, Europa - west, Zweden - centraal, India - zuid)
MAI-Image-2
Voorbeeld
Tekst naar afbeelding. Zie HET API-eindpunt voor meer informatie. - Invoer: tekst
- Output: Eén afbeelding
- Contextlengte: 32.000 tokens
- Aanroepen van hulpprogramma's: No
- Antwoordindelingen: Afbeelding (PNG)
- Talen:en
- Belangrijke functies: Generatie van tekst-naar-afbeelding van hoge kwaliteit; fotorealistische afbeeldingssynthese met consistente visuele structuur; geschikt voor productafbeeldingen, marketingvisuals, merkactiva en commerciële creatieve werkstromen.
- Parameters:width, , heightprompt
Minimaal 768×768 pixels; maximumaantal pixels 1.048.576 (gelijk aan 1024×1024). Beide dimensies kunnen groter zijn dan 1024 zolang het totale aantal pixels binnen de limiet blijft (bijvoorbeeld 768×1365).
- Wereldwijde standaard (VS - west-centraal, VS - oost, VS - west, Europa - west, Zweden - centraal, India - zuid)
model-router 1 chataanvulling Meer informatie in het overzicht van modelrouters.
- Invoer: tekst, afbeelding
- Uitvoer: tekst (max. uitvoertokens variëren2)
Contextvenster: 200.0003
- Talen:en
- Wereldwijde standaard (VS - oost 2, Zweden - centraal)
- Data Zone standard4 (VS - oost 2, Zweden - centraal)

1Versie van de modelrouter2025-11-18. Eerdere versies (2025-08-07 en 2025-05-19) zijn ook beschikbaar.

2Max-uitvoertokens variëren voor onderliggende modellen in de modelrouter. Bijvoorbeeld 32.768 (GPT-4.1 series), 100.000 (o4-mini), 128.000 (gpt-5 reasoning models) en 16.384 (gpt-5-chat).

3 Grotere contextvensters zijn compatibel met enkele van de onderliggende modellen van de modelrouter. Dat betekent dat een API-aanroep met een grotere context alleen slaagt als de prompt naar een van deze modellen wordt doorgestuurd. Anders mislukt de aanroep.

4 Facturering voor routerimplementaties van het standaardmodel voor gegevenszones begint niet eerder dan 1 november 2025.

Mistral modellen verkocht door Azure

Model Type Mogelijkheden Implementatietype (beschikbaarheid van regio's)
mistral-document-ai-2512 Afbeelding naar tekst - Invoer: afbeeldings- of PDF-pagina's (30 pagina's, maximaal 30 MB PDF-bestand)
- Uitvoer: tekst
- Talen:en
- Aanroepen van hulpprogramma's: nee
- Antwoordindelingen: Tekst, JSON, Markdown
- Algemene standaard (alle regio's)
- Gegevenszonestandaard (VS en EU)
mistral-document-ai-2505
Voorbeeld
Afbeelding naar tekst - Invoer: afbeeldings- of PDF-pagina's (30 pagina's, maximaal 30 MB PDF-bestand)
- Uitvoer: tekst
- Talen:en
- Aanroepen van hulpprogramma's: nee
- Antwoordindelingen: Tekst, JSON, Markdown
- Algemene standaard (alle regio's)
- Gegevenszonestandaard (VS en EU)
Mistral-Large-3
Voorbeeld
chat-aanvulling - Invoer: tekst, afbeelding
- Uitvoer: tekst
- Talen:en, fr, de, es, it, pt, nl, zh, ja, ko, en ar
- Aanroepen van hulpprogramma's: Ja
- Antwoordindelingen: Tekst, JSON
- Algemene standaard (alle regio's)
- Gegevenszonestandaard (VS en EU)

Er zijn ook verschillende Mistral-modellen beschikbaar van partners en community's.

Moonshot AI-modellen verkocht via Azure

Moonshot AI-modellen zijn Kimi K2.6 (preview) en Kimi K2.5 (preview), multimodale redeneringsmodellen die tekst- en afbeeldingsinvoer accepteren.

Model Type Mogelijkheden Implementatietype (beschikbaarheid van regio's)
Kimi-K2.6
Voorbeeld
chataanvulling
(met redeneringsinhoud)
- Invoer: tekst en afbeelding (262.144 tokens)
- Uitvoer: tekst (262.144 tokens)
- Talen:en en zh
- Aanroepen van hulpprogramma's: Ja
- Antwoordindelingen: Tekst
- Algemene standaard (alle regio's)
Kimi-K2.5
Voorbeeld
chataanvulling
(met redeneringsinhoud)
- Invoer: tekst en afbeelding (262.144 tokens)
- Uitvoer: tekst (262.144 tokens)
- Talen:en en zh
- Aanroepen van hulpprogramma's: Ja
- Antwoordindelingen: Tekst
- Algemene standaard (alle regio's)

Bekijk deze modelverzameling in de Foundry-portal.

xAI-modellen verkocht door Azure

Grok-modellen van xAI in Foundry Models bevatten een diverse set redenerings- en niet-redenerende modellen die zijn ontworpen voor zakelijke gebruiksvoorbeelden, zoals gegevensextractie, codering, samenvatting van tekst en agentische toepassingen.

Registratie is vereist voor toegang totgrok-code-fast-1 (Preview) en grok-4.

Model Type Mogelijkheden Implementatietype (beschikbaarheid van regio's)
grok-4.3
Voorbeeld
chat-aanvulling - Invoer: tekst (200.000 tokens)
- Uitvoer: tekst (8.192 tokens)
- Talen:en
- Aanroepen van hulpprogramma' s: ja
- Antwoordindelingen: tekst
- Algemene standaard (alle regio's)
grok-4-20-reasoning
Voorbeeld
chat-aanvulling - Invoer: tekst (262.000 tokens)
- Uitvoer: tekst (8.192 tokens)
- Talen:en
- Aanroepen van hulpprogramma' s: ja
- Antwoordindelingen: tekst
- Algemene standaard (alle regio's)
grok-4-20-non-reasoning
Voorbeeld
chataanvulling - Invoer: tekst (262.000 tokens)
- Uitvoer: tekst (8.192 tokens)
- Talen:en
- Aanroepen van hulpprogramma' s: ja
- Antwoordindelingen: tekst
- Algemene standaard (alle regio's)
grok-4.1-fast-reasoning
Voorbeeld
chat-aanvulling - Invoer: tekst, afbeelding (128.000 tokens)
- Uitvoer: tekst (128.000 tokens)
- Talen:en
- Aanroepen van hulpprogramma' s: ja
- Antwoordindelingen: tekst
- Algemene standaard (alle regio's)
grok-4.1-fast-non-reasoning
Voorbeeld
chat-aanvulling - Invoer: tekst, afbeelding (128.000 tokens)
- Uitvoer: tekst (128.000 tokens)
- Talen:en
- Aanroepen van hulpprogramma' s: ja
- Antwoordindelingen: tekst
- Algemene standaard (alle regio's)
grok-4 chat-aanvulling - Invoer: tekst (262.000 tokens)
- Uitvoer: tekst (8.192 tokens)
- Talen:en
- Aanroepen van hulpprogramma' s: ja
- Antwoordindelingen: tekst
- Algemene standaard (alle regio's)
grok-code-fast-1
Voorbeeld
chat-aanvulling - Invoer: tekst (256.000 tokens)
- Uitvoer: tekst (8.192 tokens)
- Talen:en
- Aanroepen van hulpprogramma' s: ja
- Antwoordindelingen: tekst
- Algemene standaard (alle regio's)

Beschikbaarheid van modelregio's per implementatietype

Microsoft Foundry biedt klanten keuzes in de hostingstructuur die past bij hun bedrijfs- en gebruikspatronen. De service biedt twee hoofdimplementatiecategorieën:

  • Standaard: heeft een globale implementatieoptie, verkeer globaal routeren om een hogere doorvoer te bieden.
  • Provisioned: Er is ook een globale implementatieoptie waarmee klanten ingerichte doorvoereenheden kunnen aanschaffen en implementeren in Azure globale infrastructuur.

Andere implementatiecategorieën, zoals batch, zijn ook beschikbaar. Zie Deployment-typen voor Microsoft Foundry Models voor meer informatie over alle beschikbare modelimplementatietypen.

Wereldwijde beschikbaarheid van standard-modellen

Regio FLUX.2 flex FLUX.2-pro FLUX.1-Kontext-pro FLUX-1.1-pro Cohere-rerank-v4.0-pro Cohere-rerank-v4.0-fast cohere-command-a embed-v-4-0 DeepSeek-V3.2-Speciale DeepSeek-V3.2 DeepSeek-V3.1 DeepSeek-R1-0528 DeepSeek-V3-0324 DeepSeek-R1 Llama-4-Maverick-17B-128E-Instruct-FP8 Llama-3.3-70B-Instruct MAI-Image-2 model-router mistral-document-ai-2512 mistral-document-ai-2505 Mistral-Large-3 Kimi-K2.5 grok-4-1-fast-reasoning grok-4-1-fast-non-reasoning grok-4-fast-reasoning grok-4-fast-non-reasoning grok-3 grok-3-mini
australiaeast - -
brazilsouth - -
canadacentral - -
canadaeast - -
centralus - -
eastus -
eastus2 -
francecentral - -
germanywestcentral - -
italynorth - -
japaneast - -
japanwest - -
koreacentral - -
northcentralus - -
norwayeast - -
Polencentral - -
southafricanorth - -
southcentralus - -
southindia -
spaincentral - -
swedencentral
zwitserlandnoord - -
zwitserlandwest - -
uaenorth - -
uksouth - -
westcentralus -
westeurope -
westus -
westus2 - -
westus3 - -