Foundry-modeller som säljs av Azure

Microsoft Foundry Models i modellkatalogen består av två huvudkategorier, nämligen Foundry Models som säljs av Azure och Foundry Models från partners och community. I den här artikeln visas ett urval av Foundry-modeller som säljs av Azure, tillsammans med deras funktioner, distributionstyper och tillgänglighetsområden, exklusive inaktuella och tillbakadragna modeller. Foundry-modeller som säljs av Azure kallas även Direct från Azure Models eller Azure Direct Models.

Modeller som säljs av Azure hanteras också av Azure och drivs av Azure som en del av Foundry Models-tjänsten. De omfattar alla Azure OpenAI-modeller och specifika väljna modeller från de främsta leverantörerna. Dessa modeller debiteras via din Azure-prenumeration, som omfattas av Azure serviceavtal och stöds av Microsoft. En lista över foundry-modeller som stöds av Foundry Agent Service finns i Modeller som stöds av agenttjänsten och en lista över foundry-modeller från partner finns i Foundry Models from partners and community (Foundry-modeller från partner och community).

Tips

Använd flikarna överst på den här sidan för att växla mellan Azure OpenAI-modeller och Other-modellsamlingar från leverantörer som Cohere, DeepSeek, Meta, Mistral AI och xAI.

Azure OpenAI i Microsoft Foundry-modeller

Azure OpenAI drivs av en mängd olika modeller med olika funktioner och prispunkter. Modelltillgängligheten varierar beroende på region och moln.

Information om regiontillgänglighet för Azure OpenAI i Microsoft Foundry-modeller grupperade efter distributionskategori finns i Regiontillgänglighet för Foundry-modeller som säljs av Azure.
För modelltillgänglighet i Azure Government, se Azure OpenAI i Azure Government.

Modellhöjdpunkter

Modeller	Beskrivning
GPT-chat-latest (förhandsversion)	NYA`gpt-chat-latest`Förhandsgranska
GPT-5.5-serien	NYA`gpt-5.5`
GPT-5.4-serien	`gpt-5.4-mini`, `gpt-5.4-nano`, , `gpt-5.4gpt-5.4-pro`
GPT-5.3-serien	`gpt-5.3-chat`, `gpt-5.3-codex`
GPT-5.2-serien	`gpt-5.2-codex`, `gpt-5.2`, `gpt-5.2-chat`Förhandsversion
GPT-5.1-serien	`gpt-5.1`, `gpt-5.1-chat`Förhandsversion, `gpt-5.1-codex`, `gpt-5.1-codex-mini`
Sora	NY sora-2
GPT-5-serien	`gpt-5`, `gpt-5-mini`, `gpt-5-nano`, `gpt-5-chat`
gpt-oss	resonemangsmodeller med öppna vikter
codex-mini	Finjusterad version av `o4-mini`.
GPT-4.1-serien	`gpt-4.1`, `gpt-4.1-mini`, `gpt-4.1-nano`
datoranvändningsförhandsgranskning	En experimentell modell tränad för användning med ett verktyg för datoranvändning inom Svars-API:et.
o-seriemodeller	Resonemangsmodeller med avancerad problemlösning och ökad fokusering och kapacitet.
GPT-4o, GPT-4o mini och GPT-4 Turbo	Kapabel Azure OpenAI-modeller med multimodala versioner, som kan acceptera både text och bilder som indata.
Inbäddningar	En uppsättning modeller som kan konvertera text till numerisk vektorform för att underlätta textlikhet.
Bildgenerering	En serie modeller som kan generera ursprungliga bilder från naturligt språk.
`Video generation`	En modell som kan generera ursprungliga videoscener från textinstruktioner.
Ljud	En serie modeller för tal till text, översättning och text till tal. GPT-4o ljudmodeller stödjer antingen låglatens till-tal- och från-tal-konversationsinteraktioner eller ljudgenerering.

GPT-chat-latest

För modelltillgänglighet i alla regioner, grupperade efter distributionskategori, se Regiontillgänglighet för Foundry-modeller som säljs efter Azure.

Kapacitet

Modell-ID	Beskrivning	Kontextfönster	Maximalt antal utdatatoken	Träningsdata (upp till)
`gpt-chat-latest` (2026-05-05) Förhandsgranska	- Resonemang – API för slutförande av chattar. - Api för svar. – Strukturerade utdata – Funktioner, verktyg och parallella verktygsanrop.	128,000 Indata: 111 616 Utdata: 16 384	16,384	Augusti 2025

Observera

Du kan också se den här modellen som av OpenAI kallas GPT-5.5 Instant eller i OpenAI API som chat-latest. I Microsoft Foundry introducerar vi gpt-chat-latest som produktnamn för den här versionen. Modellen fortsätter att följa den befintliga förhandsgranskningslivscykeln och standardmeddelandeperioderna. Vi utvärderar också sätt att förenkla hur kunder får åtkomst till kontinuerligt uppdaterade modeller över tid, men det aktuella beteendet förblir oförändrat allt eftersom arbetet fortsätter.

GPT-5.5

För modelltillgänglighet i alla regioner, grupperade efter distributionskategori, se Regiontillgänglighet för Foundry-modeller som säljs efter Azure.

Kapacitet

Modell-ID	Beskrivning	Kontextfönster	Maximalt antal utdatatoken	Träningsdata (upp till)
`gpt-5.5` (2026-04-24)	- Resonemang - Api för svar. – API för slutförande av chattar. – Strukturerade utdata. – Text- och bildbearbetning. – Funktioner, verktyg och parallella verktygsanrop. - Datoranvändning - Fullständig sammanfattning av funktioner.	1 050 000 br> Indata: 922 000 Utdata: 128 000	128,000	December 2025

Observera

Vissa kvotnivåer kräver kvotbegäranden för gpt-5.5 att kunna distribuera den här modellen. Prenumerationer på nivå 5 och nivå 6 har som standard kvot.

GPT-5.4

För modelltillgänglighet i alla regioner, grupperade efter distributionskategori, se Regiontillgänglighet för Foundry-modeller som säljs efter Azure.

Kapacitet

Modell-ID	Beskrivning	Kontextfönster	Maximalt antal utdatatoken	Träningsdata (upp till)
`gpt-5.4` (2026-03-05)	- Resonemang - Api för svar. – API för slutförande av chattar. – Strukturerade utdata. – Text- och bildbearbetning. – Funktioner, verktyg och parallella verktygsanrop. - Datoranvändning - Fullständig sammanfattning av funktioner.	1,050,000	128,000	Augusti 2025
`gpt-5.4-pro` (2026-03-05)	- Resonemang - Api för svar. – Text- och bildbearbetning. - Funktioner och verktyg - Fullständig sammanfattning av funktioner.	1,050,000	128,000	Augusti 2025
`gpt-5.4-mini` (2026-03-17)	- Resonemang - Api för svar. – API för slutförande av chattar. – Strukturerade utdata. – Text- och bildbearbetning. – Funktioner, verktyg och parallella verktygsanrop. - Datoranvändning - Fullständig sammanfattning av funktioner.	400,000 Indata: 272 000 Utdata: 128 000	128,000	Augusti 2025
`gpt-5.4-nano` (2026-03-17)	- Resonemang - Api för svar. – API för slutförande av chattar. – Strukturerade utdata. – Text- och bildbearbetning. – Funktioner, verktyg och parallella verktygsanrop. - Fullständig sammanfattning av funktioner.	400,000 Indata: 272 000 Utdata: 128 000	128,000	Augusti 2025

GPT-5.3

För modelltillgänglighet i alla regioner, grupperade efter distributionskategori, se Regiontillgänglighet för Foundry-modeller som säljs efter Azure.

Kapacitet

Modell-ID	Beskrivning	Kontextfönster	Maximalt antal utdatatoken	Träningsdata (upp till)
`gpt-5.3-codex` (2026-02-24)	- Resonemang - Api för svar. – Strukturerade utdata. – Text- och bildbearbetning. – Funktioner, verktyg och parallella verktygsanrop. - Fullständig sammanfattning av funktioner. – Optimerad för Codex CLI- och Codex VS Code-tillägg	400,000 Indata: 272 000 Utdata: 128 000	128,000	Augusti 2025
`gpt-5.3-chat` (2026-03-03) Förhandsgranska	– API för slutförande av chattar. - Api för svar. – Strukturerade utdata – Funktioner, verktyg och parallella verktygsanrop.	128,000 Indata: 111 616 Utdata: 16 384	16,384	Augusti 2025

GPT-5.2

För modelltillgänglighet i alla regioner, grupperade efter distributionskategori, se Regiontillgänglighet för Foundry-modeller som säljs efter Azure.

Kapacitet

Modell-ID	Beskrivning	Kontextfönster	Maximalt antal utdatatoken	Träningsdata (upp till)
`gpt-5.2-codex` (2026-01-14)	- Resonemang - Api för svar. – Strukturerade utdata. – Text- och bildbearbetning. – Funktioner, verktyg och parallella verktygsanrop. - Fullständig sammanfattning av funktioner. – Optimerad för Codex CLI- och Codex VS Code-tillägg	400,000 Indata: 272 000 Utdata: 128 000	128,000
`gpt-5.2` (2025-12-11)	- Resonemang – API för slutförande av chattar. - Api för svar. – Strukturerade utdata. – Text- och bildbearbetning. – Funktioner, verktyg och parallella verktygsanrop. - Fullständig sammanfattning av funktioner.	400,000 Indata: 272 000 Utdata: 128 000	128,000	Augusti 2025
`gpt-5.2-chat` (2025-12-11) Förhandsgranska	– API för slutförande av chattar. - Api för svar. – Strukturerade utdata – Funktioner, verktyg och parallella verktygsanrop.	128,000 Indata: 111 616 Utdata: 16 384	16,384	Augusti 2025
`gpt-5.2-chat` (2026-02-10) Förhandsgranska	– API för slutförande av chattar. - Api för svar. – Strukturerade utdata – Funktioner, verktyg och parallella verktygsanrop.	128,000 Indata: 111 616 Utdata: 16 384	16,384	Augusti 2025

Försiktighet

Vi rekommenderar inte att du använder förhandsgranskningsmodeller i produktion. Vi uppgraderar alla distributioner av förhandsversioner till antingen framtida förhandsversioner eller till den senaste stabila, allmänt tillgängliga versionen. Modeller som är avsedda förhandsgranskning följer inte standardlivscykeln Azure OpenAI-modell.

GPT-5.1

För modelltillgänglighet i alla regioner, grupperade efter distributionskategori, se Regiontillgänglighet för Foundry-modeller som säljs efter Azure.

Kapacitet

Modell-ID	Beskrivning	Kontextfönster	Maximalt antal utdatatoken	Träningsdata (upp till)
`gpt-5.1` (2025-11-13)	- Resonemang – API för slutförande av chattar. - Api för svar. – Strukturerade utdata. – Text- och bildbearbetning. – Funktioner, verktyg och parallella verktygsanrop. - Fullständig sammanfattning av funktioner.	400,000 Indata: 272 000 Utdata: 128 000	128,000	den 30 september 2024
`gpt-5.1-chat` (2025-11-13) Förhandsgranska	- Resonemang – API för slutförande av chattar. - Api för svar. – Strukturerade utdata – Funktioner, verktyg och parallella verktygsanrop.	128,000 Indata: 111 616 Utdata: 16 384	16,384	den 30 september 2024
`gpt-5.1-codex` (2025-11-13)	- Svars-API endast. - Text- och bildbearbetning – Strukturerade utdata. – Funktioner, verktyg och parallella verktygsanrop. - Fullständig sammanfattning av funktioner – Optimerad för Codex CLI- och Codex VS Code-tillägg	400,000 Indata: 272 000 Utdata: 128 000	128,000	den 30 september 2024
`gpt-5.1-codex-mini` (2025-11-13)	- Svars-API endast. - Text- och bildbearbetning – Strukturerade utdata. – Funktioner, verktyg och parallella verktygsanrop. - Fullständig sammanfattning av funktioner – Optimerad för Codex CLI- och Codex VS Code-tillägg	400,000 Indata: 272 000 Utdata: 128 000	128,000	den 30 september 2024
`gpt-5.1-codex-max` (2025-12-04)	- Svars-API endast. - Text- och bildbearbetning – Strukturerade utdata. – Funktioner, verktyg och parallella verktygsanrop. - Fullständig sammanfattning av funktioner – Optimerad för Codex CLI- och Codex VS Code-tillägg	400,000 Indata: 272 000 Utdata: 128 000	128,000	den 30 september 2024

Försiktighet

Viktigt

gpt-5.1 reasoning_effort standardvärdet är none. När du uppgraderar från tidigare resonemangsmodeller till gpt-5.1bör du tänka på att du kan behöva uppdatera koden för att uttryckligen skicka en reasoning_effort nivå om du vill att resonemanget ska ske.
gpt-5.1-chat lägger till inbyggda resonemangsfunktioner. Precis som andra resonemangsmodeller stöder den inte parametrar som temperature. Om du uppgraderar från att använda gpt-5-chat (vilket inte är en resonemangsmodell) till att använda gpt-5.1-chat, se till att du tar bort anpassade parametrar som temperature från din kod, eftersom de inte stöds av resonemangsmodeller.
gpt-5.1-codex-max lägger till stöd för inställningen reasoning_effort till xhigh. Det går inte att none resonera med gpt-5.1-codex-max.

GPT-5

För modelltillgänglighet i alla regioner, grupperade efter distributionskategori, se Regiontillgänglighet för Foundry-modeller som säljs efter Azure.

Kapacitet

Modell-ID	Beskrivning	Kontextfönster	Maximalt antal utdatatoken	Träningsdata (upp till)
`gpt-5` (2025-08-07)	- Resonemang – API för slutförande av chattar. - Api för svar. – Strukturerade utdata. – Text- och bildbearbetning. – Funktioner, verktyg och parallella verktygsanrop. - Fullständig sammanfattning av funktioner.	400,000 Indata: 272 000 Utdata: 128 000	128,000	den 30 september 2024
`gpt-5-mini` (2025-08-07)	- Resonemang – API för slutförande av chattar. - Api för svar. – Strukturerade utdata. – Text- och bildbearbetning. – Funktioner, verktyg och parallella verktygsanrop. - Fullständig sammanfattning av funktioner.	400,000 Indata: 272 000 Utdata: 128 000	128,000	31 maj 2024
`gpt-5-nano` (2025-08-07)	- Resonemang – API för slutförande av chattar. - Api för svar. – Strukturerade utdata. – Text- och bildbearbetning. – Funktioner, verktyg och parallella verktygsanrop. - Fullständig sammanfattning av funktioner.	400,000 Indata: 272 000 Utdata: 128 000	128,000	31 maj 2024
`gpt-5-chat` (2025-08-07) Förhandsgranska	– API för slutförande av chattar. - Api för svar. - Indata: Text/bild - Utdata: Endast text	128,000	16,384	den 30 september 2024
`gpt-5-chat` (2025-10-03) Förhandsversion¹	– API för slutförande av chattar. - Api för svar. - Indata: Text/bild - Utdata: Endast text	128,000	16,384	den 30 september 2024
`gpt-5-codex` (2025-09-11)	- Svars-API endast. - Indata: Text/bild - Utdata: Endast text – Strukturerade utdata. – Text- och bildbearbetning. – Funktioner, verktyg och parallella verktygsanrop. - Fullständig sammanfattning av funktioner – Optimerad för Codex CLI- och Codex VS Code-tillägg	400,000 Indata: 272 000 Utdata: 128 000	128,000	-
`gpt-5-pro` (2025-10-06)	- Resonemang - Api för svar. – Strukturerade utdata. – Text- och bildbearbetning. – Funktioner och verktyg - Fullständig sammanfattning av funktioner.	400,000 Indata: 272 000 Utdata: 128 000	128,000	den 30 september 2024

Observera

¹gpt-5-chat version 2025-10-03 introducerar en betydande förbättring med fokus på känslomässig intelligens och mental hälsa funktioner. Den här uppgraderingen integrerar specialiserade datamängder och förfinade svarsstrategier för att förbättra modellens förmåga att:

Förstå och tolka känslosammanhang mer exakt, vilket möjliggör nyanserade och empatiska interaktioner.
Ge stödjande och ansvarsfulla svar i konversationer som rör psykisk hälsa, vilket säkerställer känslighet och efterlevnad av bästa praxis.

Dessa förbättringar syftar till att göra GPT-5-chat mer sammanhangsmedvetna, människocentrerade och tillförlitliga i scenarier där känslomässiga ton- och välbefinnandeöverväganden är kritiska.

Försiktighet

gpt-oss

För modelltillgänglighet i alla regioner, grupperade efter distributionskategori, se Regiontillgänglighet för Foundry-modeller som säljs efter Azure.

Kapacitet

Modell-ID	Beskrivning	Kontextfönster	Maximalt antal utdatatoken	Träningsdata (upp till)
`gpt-oss-120b` ¹ (förhandsversion)	– Endast textinmatning och textutmatning – API för chattens slutförande -Streaming – Funktionsanrop – Strukturerade utdata -Resonemang – Tillgänglig för distribution¹ och via hanterad beräkning	131,072	131,072	31 maj 2024
`gpt-oss-20b` (Förhandsversion)	– Endast textinmatning och textutmatning – API för chattens slutförande -Streaming – Funktionsanrop – Strukturerade utdata -Resonemang – Tillgänglig via hanterad beräkning och Foundry Local	131,072	131,072	31 maj 2024

¹ Till skillnad från andra Azure OpenAI-modeller gpt-oss-120b kräver ett Foundry-projekt för att distribuera modellen.

Lansera med kod

az cognitiveservices account deployment create \
  --name "Foundry-project-resource" \
  --resource-group "test-rg" \
  --deployment-name "gpt-oss-120b" \
  --model-name "gpt-oss-120b" \
  --model-version "1" \
  --model-format "OpenAI-OSS" \
  --sku-capacity 10 \
  --sku-name "GlobalStandard"

GPT-4.1-serien

För modelltillgänglighet i alla regioner, grupperade efter distributionskategori, se Regiontillgänglighet för Foundry-modeller som säljs efter Azure.

Kapacitet

Modell-ID	Beskrivning	Kontextfönster	Maximalt antal utdatatoken	Träningsdata (upp till)
`gpt-4.1` (2025-04-14)	– Text- och bildinmatning – Textutmatning – API för chattens slutförande – Svars-API -Streaming – Funktionsanrop – Strukturerade utdata (chattavslut)	- 1,047,576 – 300 000 (standard- och konfigurerade hanterade utplaceringar) – 128 000 (partidistributioner)	32,768	31 maj 2024
`gpt-4.1-nano` (2025-04-14)	– Text- och bildinmatning – Textutmatning – API för chattens slutförande – Svars-API -Streaming – Funktionsanrop – Strukturerade utdata (chattavslut)	- 1,047,576 – 300 000 (standard- och konfigurerade hanterade utplaceringar) – 128 000 (partidistributioner)	32,768	31 maj 2024
`gpt-4.1-mini` (2025-04-14)	– Text- och bildinmatning – Textutmatning – API för chattens slutförande – Svars-API -Streaming – Funktionsanrop – Strukturerade utdata (chattavslut)	- 1,047,576 – 300 000 (standard- och konfigurerade hanterade utplaceringar) – 128 000 (partidistributioner)	32,768	31 maj 2024

Känt problem

Ett känt problem påverkar alla GPT 4.1-seriemodeller. Stora verktygs- eller funktionsanropsdefinitioner som överskrider 300 000 token resulterar i fel, även om gränsen på 1 miljon tokenkontexter för modellerna inte uppnåddes.

Felen kan variera beroende på API-anrop och underliggande nyttolastegenskaper.

Här är felmeddelandena för API:et för chattens slutförande:

Error code: 400 - {'error': {'message': "This model's maximum context length is 300000 tokens. However, your messages resulted in 350564 tokens (100 in the messages, 350464 in the functions). Please reduce the length of the messages or functions.", 'type': 'invalid_request_error', 'param': 'messages', 'code': 'context_length_exceeded'}}
Error code: 400 - {'error': {'message': "Invalid 'tools[0].function.description': string too long. Expected a string with maximum length 1048576, but got a string with length 2778531 instead.", 'type': 'invalid_request_error', 'param': 'tools[0].function.description', 'code': 'string_above_max_length'}}

Här är felmeddelandet för svars-API:et:

Error code: 500 - {'error': {'message': 'The server had an error processing your request. Sorry about that! You can retry your request, or contact us through an Azure support request at: https://go.microsoft.com/fwlink/?linkid=2213926 if you keep seeing this error. (Please include the request ID d2008353-291d-428f-adc1-defb5d9fb109 in your email.)', 'type': 'server_error', 'param': None, 'code': None}}

datoranvändningsförhandsgranskning

En experimentell modell som har tränats för användning med datorverktyget Responses API.

Den kan användas med bibliotek från tredje part så att modellen kan styra mus- och tangentbordsindata, samtidigt som kontext hämtas från skärmbilder av den aktuella miljön.

Försiktighet

Registrering krävs för att få åtkomst till computer-use-preview. Åtkomst beviljas baserat på Microsoft berättigandekriterier. Kunder som har åtkomst till andra modeller med begränsad åtkomst behöver fortfarande begära åtkomst för den här modellen.

Om du vill begära åtkomst går du till ett program förcomputer-use-preview begränsad åtkomstmodell. När åtkomst beviljas måste du skapa en distribution för modellen.

För modelltillgänglighet i alla regioner, grupperade efter distributionskategori, se Regiontillgänglighet för Foundry-modeller som säljs efter Azure.

Kapacitet

Modell-ID	Beskrivning	Kontextfönster	Maximalt antal utdatatoken	Träningsdata (upp till)
`computer-use-preview` (2025-03-11)	Specialiserad modell för användning med verktyget Responses-API för datoranvändning - Verktyg -Streaming – Text (indata/utdata) – Bild (inmatning)	8,192	1,024	Oktober 2023

o-seriemodeller

Modellerna i Azure OpenAI o-serien är utformade för att hantera resonemang och problemlösningsuppgifter med ökat fokus och ökad kapacitet. Dessa modeller ägnar mer tid åt att bearbeta och förstå användarens begäran, vilket gör dem exceptionellt starka inom områden som vetenskap, kodning och matematik, jämfört med tidigare iterationer.

För modelltillgänglighet i alla regioner, grupperade efter distributionskategori, se Regiontillgänglighet för Foundry-modeller som säljs efter Azure.

Kapacitet

Modell-ID	Beskrivning	Maximal begäran (token)	Träningsdata (upp till)
`codex-mini` (2025-05-16)	Finjusterad version av `o4-mini`. - Api för svar. – Strukturerade utdata. – Text- och bildbearbetning. – Funktioner och verktyg. Fullständig sammanfattning av funktioner.	Indata: 200 000 Utdata: 100 000	31 maj 2024
`o3-pro` (2025-06-10)	- Api för svar. – Strukturerade utdata. – Text- och bildbearbetning. – Funktioner och verktyg. Fullständig sammanfattning av funktioner.	Indata: 200 000 Utdata: 100 000	31 maj 2024
`o4-mini` (2025-04-16)	- Ny resonemangsmodell som ger förbättrade resonemangsförutständanden. – API för slutförande av chattar. - Api för svar. – Strukturerade utdata. – Text- och bildbearbetning. – Funktioner och verktyg. Fullständig sammanfattning av funktioner.	Indata: 200 000 Utdata: 100 000	31 maj 2024
`o3` (2025-04-16)	- Ny resonemangsmodell som ger förbättrade resonemangsförutständanden. – API för slutförande av chattar. - Api för svar. – Strukturerade utdata. – Text- och bildbearbetning. – Funktioner, verktyg och parallella verktygsanrop. Fullständig sammanfattning av funktioner.	Indata: 200 000 Utdata: 100 000	31 maj 2024
`o3-mini` (2025-01-31)	- Förbättrade resonemangsförmåga. – Strukturerade utdata. - Bearbetning endast av text. – Funktioner och verktyg.	Indata: 200 000 Utdata: 100 000	Oktober 2023
`o1` (2024-12-17)	- Förbättrade resonemangsförmåga. – Strukturerade utdata. – Text- och bildbearbetning. – Funktioner och verktyg.	Indata: 200 000 Utdata: 100 000	Oktober 2023
`o1-preview` ¹ (2024-09-12)	Äldre förhandsversion.	Indata: 128 000 Utdata: 32 768	Oktober 2023
`o1-mini` ² (2024-09-12)	Ett snabbare och mer kostnadseffektivt alternativ i o1-serien, perfekt för kodning av uppgifter som kräver hastighet och lägre resursförbrukning. – Global Standard-distribution är tillgänglig som standard. – Standarddistributioner (regionala) är för närvarande endast tillgängliga för utvalda kunder som fick åtkomst som en del av den `o1-preview` begränsade åtkomstversionen.	Indata: 128 000 Utdata: 65 536	Oktober 2023

¹o1-preview är endast tillgängligt för kunder som beviljats åtkomst som en del av den ursprungliga begränsade åtkomsten.

²o1-mini är för närvarande tillgängligt för alla kunder för Global Standard-distribution. Utvalda kunder har beviljats standarddistributionsåtkomst (regional) till o1-mini som en del av den o1-preview begränsade åtkomstversionen. För närvarande utökas inte åtkomsten till o1-mini standarddistributioner (regionala).

o3-deep-research är för närvarande endast tillgängligt med Foundry Agent Service. Mer information finns i vägledningen för djupforskningsverktyget.

Mer information om avancerade modeller i o-serien finns i Komma igång med resonemangsmodeller.

GPT-4o och GPT-4 Turbo

GPT-4o integrerar text och bilder i en enda modell, vilket gör att den kan hantera flera datatyper samtidigt. Den här multimodala metoden förbättrar noggrannheten och svarstiden i interaktioner mellan människa och dator. GPT-4o matchar GPT-4 Turbo i engelsk text och kodningsuppgifter samtidigt som det ger överlägsen prestanda i icke-engelskspråkiga uppgifter och visionsuppgifter, vilket sätter nya riktmärken för AI-funktioner.

För modelltillgänglighet i alla regioner, grupperade efter distributionskategori, se Regiontillgänglighet för Foundry-modeller som säljs efter Azure.

GPT-4- och GPT-4 Turbo-modeller

Dessa modeller kan endast användas med API:et för chattslutsättningar. Mer information om hur Azure OpenAI hanterar modellversionsuppgraderingar finns i Model. Se Arbeta med modeller för att lära dig hur du visar och konfigurerar modellversionsinställningarna för dina GPT-4-distributioner.

För modelltillgänglighet i alla regioner, grupperade efter distributionskategori, se Regiontillgänglighet för Foundry-modeller som säljs efter Azure.

Kapacitet

Modell-ID	Beskrivning	Maximal begäran (token)	Träningsdata (upp till)
`gpt-4o` (2024-11-20) GPT-4o (Omni)	– Strukturerade utdata. – Text- och bildbearbetning. – JSON-läge. – Parallell funktionsanrop. - Förbättrad noggrannhet och svarstider. - Paritet med engelska texter och kodningsuppgifter jämfört med GPT-4 Turbo med Vision. - Överlägsen prestanda i icke-engelska språk och i visionsuppgifter. - Förbättrad förmåga till kreativt skrivande.	Indata: 128 000 Utdata: 16 384	Oktober 2023
`gpt-4o` (2024-08-06) GPT-4o (Omni)	– Strukturerade utdata. – Text- och bildbearbetning. – JSON-läge. – Parallell funktionsanrop. - Förbättrad noggrannhet och svarstider. - Paritet med engelska texter och kodningsuppgifter jämfört med GPT-4 Turbo med Vision. - Överlägsen prestanda i icke-engelska språk och i visionsuppgifter.	Indata: 128 000 Utdata: 16 384	Oktober 2023
`gpt-4o-mini` (2024-07-18) GPT-4o mini	- Snabb, billig, kapabel modell perfekt för att ersätta GPT-3.5 Turbo-serien modeller. – Text- och bildbearbetning. – JSON-läge. – Parallell funktionsanrop.	Indata: 128 000 Utdata: 16 384	Oktober 2023
`gpt-4o` (2024-05-13) GPT-4o (Omni)	– Text- och bildbearbetning. – JSON-läge. – Parallell funktionsanrop. - Förbättrad noggrannhet och svarstider. - Paritet med engelska texter och kodningsuppgifter jämfört med GPT-4 Turbo med Vision. - Överlägsen prestanda i icke-engelska språk och i visionsuppgifter.	Indata: 128 000 Utdata: 4 096	Oktober 2023
`gpt-4` ¹ (turbo-2024-04-09) GPT-4 Turbo med synnära	Ny allmänt tillgänglig modell. – Ersättning för alla tidigare GPT-4-förhandsversionsmodeller (`vision-preview`, `1106-Preview`, `0125-Preview`). - Funktionstillgängligheten skiljer sig för närvarande beroende på indatametoden och distributionstypen.	Indata: 128 000 Utdata: 4 096	2023 december

¹ Den etablerade versionen av gpt-4 versionen turbo-2024-04-09 är för närvarande endast begränsad till text. Mer information om tillhandahållna distributioner finns i Tillhandahållen vägledning.

Försiktighet

Vi rekommenderar inte att du använder förhandsversionsmodeller i produktion. Vi uppgraderar alla distributioner av förhandsversioner till antingen framtida förhandsversioner eller till den senaste stabila, allmänt tillgängliga versionen. Modeller som är avsedda förhandsgranskning följer inte standardlivscykeln Azure OpenAI-modell.

Inbäddningar

text-embedding-3-large är den senaste och mest kompatibla inbäddningsmodellen. Du kan inte uppgradera mellan inbäddningsmodeller. Om du vill gå från att använda text-embedding-ada-002 till text-embedding-3-largemåste du generera nya inbäddningar.

text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002

För modelltillgänglighet i alla regioner, grupperade efter distributionskategori, se Regiontillgänglighet för Foundry-modeller som säljs efter Azure.

Kapacitet

OpenAI rapporterar att testning visar att både den stora och den lilla tredje generationens inbäddningsmodeller ger bättre genomsnittlig prestanda för flerspråkshämtning med MIRACL-riktmärket . De fortsätter att upprätthålla prestanda för engelska språkuppgifter med MTEB-benchmark.

Utvärderingsmått	`text-embedding-ada-002`	`text-embedding-3-small`	`text-embedding-3-large`
MIRACL-genomsnitt	31.4	44.0	54.9
MTEB-genomsnitt	61.0	62.3	64.6

Den tredje generationens inbäddningsmodeller har stöd för att minska storleken på inbäddningen via en ny dimensions parameter. Vanligtvis är större inbäddningar dyrare ur ett beräknings-, minnes- och lagringsperspektiv. När du kan justera antalet dimensioner får du mer kontroll över den totala kostnaden och prestandan. Parametern dimensions stöds inte i alla versioner av OpenAI 1.x Python-biblioteket. För att dra nytta av den här parametern rekommenderar vi att du uppgraderar till den senaste versionen: pip install openai --upgrade.

OpenAI:s MTEB-benchmarktestning visade att även när den tredje generationens modells dimensioner reduceras till mindre än de 1 536 dimensionerna av text-embeddings-ada-002, är prestandan fortfarande något bättre.

Dessa modeller kan endast användas med API-begäranden för inbäddning.

Modell-ID	Maximal begäran (token)	Utgångsdimensioner	Träningsdata (upp till)
`text-embedding-ada-002` (utgåva 2)	8,192	1,536	Sep 2021
`text-embedding-ada-002` (version 1)	2,046	1,536	Sep 2021
`text-embedding-3-large`	8,192	3,072	Sep 2021
`text-embedding-3-small`	8,192	1,536	Sep 2021

Observera

När du skickar en matris med indata för inbäddning är det maximala antalet indataobjekt i matrisen per anrop till inbäddningsslutpunkten 2 048.

Modeller för bildgenerering

Bildgenereringsmodellerna genererar bilder från textanvisningarna som användaren tillhandahåller. Modeller för bildgenerering är gpt-image-1, gpt-image-1-mini, gpt-image-1.5och gpt-image-2.

För modelltillgänglighet i alla regioner, grupperade efter distributionskategori, se Regiontillgänglighet för Foundry-modeller som säljs efter Azure.

Modell-ID	Maximal begäran (tecken)
`gpt-image-1`	4,000
`gpt-image-1-mini`	4,000
`gpt-image-1.5`	4,000

Modeller för videogenerering

Sora är en AI-modell från OpenAI som kan skapa realistiska och fantasifulla videoscener från textinstruktioner. Sora är i förhandsgranskning.

Videogenereringsmodeller inkluderar sora och sora-2.

Modell-ID	Maximal begäran (tecken)
Sora	4,000

För modelltillgänglighet i alla regioner, grupperade efter distributionskategori, se Regiontillgänglighet för Foundry-modeller som säljs efter Azure.

Ljudmodeller

Ljudmodeller i Azure OpenAI är tillgängliga via API:erna realtime, completions och audio.

För modelltillgänglighet i alla regioner, grupperade efter distributionskategori, se Regiontillgänglighet för Foundry-modeller som säljs efter Azure.

GPT-4o-ljudmodeller

GPT-4o-ljudmodellerna är en del av GPT-4o-modellfamiljen och stöder antingen låg latens, tal in, tal ut konversationsinteraktioner eller ljudgenerering.

Försiktighet

Information om maximala begärandetoken och träningsdata finns i följande tabell:

Modell-ID	Beskrivning	Maximal begäran (token)	Träningsdata (upp till)
`gpt-4o-mini-audio-preview` (2024-12-17) Förhandsgranska	Ljudmodell för ljud- och textgenerering.	Indata: 128 000 Utdata: 16 384	2023 september
`gpt-4o-audio-preview` (2024-12-17)	Ljudmodell för ljud- och textgenerering.	Indata: 128 000 Utdata: 16 384	2023 september
`gpt-4o-realtime-preview` (2025-06-03)	Ljudmodell för ljudbearbetning i realtid.	Indata: 32 000 Utdata: 4 096	Oktober 2023
`gpt-4o-realtime-preview` (2024-12-17)	Ljudmodell för ljudbearbetning i realtid.	Indata: 16 000 Utdata: 4 096	Oktober 2023
`gpt-4o-mini-realtime-preview` (2024-12-17) Förhandsgranska	Ljudmodell för ljudbearbetning i realtid.	Indata: 128 000 Utdata: 4 096	Oktober 2023
`gpt-audio`(2025-08-28) `gpt-audio-mini`(06-10-2025)	Ljudmodell för ljud- och textgenerering.	Indata: 128,00 Utdata: 16 384	Oktober 2023
`gpt-realtime` (2025-08-28) (GA) `gpt-realtime-mini` (2025-10-06) `gpt-realtime-mini` (2025-12-15)	Ljudmodell för ljudbearbetning i realtid.	Indata: 32,00 Utdata: 4 096	Oktober 2023
`gpt-audio-1.5` (2026-02-23)	Ljudmodell för ljud- och textgenerering.	Indata: 128,00 Utdata: 16 384	2024 september
`gpt-realtime-1.5` (2026-02-23)	Ljudmodell för ljudbearbetning i realtid.	Indata: 32,00 Utdata: 4 096	2024 september
`gpt-realtime-2` (2026-05-07)	Ljudmodell för ljudbearbetning i realtid.	Indata: 32 000 Utdata: 4 096	2024 september

Ljud-API

Ljudmodellerna via API:et /audio kan användas för tal till text, översättning och text till tal.

Tal till text-modeller

Modell-ID	Beskrivning	Maxbegäran (ljudfilstorlek)
`whisper`	Taligenkänningsmodell för generell användning.	25 MB
`gpt-4o-transcribe` (2025-03-20) Förhandsgranska	Tal till text-modell som drivs av GPT-4o.	25 MB
`gpt-4o-mini-transcribe` (2025-03-20) Förhandsgranska	Tal till text-modell som drivs av GPT-4o mini.	25 MB
`gpt-4o-transcribe-diarize` (2025-10-15) Förhandsgranska	Tal till text-modell med automatisk taligenkänning.	25 MB
`gpt-4o-mini-transcribe` (2025-12-15) Förhandsgranska	Tal till text-modell med automatisk taligenkänning. Förbättrad transkriptionsnoggrannhet och robusthet.	25 MB

Talöversättningsmodeller

Modell-ID	Beskrivning	Maxbegäran (ljudfilstorlek)
`whisper`	Taligenkänningsmodell för generell användning.	25 MB

Text-till-tal-modeller (förhandsversion)

Modell-ID	Beskrivning
`tts` Förhandsgranska	Text-till-tal-modell optimerad för hastighet.
`tts-hd` Förhandsgranska	Text-till-tal-modell optimerad för kvalitet.
`gpt-4o-mini-tts` (2025-03-20)	Text-till-tal-modell som drivs av GPT-4o mini. Du kan vägleda rösten att tala i en viss stil eller ton.
`gpt-4o-mini-tts` (2025-12-15)	Text-till-tal-modell som drivs av GPT-4o mini. Du kan vägleda rösten att tala i en viss stil eller ton.

Finjusteringsmodeller

Följande modeller stöds för finjustering:

Modell-ID	Standardregioner	Global	Utvecklare	Metoder	Status	Modalitet
`gpt-4o-mini` (2024-07-18)	USA, norra centrala Sweden Central	✅	✅	SFT	GA	Text till text
`gpt-4o` (2024-08-06)	USA, östra 2 USA, norra centrala Sweden Central	✅	✅	SFT, Dataskyddsombud	GA	Text och bild till text
`gpt-4.1` (2025-04-14)	USA, norra centrala Sweden Central	✅	✅	SFT, Dataskyddsombud	GA	Text och bild till text
`gpt-4.1-mini` (2025-04-14)	USA, norra centrala Sweden Central	✅	✅	SFT, Dataskyddsombud	GA	Text till text
`gpt-4.1-nano` (2025-04-14)	USA, norra centrala Sweden Central	✅	✅	SFT, Dataskyddsombud	GA	Text till text
`o4-mini` (2025-04-16)	USA, östra 2 Sweden Central	✅	❌	RFT	GA	Text till text
`gpt-5` (2025-08-07)	USA, norra centrala Sweden Central	✅	✅	RFT	GA^*	Text till text
`Ministral-3B` (2411)	Stöds inte	✅	❌	SFT	Offentlig förhandsversion	Text till text
`Qwen-32B`	Stöds inte	✅	❌	SFT	Offentlig förhandsversion	Text till text
`Llama-3.3-70B-Instruct`	Stöds inte	✅	❌	SFT	Offentlig förhandsversion	Text till text
`gpt-oss-20b`	Stöds inte	✅	❌	SFT	Offentlig förhandsversion	Text till text

^* Stöd för GPT-5 för förstärkningsfinjustering är allmänt tillgängligt, men åtkomsten är begränsad och ges endast efter inbjudan. Kontakta ditt Microsoft-konto team om du är intresserad av registrering.

Eller så kan du finjustera en tidigare finjusterad modell, formaterad som base-model.ft-{jobid}.

Observera

Modeller med öppen källkod (Ministral-3B, Qwen-32B, Llama-3.3-70B-Instruct, gpt-oss-20b) stöds bara på Foundry-resurser och i det nya foundry-användargränssnittet.

Observera

Global utbildning ger mer prisvärd utbildning per token, men erbjuder inte datahemvist. Den är för närvarande tillgänglig för Foundry-resurser i följande regioner:

Australien, östra
Södra Brasilien
Centrala Kanada
Kanada, östra
Östra USA
Östra USA 2
France Central
Tyskland, västra centrala
Italien, norra
Japan, östra (inget visionsstöd)
Centrala Korea
USA, norra centrala
Norge, östra
Central Polen (saknar stöd för 4,1 nano)
Sydostasien
Sydafrika, norra
Sydcentrala USA
Södra Indien
Spanien centrala
Sweden Central
Schweiz, västra
Schweiz, norra
Storbritannien, södra
Europa, västra
Västra USA
USA, västra 3

Assistenter (förhandsversion)

För assistenter behöver du en kombination av en modell som stöds och en region som stöds. Vissa verktyg och funktioner kräver de senaste modellerna. Följande modeller är tillgängliga i Assistants API, SDK och Foundry. Följande tabell är avsedd för standarddistribution. Information om tillgänglighet för etablerade dataflödesenheter finns i Modeller för etablerat dataflöde. De listade modellerna och regionerna kan användas med både Assistenter v1 och v2. Du kan använda Globala standardmodeller om de stöds i följande regioner.

Regionen	gpt-4o, 2024-05-13	gpt-4o, 2024-08-06	gpt-4o-mini, 2024-07-18	gpt-4, 0613	gpt-4, 1106-Förhandsvisning	gpt-4, 0125-Förhandsvisning	gpt-4, turbo-2024-04-09	gpt-4-32k, 0613	gpt-35-turbo, 0613	gpt-35-turbo, 1106	gpt-35-turbo, 0125	gpt-35-turbo-16k, 0613
australiaeast	-	-	-	✅	✅	-	-	✅	✅	✅	✅	✅
eastus	✅	✅	✅	-	-	✅	✅	-	✅	-	✅	✅
eastus2	✅	✅	✅	-	✅	-	✅	-	✅	-	✅	✅
francecentral	-	-	-	✅	✅	-	-	✅	✅	✅	-	✅
japaneast	-	-	-	-	-	-	-	-	✅	-	✅	✅
norwayeast	-	-	-	-	✅	-	-	-	-	-	-	-
södra Indien	-	-	-	-	✅	-	-	-	-	✅	✅	-
swedencentral	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	-	✅
uksouth	-	-	-	-	✅	✅	-	-	✅	✅	✅	✅
westus	✅	✅	✅	-	✅	-	✅	-	-	✅	✅	-
westus3	✅	✅	✅	-	✅	-	✅	-	-	-	✅	-

Modellavgång

Den senaste informationen om modellavgångar finns i modellens pensionsschema.

Black Forest Labs-modeller som säljs av Azure

Black Forest Labs' FLUX-modeller erbjuder den senaste avancerade bildgenereringen till Microsoft Foundry, vilket gör att du kan generera och redigera högkvalitativa bilder från textprompter och referensbilder. FLUX-modeller stöder en rad funktioner, inklusive text-till-bild-generering, bildredigering med flera referenser och generering och redigering i kontext.

Du kan köra dessa modeller via BFL-tjänstprovider-API:et och via slutpunkterna images/generations och images/edits.

Information om hur du arbetar med FLUX-modeller i Foundry finns i Distribuera och använda FLUX-modeller i Microsoft Foundry.

Registrering krävs för åtkomst till FLUX.2 [flex] (förhandsversion).

Modell	Typ & API-slutpunkt	Kapacitet	Distributionstyp (regiontillgänglighet)
`FLUX.2-flex` Förhandsgranska	Bildgenerering - API för BFL-tjänstprovider: `<resource-name>/providers/blackforestlabs/v1/flux-2-flex`	- Indata: text och bild (32 000 tokens och upp till 10 bilderⁱ) - Utdata: En bild - Verktygsanrop: Nej - Svarsformat: Bild (PNG och JPG) - Viktiga funktioner: Detaljerad kontroll; stöd för flera referenser för upp till 10 bilder - Ytterligare parametrar: `guidance`: Bestämmer hur nära utdata följer uppmaningen. Minimum: 1,5, max: 10, standard: 4,5. Högre = närmare efterlevnad av anvisning. `steps`: Antal slutsatsdragningssteg. Max: 50, standard: 50. Högre = mer information, långsammare.	– Global standard (alla regioner)
`FLUX.2-pro` Förhandsgranska	Bildgenerering - API för BFL-tjänstprovider: `<resource-name>/providers/blackforestlabs/v1/flux-2-pro`	- Indata: text och bild (32 000 token och upp till 8 bilderⁱⁱ) - Utdata: En bild - Verktygsanrop: Nej - Svarsformat: Bild (PNG och JPG) - Viktiga funktioner: Stöd för flera referenser för upp till 8 bilder; mer grundad i verklig kunskap; större flexibilitet för utdata. förbättrad prestanda - Ytterligare parametrar:(Endast i providerspecifikt API) Stöder alla parametrar.	– Global standard (alla regioner)
`FLUX.1-Kontext-pro` Förhandsgranska	Bildgenerering - Bild-API: `https://<resource-name>/openai/deployments/{deployment-id}/images/generations` Och `https://<resource-name>/openai/deployments/{deployment-id}/images/edits` - API för BFL-tjänstprovider: `<resource-name>/providers/blackforestlabs/v1/flux-kontext-pro?api-version=preview`	- Indata: text och bild (5 000 token och 1 bild) - Utdata: En bild - Verktygsanrop: Nej - Svarsformat: Bild (PNG och JPG) - Viktiga funktioner: Teckenkonsekvens, avancerad redigering - Ytterligare parametrar:(Endast i providerspecifikt API)`seed`, `aspect ratio`, `input_image`, `prompt_unsampling`, , `safety_toleranceoutput_format`	– Global standard (alla regioner)
`FLUX-1.1-pro` Förhandsgranska	Bildgenerering - Bild-API: `https://<resource-name>/openai/deployments/{deployment-id}/images/generations` - API för BFL-tjänstprovider: `<resource-name>/providers/blackforestlabs/v1/flux-pro-1.1?api-version=preview`	- Indata: text (5 000 token och 1 bild) - Utdata: En bild - Verktygsanrop: Nej - Svarsformat: Bild (PNG och JPG) - Viktiga funktioner: Snabb slutsatsdragningshastighet, stark snabb efterlevnad, konkurrenskraftig prissättning, skalbar generering - Ytterligare parametrar:(Endast i providerspecifikt API)`width`, `height`, `prompt_unsampling`, `seed`, , `safety_toleranceoutput_format`	– Global standard (alla regioner)

^i,ii Stöd för flera referensbilder är tillgängligt för FLUX.2 [pro] (förhandsversion) och FLUX.2 [flex] (förhandsversion) med hjälp av API:et, men inte på lekplatsen.

Cohere-modeller som säljs av Azure

Cohere-serien med modeller innehåller olika modeller som är optimerade för olika användningsfall, inklusive chattavslut, omklassificering/textklassificering och inbäddningar. Sammanhållna modeller är optimerade för olika användningsfall som inkluderar resonemang, sammanfattning och frågesvar.

Modell	Typ	Kapacitet	Distributionstyp (regiontillgänglighet)
`Cohere-rerank-v4.0-pro`	textklassificering (ändra rangordning)	- Indata: text - Utdata: text - Språk:`en`, `fr`, `es`, `it`, `de`, `pt-br`, `ja`, `zh-cn`, `ar`, `vi`, `hi`, `ru`, , `id`och `nl` - Verktygsanrop: Nej - Svarsformat: JSON	– Global standard (alla regioner) – Hanterad beräkning
`Cohere-rerank-v4.0-fast`	textklassificering (ändra rangordning)	- Indata: text - Utdata: text - Språk:`en`, `fr`, `es`, `it`, `de`, `pt-br`, `ja`, `zh-cn`, `ar`, `vi`, `hi`, `ru`, , `id`och `nl` - Verktygsanrop: Nej - Svarsformat: JSON	– Global standard (alla regioner) – Hanterad beräkning
`Cohere-command-a`	chatten har slutförts	- Indata: text (131 072 tokens) - Utdata: text (8 182 tokens) - Språk:`en`, `fr`, `es`, `it`, `de`, `pt-br`, `ja`, `ko`, , `zh-cn`och `ar` - Verktygsanrop: Ja - Svarsformat: Text, JSON	– Global standard (alla regioner)
`embed-v-4-0`	inbäddningar	- Indata: text (512 token) och bilder (2MM bildpunkter) - Utdata: Vektor (256, 512, 1024, 1536 dim.) - Språk:`en`, `fr`, `es`, `it`, `de`, `pt-br`, `ja`, `ko`, , `zh-cn`och `ar`	– Global standard (alla regioner)

DeepSeek-modeller som säljs av Azure

DeepSeek-serien med modeller innehåller flera resonemangsmodeller som utmärker sig för att resonera med hjälp av en stegvis utbildningsprocess, till exempel språk, vetenskapliga resonemang och kodningsuppgifter.

Modell	Typ	Kapacitet	Distributionstyp (regiontillgänglighet)
`DeepSeek-V4-Pro` Förhandsgranska	chatten har slutförts (med resonemangsinnehåll)	- Indata: text (1 000 000 token) - Utdata: text (384 000 token) - Språk:`en` Och `zh` - Verktygsanrop: Nej - Svarsformat: Text, JSON	– Global standard (alla regioner)
`DeepSeek-V4-Flash` Förhandsgranska	chatten har slutförts (med resonemangsinnehåll)	- Indata: text (1 000 000 token) - Utdata: text (384 000 token) - Språk:`en` Och `zh` - Verktygsanrop: Nej - Svarsformat: Text, JSON	– Global standard (alla regioner)
`DeepSeek-V3.2-Speciale` Förhandsgranska	chatten har slutförts (med resonemangsinnehåll)	- Indata: text (128 000 token) - Utdata: text (128 000 token) - Språk:`en` Och `zh` - Verktygsanrop: Nej - Svarsformat: Text, JSON	– Global standard (alla regioner)
`DeepSeek-V3.2` Förhandsgranska	chatten har slutförts (med resonemangsinnehåll)	- Indata: text (128 000 token) - Utdata: text (128 000 token) - Språk:`en` Och `zh` - Verktygsanrop: Nej - Svarsformat: Text, JSON	– Global standard (alla regioner)
`DeepSeek-V3.1` Förhandsgranska	chatten har slutförts (med resonemangsinnehåll)	- Indata: text (131 072 tokens) - Utdata: text (131 072 token) - Språk:`en` Och `zh` - Verktygsanrop: Ja - Svarsformat: Text, JSON	– Global standard (alla regioner)
`DeepSeek-R1-0528` Förhandsgranska	chatten har slutförts (med resonemangsinnehåll)	- Indata: text (163 840 tokens) - Utdata: text (163 840 tokens) - Språk:`en` Och `zh` - Verktygsanrop: Nej - Svarsformat: Text	– Global standard (alla regioner) – Global tilldelad (alla regioner)
`DeepSeek-V3-0324` Förhandsgranska	chatten har slutförts	- Indata: text (131 072 tokens) - Utdata: text (131 072 token) - Språk:`en` Och `zh` - Verktygsanrop: Ja - Svarsformat: Text, JSON	– Global standard (alla regioner) – Global tilldelad (alla regioner)
`DeepSeek-R1`	chatten har slutförts (med resonemangsinnehåll)	- Indata: text (163 840 tokens) - Utdata: text (163 840 tokens) - Språk:`en` Och `zh` - Verktygsanrop: Nej - Svarsformat: Text	– Global standard (alla regioner) – Global tilldelad (alla regioner)

Metamodeller som säljs av Azure

Meta Llama-modeller och -verktyg är en samling förtränade och finjusterade generativa AI-text- och bildmodeller för resonerande. Metamodeller varierar i skala för att inkludera:

Små språkmodeller (SSM) som 1B- och 3B-bas- och instruktionsmodeller för inferens på enheten och gränsen
Medelstora stora språkmodeller (LLM: er) som 7B-, 8B- och 70B-bas- och instruktionsmodeller
Högpresterande modeller som Meta Llama 3.1-405B Instruct för användningsområden inom syntetisk datagenerering och destillation.

Modell	Typ	Kapacitet	Distributionstyp (regiontillgänglighet)
`Llama-4-Maverick-17B-128E-Instruct-FP8` Förhandsgranska	chatten har slutförts	- Indata: text och bilder (1M-token) - Utdata: text (1M-token) - Språk:`ar`, `en`, `fr`, `de`, `hi`, `id`, `it`, `pt`, `es`, `tl`, `th`, och `vi` - Verktygsanrop: Nej - Svarsformat: Text	– Global standard (alla regioner)
`Llama-3.3-70B-Instruct` Förhandsgranska	chatten har slutförts	- Indata: text (128 000 token) - Utdata: text (8 192 tokens) - Språk:`en`, `de`, `fr`, `it`, `pt`, `hi`, `es`och `th` - Verktygsanrop: Nej - Svarsformat: Text	– Global standard (alla regioner) – Global tilldelad (alla regioner)

Flera metamodeller är också tillgängliga från partner och community.

Microsoft modeller som säljs av Azure

Microsoft modeller innehåller olika modellgrupper som Modellrouter, MAI-modeller, Phi-modeller, AI-modeller för hälso- och sjukvård med mera. Flera Microsoft modeller finns också från partner och community.

Information om hur du arbetar med MAI-Image-2e och MAI-Image-2 text-till-bild-modeller i Foundry finns i Distribuera och använda MAI-modeller i Microsoft Foundry.

Modell	Typ	Kapacitet	Distributionstyp (regiontillgänglighet)
`MAI-Image-2e` Förhandsgranska	Text till bild. Mer information finns i API-slutpunkten .	- Indata: text - Utdata: En bild - Kontextlängd: 32 000 token - Verktygsanrop: Nej - Svarsformat: Bild (PNG) - Språk:`en` - Viktiga funktioner: Högkvalitativ text-till-bild-generering; fotorealistisk bildsyntes med konsekvent visuell struktur; passar bra för produktbilder, visuella marknadsföringsobjekt, varumärkestillgångar och kommersiella kreativa arbetsflöden. - Parametrar:`width`, `height`, `prompt` Minst 768×768 bildpunkter; maximalt totalt antal bildpunkter 1 048 576 (motsvarande 1024×1024). Endera dimensionen kan överskrida 1024 så länge det totala antalet bildpunkter ligger inom gränsen (till exempel 768×1365).	- Global standard (Västra centrala USA, Östra USA, Västra USA, Västeuropa, Centrala Sverige, Södra Indien)
`MAI-Image-2` Förhandsgranska	Text till bild. Mer information finns i API-slutpunkten .	- Indata: text - Utdata: En bild - Kontextlängd: 32 000 token - Verktygsanrop: Nej - Svarsformat: Bild (PNG) - Språk:`en` - Viktiga funktioner: Högkvalitativ text-till-bild-generering; fotorealistisk bildsyntes med konsekvent visuell struktur; passar bra för produktbilder, visuella marknadsföringsobjekt, varumärkestillgångar och kommersiella kreativa arbetsflöden. - Parametrar:`width`, `height`, `prompt` Minst 768×768 bildpunkter; maximalt totalt antal bildpunkter 1 048 576 (motsvarande 1024×1024). Endera dimensionen kan överskrida 1024 så länge det totala antalet bildpunkter ligger inom gränsen (till exempel 768×1365).	- Global standard (Västra centrala USA, Östra USA, Västra USA, Västeuropa, Centrala Sverige, Södra Indien)
`model-router` ¹	chatten har slutförts	Mer information finns i Översikt över modellrouter. - Indata: text, bild - Utdata: text (maxutdatatoken varierar²) Kontextfönster: 200 000³ - Språk:`en`	- Global standard (Östra USA 2, Centrala Sverige) - Data Zone standard⁴ (Östra USA 2, Sverige Centralt)

¹Modelrouterversion2025-11-18. Tidigare versioner (2025-08-07 och 2025-05-19) är också tillgängliga.

²Maxutdatatoken varierar för underliggande modeller i modellroutern. Till exempel 32 768 (GPT-4.1 series), 100 000 (o4-mini), 128 000 (gpt-5 reasoning models) och 16 384 (gpt-5-chat).

³ Större kontextfönster är kompatibla med några av de underliggande modellerna i modellroutern. Det innebär att ett API-anrop med en större kontext endast lyckas om prompten dirigeras till en av dessa modeller. Annars misslyckas anropet.

⁴ Faktureringen för datazonstandardmodellens routerdistributioner börjar tidigast den 1 november 2025.

Mistralmodeller som säljs av Azure

Modell	Typ	Kapacitet	Distributionstyp (regiontillgänglighet)
`mistral-document-ai-2512`	Bild till text	- Indata: bild- eller PDF-sidor (30 sidor, max 30 MB PDF-fil) - Utdata: text - Språk:`en` - Verktygsanrop: nej - Svarsformat: Text, JSON, Markdown	– Global standard (alla regioner) – Datazonstandard (USA och EU)
`mistral-document-ai-2505` Förhandsgranska	Bild till text	- Indata: bild- eller PDF-sidor (30 sidor, max 30 MB PDF-fil) - Utdata: text - Språk:`en` - Verktygsanrop: nej - Svarsformat: Text, JSON, Markdown	– Global standard (alla regioner) – Datazonstandard (USA och EU)
`Mistral-Large-3` Förhandsgranska	chatten har slutförts	- Indata: text, bild - Utdata: text - Språk:`en`, `fr`, `de`, `es`, `it`, `pt`, `nl`, `zh`, `ja`, , `ko`och `ar` - Verktygsanrop: Ja - Svarsformat: Text, JSON	– Global standard (alla regioner) – Datazonstandard (USA och EU)

Flera Mistral-modeller är också tillgängliga från partner och community.

Moonshot AI-modeller som säljs av Azure

Moonshot AI-modeller inkluderar Kimi K2.6 (förhandsversion) och Kimi K2.5 (förhandsversion), multimodala resonemangsmodeller som accepterar text- och bildindata.

Modell	Typ	Kapacitet	Distributionstyp (regiontillgänglighet)
`Kimi-K2.6` Förhandsgranska	chatten har slutförts (med resonemangsinnehåll)	- Indata: text och bild (262 144 tokens) - Utdata: text (262 144 token) - Språk:`en` Och `zh` - Verktygsanrop: Ja - Svarsformat: Text	– Global standard (alla regioner)
`Kimi-K2.5` Förhandsgranska	chatten har slutförts (med resonemangsinnehåll)	- Indata: text och bild (262 144 tokens) - Utdata: text (262 144 token) - Språk:`en` Och `zh` - Verktygsanrop: Ja - Svarsformat: Text	– Global standard (alla regioner)

Se den här modellsamlingen i Foundry-portalen.

xAI-modeller som säljs av Azure

xAI:s Grok-modeller i Foundry Models innehåller en mängd olika resonemangs- och icke-resonemangsmodeller som är utformade för företagsanvändningsfall som dataextrahering, kodning, textsammanfattning och agentiska program.

Registrering krävs för åtkomst tillgrok-code-fast-1 (Förhandsversion) och grok-4.

Modell	Typ	Kapacitet	Distributionstyp (regiontillgänglighet)
`grok-4.3` Förhandsgranska	chatten har slutförts	- Indata: text (200 000 token) - Utdata: text (8 192 tokens) - Språk:`en` - Verktygssamtal: ja - Svarsformat: text	– Global standard (alla regioner)
`grok-4-20-reasoning` Förhandsgranska	chatten har slutförts	- Indata: text (262 000 token) - Utdata: text (8 192 tokens) - Språk:`en` - Verktygssamtal: ja - Svarsformat: text	– Global standard (alla regioner)
`grok-4-20-non-reasoning` Förhandsgranska	chatten har slutförts	- Indata: text (262 000 token) - Utdata: text (8 192 tokens) - Språk:`en` - Verktygssamtal: ja - Svarsformat: text	– Global standard (alla regioner)
`grok-4.1-fast-reasoning` Förhandsgranska	chatten har slutförts	- Indata: text, bild (128 000 token) - Utdata: text (128 000 token) - Språk:`en` - Verktygssamtal: ja - Svarsformat: text	– Global standard (alla regioner)
`grok-4.1-fast-non-reasoning` Förhandsgranska	chatten har slutförts	- Indata: text, bild (128 000 token) - Utdata: text (128 000 token) - Språk:`en` - Verktygssamtal: ja - Svarsformat: text	– Global standard (alla regioner)
`grok-4`	chatten har slutförts	- Indata: text (262 000 token) - Utdata: text (8 192 tokens) - Språk:`en` - Verktygssamtal: ja - Svarsformat: text	– Global standard (alla regioner)
`grok-code-fast-1` Förhandsgranska	chatten har slutförts	- Indata: text (256 000 token) - Utdata: text (8 192 tokens) - Språk:`en` - Verktygssamtal: ja - Svarsformat: text	– Global standard (alla regioner)

Tillgänglighet för modellregion efter distributionstyp

Microsoft Foundry ger kunderna val av värdstruktur som passar deras affärs- och användningsmönster. Tjänsten erbjuder två huvudsakliga distributionskategorier:

Standard: Har ett globalt distributionsalternativ som dirigerar trafik globalt för att ge högre dataflöde.
Provisioned: Har också ett globalt distributionsalternativ som gör det möjligt för kunder att köpa och distribuera etablerade dataflödesenheter i Azure global infrastruktur.

Andra distributionskategorier som batch är också tillgängliga. Information om alla tillgängliga modelldistributionstyper finns i Distributionstyper för Microsoft Foundry Models.

Global Standard-modelltillgänglighet

Regionen	FLUX.2-flex	FLUX.2-pro	FLUX.1-Kontext-pro	FLUX-1.1-pro	Cohere-rerank-v4.0-pro	Cohere-rerank-v4.0-fast	cohere-command-a	embed-v-4-0	DeepSeek-V3.2-Speciale	DeepSeek-V3.2	DeepSeek-V3.1	DeepSeek-R1-0528	DeepSeek-V3-0324	DeepSeek-R1	Llama-4-Maverick-17B-128E-Instruct-FP8	Llama-3.3-70B-Instruct	MAI-Image-2	model-router	mistral-document-ai-2512	mistral-document-ai-2505	Mistral-Large-3	Kimi-K2.5	grok-4-1-fast-reasoning	grok-4-1-fast-non-reasoning	grok-4-fast-reasoning	grok-4-fast-non-reasoning	grok-3	grok-3-mini
australiaeast	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Brasilien södra	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
canadacentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Östkanada	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
centralus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
francecentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Tyskland Västcentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
italynorth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
japaneast	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
japanwest	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
koreacentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
northcentralus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
norwayeast	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
polencentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
southafricanorth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
southcentralus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
södra Indien	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
spaincentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
swedencentral	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
norra Schweiz	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
Schweizväst	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
uaenorth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
uksouth	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westcentralus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westeurope	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus3	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	-	-	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅

Global tillgänglighet för hanterad försedd modell

Regionen	DeepSeek-R1-0528	DeepSeek-V3-0324	DeepSeek-R1	Llama-3.3-70B-Instruct
australiaeast	✅	✅	✅	✅
Brasilien södra	✅	✅	✅	✅
canadacentral	✅	✅	✅	✅
Östkanada	✅	✅	✅	✅
centralus	✅	✅	✅	✅
eastus	✅	✅	✅	✅
eastus2	✅	✅	✅	✅
francecentral	✅	✅	✅	✅
Tyskland Västcentral	✅	✅	✅	✅
italynorth	✅	✅	✅	✅
japaneast	✅	✅	✅	✅
japanwest	✅	✅	✅	✅
koreacentral	✅	✅	✅	✅
northcentralus	✅	✅	✅	✅
norwayeast	✅	✅	✅	✅
polencentral	✅	✅	✅	✅
southafricanorth	✅	✅	✅	✅
southcentralus	✅	✅	✅	✅
södra Indien	✅	✅	✅	✅
spaincentral	✅	✅	✅	✅
swedencentral	✅	✅	✅	✅
norra Schweiz	✅	✅	✅	✅
Schweizväst	✅	✅	✅	✅
uaenorth	✅	✅	✅	✅
uksouth	✅	✅	✅	✅
westcentralus	✅	✅	✅	✅
westeurope	✅	✅	✅	✅
westus	✅	✅	✅	✅
westus2	✅	✅	✅	✅
westus3	✅	✅	✅	✅

Tillgänglighet för Data Zone Standard-modell

Regionen	FLUX.2-pro	FLUX.1-Kontext-pro	FLUX-1.1-pro	model-router	mistral-document-ai-2512	mistral-document-ai-2505	Mistral-Large-3	grok-4-1-fast-reasoning	grok-4-1-fast-non-reasoning	grok-4-fast-reasoning	grok-4-fast-non-reasoning	grok-3	grok-3-mini
centralus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
eastus2	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
francecentral	✅	✅	✅	-	✅	✅	✅	-	-	-	-	-	-
Tyskland Västcentral	✅	✅	✅	-	✅	✅	✅	-	-	-	-	-	-
italynorth	✅	✅	✅	-	✅	✅	✅	-	-	-	-	-	-
northcentralus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
polencentral	✅	✅	✅	-	✅	✅	✅	-	-	-	-	-	-
southcentralus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
spaincentral	✅	✅	✅	-	✅	✅	✅	-	-	-	-	-	-
swedencentral	✅	✅	✅	✅	✅	✅	✅	-	-	-	-	-	-
westcentralus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
westeurope	✅	✅	✅	-	✅	✅	✅	-	-	-	-	-	-
westus	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus2	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅
westus3	✅	✅	✅	-	✅	✅	✅	✅	✅	✅	✅	✅	✅

Feedback

Var den här sidan till hjälp?

Last updated on 2026-05-20

Foundry-modeller som säljs av Azure

Azure OpenAI i Microsoft Foundry-modeller

Modellhöjdpunkter

GPT-chat-latest

Kapacitet

GPT-5.5

Kapacitet

GPT-5.4

Kapacitet

GPT-5.3

Kapacitet

GPT-5.2

Kapacitet

GPT-5.1

Kapacitet

GPT-5

Kapacitet

gpt-oss

Kapacitet

Lansera med kod

GPT-4.1-serien

Kapacitet

Känt problem

datoranvändningsförhandsgranskning

Kapacitet

o-seriemodeller

Kapacitet

GPT-4o och GPT-4 Turbo

GPT-4- och GPT-4 Turbo-modeller

Kapacitet

Inbäddningar

Kapacitet

Modeller för bildgenerering

Modeller för videogenerering

Ljudmodeller

GPT-4o-ljudmodeller

Ljud-API

Tal till text-modeller

Talöversättningsmodeller

Text-till-tal-modeller (förhandsversion)

Finjusteringsmodeller

Assistenter (förhandsversion)

Modellavgång

Relaterat innehåll

Black Forest Labs-modeller som säljs av Azure

Cohere-modeller som säljs av Azure

DeepSeek-modeller som säljs av Azure

Metamodeller som säljs av Azure

Microsoft modeller som säljs av Azure

Mistralmodeller som säljs av Azure

Moonshot AI-modeller som säljs av Azure

xAI-modeller som säljs av Azure

Tillgänglighet för modellregion efter distributionstyp

Global Standard-modelltillgänglighet

Relaterat innehåll

Feedback

Ytterligare resurser