Delen via


Claude-modellen implementeren en gebruiken in Microsoft Foundry (preview)

De Claude-modellen van Antropic bieden geavanceerde ai-mogelijkheden voor gesprekken aan Microsoft Foundry, zodat u intelligente toepassingen kunt bouwen met geavanceerde taalbegrip en generatie. Claude modellen excelleren bij complexe redenering, het genereren van code en multimodale taken, waaronder afbeeldingsanalyse.

In dit artikel leert u het volgende:

  • Claude-modellen implementeren in Microsoft Foundry
  • Verifiëren met behulp van Microsoft Entra ID of API-sleutels
  • De Claude Messages-API aanroepen vanuit Python, JavaScript of REST
  • Kies het juiste Claude-model voor uw use case

Claude-modellen in Foundry zijn onder andere:

Modelfamilie Modellen
Claude Mythos claude-mythos-preview 1 (vooraf bekeken onderzoek met toegangslimieten)
Claude Opus claude-opus-4-7 2 (preview), claude-opus-4-6 (preview), claude-opus-4-5 (preview), claude-opus-4-1 (preview)
Claude Sonnet claude-sonnet-4-6 (voorbeeld), claude-sonnet-4-5 (voorbeeld)
Claude Haiku claude-haiku-4-5 (voorbeeld)

1Claude Mythos Preview is alleen beschikbaar als een beperkte onderzoeksvoorvertoning. Toegang tot het model wordt uitsluitend naar eigen goeddunken van Lantropic verleend en krijgt prioriteit voor gebruiksscenario's voor defensieve cyberbeveiliging. Zie de systeemkaart Claude Mythos Preview voor verantwoordelijk gebruiksrichtlijnen.

2 Volg de migratiehandleiding voor het migreren van berichten-API-code van eerdere versies naar Claude Opus 4.7.

Zie Beschikbare Claude-modellen voor meer informatie over de afzonderlijke modellen.

Vereiste voorwaarden

Ondersteuning voor abonnementstypen en regio's

Als u Claude-modellen in Microsoft Foundry wilt gebruiken, moet u een betaald Azure abonnement hebben met een factureringsrekening in een land of regio waar Antropic de modellen voor aankoop aanbiedt. Zie Common-foutberichten en -oplossingen voor een lijst met veelvoorkomende fouten met betrekking tot abonnementen. De volgende abonnementstypen worden momenteel niet ondersteund:

  • Ondernemingsaccounts in Zuid-Korea
  • Cloud Solution Provider abonnementen
  • Azure abonnementen die geen actieve factureringsmethode voor betalen per gebruik hebben (bijvoorbeeld accounts voor studenten, gratis proefversie of op opstarttegoed gebaseerde accounts)
  • Gesponsorde abonnementen die alleen Azure-krediet gebruiken. Note: Als u een account met een creditcard in het bestand hebt, wordt de creditcard in rekening gebracht in plaats van Azure Tegoed.

Zie ondersteunde geografische locaties voor een lijst met ondersteunde regio's. Houd er rekening mee dat het beleid 'Ondersteunde regio's' van Lantropic van toepassing kan zijn op de beschikbaarheid in uw regio, controleert u de ondersteunde regio's voor meer informatie.

Claude-modellen implementeren

Claude-modellen in Foundry zijn beschikbaar voor wereldwijde standaardimplementatie. Als u een Claude-model wilt implementeren, volgt u de instructies in Deploy Microsoft Foundry Models in de Foundry-portal.

Na de implementatie gebruikt u de Foundry-speeltuin om het model interactief te testen.

De Api voor Claude Messages aanroepen

Nadat u een Claude-model hebt geïmplementeerd, kunt u ermee werken om tekstreacties te genereren:

  • Gebruik de Antropische SDK's en de volgende Claude-API's:

    • Berichten-API: Een gestructureerde lijst met invoerberichten met tekst- of afbeeldingsinhoud verzenden. Het model genereert het volgende bericht in het gesprek.
    • Token count-API: het aantal tokens in een bericht tellen.
    • Bestands-API: Upload en beheer bestanden voor gebruik met de Claude-API zonder inhoud opnieuw te uploaden bij elke aanvraag.
    • Vaardigheden-API: Maak aangepaste vaardigheden voor Claude AI.

Berichten verzenden met verificatie

In de volgende voorbeelden ziet u hoe u aanvragen verzendt naar Claude Sonnet 4.6 met behulp van Microsoft Entra ID- of API-sleutelverificatie. Als u wilt werken met uw geïmplementeerde model, hebt u het volgende nodig:

  • De basis-URL, die van het formulier https://<resource name>.services.ai.azure.com/anthropic.
  • Uw doel-URI uit uw implementatiegegevens, en het heeft de vorm van https://<resource name>.services.ai.azure.com/anthropic/v1/messages.
  • Microsoft Entra ID voor sleutelloze verificatie of de API-sleutel van uw implementatie voor API-verificatie.
  • De implementatienaam die u hebt gekozen tijdens het maken van de implementatie. Deze naam kan afwijken van de model-id.

Opmerking

Voor Opus 4.6 en Sonnet 4.6 ondersteunt de thinking parameter typen: enabled, disableden adaptive. Met adaptive het type kan het model bepalen of het moet denken, op basis van de complexiteit van de query en het inspanningsniveau.

Voor Mythos Preview ondersteunt de thinking parameter alleenadaptive en enabled.

Voor Opus 4.7 ondersteunt de thinking parameter alleenadaptive en disabled.

De effort parameter, die de kwaliteit/kosten afhandelt voor reacties, ondersteunt inspanningsniveaus: low, mediumen high. Voor Opus 4.7, Opus 4.6 en Sonnet 4.6 ondersteunt max de parameter ook het inspanningsniveau. Gebruik deze parameter met of zonder denken in te schakelen.

Microsoft Entra ID-verificatie gebruiken

Gebruik voor Berichten-API-eindpunten uw basis-URL met Microsoft Entra ID-verificatie.

  1. Installeer de Azure Identity-clientbibliotheek: Installeer deze bibliotheek om de DefaultAzureCredential te gebruiken. Autorisatie is het eenvoudigst wanneer u DefaultAzureCredential gebruikt, omdat hiermee de beste referentie of inloggegevens worden gevonden voor gebruik in de uitvoeringsomgeving.

    pip install azure-identity
    

    Stel de waarden van de client-id, tenant-id en clientgeheim van de Microsoft Entra ID-toepassing in als omgevingsvariabelen: AZURE_CLIENT_ID, AZURE_TENANT_ID, AZURE_CLIENT_SECRET.

    export AZURE_CLIENT_ID="<AZURE_CLIENT_ID>"
    export AZURE_TENANT_ID="<AZURE_TENANT_ID>"
    export AZURE_CLIENT_SECRET="<AZURE_CLIENT_SECRET>"
    
  2. Afhankelijkheden installeren: Installeer de Lantropische SDK met behulp van pip (hiervoor is Python 3.8 of hoger vereist).

    pip install -U "anthropic"
    
  3. Voer een basiscodevoorbeeld uit om de volgende taken uit te voeren:

    1. Maak een client met de Antropische SDK met behulp van Microsoft Entra ID-verificatie.
    2. Maak een eenvoudige aanroep naar de Berichten-API. De aanroep is synchroon.
    from anthropic import AnthropicFoundry
    from azure.identity import DefaultAzureCredential, get_bearer_token_provider
    
    baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name
    deploymentName = "claude-sonnet-4-6" # Replace with your deployment name
    
    # Create token provider for Entra ID authentication
    tokenProvider = get_bearer_token_provider(
        DefaultAzureCredential(), "https://ai.azure.com/.default"
    )
    
    # Create client with Entra ID authentication
    client = AnthropicFoundry(
        azure_ad_token_provider=tokenProvider,
        base_url=baseURL
    )
    
    # Send request
    message = client.messages.create(
        model=deploymentName,
        messages=[
            {"role": "user", "content": "What are 3 things to visit in Seattle?"}
        ],
        max_tokens=1048,
        temperature=1,
        thinking={"type":"adaptive"},
        output_config={"effort": "max"},
        stream=False
    )
    
    print(message.content)
    

    Verwachte uitvoer: Een JSON-antwoord met de tekstvoltooiing van het model met drie aanbevelingen voor Seattle.

    Referentie:Anthropic Client SDK, DefaultAzureCredential

API-sleutelverificatie gebruiken

Belangrijk

Claude Mythos Preview ondersteunt alleen Microsoft Entra ID verificatie.

Gebruik uw basis-URL en API-sleutel om te authenticeren bij de Messages API-eindpoints van de service.

  1. Installatie van afhankelijkheden: Installeer de Lantropische SDK met behulp van pip (hiervoor is Python 3.8 of hoger vereist):

    pip install -U "anthropic"
    
  2. Voer een basiscodevoorbeeld uit om de volgende taken uit te voeren:

    1. Maak een client met de Anthropic SDK door uw API-sleutel door te geven aan de configuratie van de SDK. Met deze verificatiemethode kunt u naadloos communiceren met de service.
    2. Maak een eenvoudige aanroep naar de Berichten-API. De aanroep is synchroon.
    from anthropic import AnthropicFoundry
    
    baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name
    deploymentName = "claude-sonnet-4-6" # Replace with your deployment name
    apiKey = "YOUR_API_KEY" # Replace YOUR_API_KEY with your API key
    
    # Create client with API key authentication
    client = AnthropicFoundry(
        api_key=apiKey,
        base_url=baseURL
    )
    
    # Send request
    message = client.messages.create(
        model=deploymentName,
        messages=[
            {"role": "user", "content": "What are 3 things to visit in Seattle?"}
        ],
        max_tokens=1048,
        temperature=1,
        thinking={"type":"adaptive"},
        output_config={"effort": "max"},
        stream=False
    )
    
    print(message.content)
    

    Verwachte uitvoer: Een JSON-antwoord met de tekstvoltooiing van het model met drie aanbevelingen voor Seattle.

    Naslaginformatie:Anthropic Client SDK

Beschikbare Claude-modellen

Foundry ondersteunt Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Opus 4.5, Claude Opus 4.1, Claude Sonnet 4.6, Claude Sonnet 4.5 en Claude Haiku 4.5 modellen via wereldwijde standaardimplementatie. Deze modellen hebben belangrijke mogelijkheden:

  • Adaptief denken: Een upgrade naar uitgebreid denken dat Claude de vrijheid geeft om zoveel of zo weinig te denken als nodig is, afhankelijk van het taak- en inspanningsniveau.
  • Uitgebreid denken: Uitgebreide redenering voor complexe taken.
  • Afbeelding en tekstinvoer: Sterke visie voor het analyseren van grafieken, grafieken, technische diagrammen, rapporten en andere visuele assets.
  • Codegeneratie: Geavanceerde codegeneratie, analyse en foutopsporing.

Zie de mogelijkheden van Claude-modellen voor meer informatie over de modelmogelijkheden.

Claude Mythos (afgeschermd onderzoekvoorbeeld)

Belangrijk

Claude Mythos Preview is alleen beschikbaar als een beperkte onderzoeksvoorvertoning. Toegang tot het model wordt uitsluitend naar eigen goeddunken van Lantropic verleend en krijgt prioriteit voor gebruiksscenario's voor defensieve cyberbeveiliging. Zie de systeemkaart Claude Mythos Preview voor verantwoordelijk gebruiksrichtlijnen.

Claude Mythos Preview ondersteunt alleen Microsoft Entra ID verificatie.

Claude Mythos Preview is een nieuwe klasse intelligentie die is gebouwd voor ambitieuze projecten en het beste model ter wereld op het gebied van cyberbeveiliging, autonome codering en langdurig werkende systemen. Alleen beschikbaar als een beperkt toegankelijk onderzoeksvoorbeeld, met prioriteitstoegang voor defensieve cyberbeveiligingsgebruikssituaties. Met een contextvenster van 1M tokens en een maximale uitvoer van 128K, is Claude Mythos Preview ontworpen voor:

  • Cybersecurity: 's werelds beste model voor defensieve beveiliging. Het kan oplossingen vinden en voorstellen voor echte beveiligingsproblemen in productiecodebases en vervolgens helpen de oplossingen te bewijzen.
  • Autonome codering: verwerkt de volledige engineeringcyclus effectiever dan elk eerder model: het onderzoeken, implementeren en testen van grote codebases van doelstelling tot verzending.
  • Langlopende agenten: legt een nieuwe lat voor het werk van long-horizon-agenten. Het kan coherent uitvoeren van uitgebreide, meerdere uren durende taken verrichten, zich aanpassen naarmate de omstandigheden veranderen en het werk bevorderen met minder interventies.

Claude Mythos Preview ondersteunt adaptief denken, een upgrade naar uitgebreid denken dat Claude de vrijheid geeft om net zoveel of zo weinig te denken als nodig is, afhankelijk van het taak- en inspanningsniveau.

Claude Opus 4.7 (preview)

Aanbeveling

Volg de migratiehandleiding voor het migreren van berichten-API-code van eerdere Versies van Claude naar Claude Opus 4.7.

Claude Opus 4.7 is het meest capabele model in de Claude Opus-familie en verbetert de prestaties op het gebied van codering, bedrijfswerkstromen en langlopende agent-taken. Met een contextvenster van één miljoen tokens en een maximale uitvoer van 128.000 is Opus 4.7 ideaal voor agentgerichte codering, bedrijfskenniswerk, langlopende multitool werkstromen, multimodale redenering op hoge resolutie (tot 2576px / 3,75MP), financiële analyse en cyberbeveiliging. Opus 4.7 ondersteunt adaptief denken, een upgrade naar uitgebreid denken dat Claude de vrijheid geeft om zoveel of zo weinig te denken als nodig is, afhankelijk van het taak- en inspanningsniveau.

Claude Opus 4.6 (preview)

Claude Opus 4.6 is een zeer geschikt model in de familie Claude Opus voor codering, ondernemingsagenten en professioneel werk. Met een contextvenster van 1M tokens en een maximum output van 128K is Opus 4.6 ideaal voor productiecode, geavanceerde agents, kantoortaken, financiële analyse, cyberbeveiliging en computergebruik.

Claude Opus 4.5 (preview)

Claude Opus 4.5 is een marktleider op het gebied van coderen, agenten, computergebruik en bedrijfswerkstromen. Met een contextvenster van 200.000 token en maximaal 64K-uitvoer is Opus 4.5 ideaal voor productiecode, geavanceerde agents, kantoortaken, financiële analyse, cyberbeveiliging en computergebruikstaken.

Claude Opus 4.1 (preview)

Claude Opus 4.1 is marktleider voor codering. Het levert duurzame prestaties voor langlopende taken die gerichte inspanning en duizenden stappen vereisen, en breidt daarmee de problemen die AI-agents kunnen oplossen aanzienlijk uit.

Claude Sonnet 4.6 (preview)

Claude Sonnet 4.6 levert grensinformatie op schaal, gebouwd voor codering, agents en bedrijfswerkstromen. Met een contextvenster van 1M tokens en een maximale uitvoer van 128K is Sonnet 4.6 ideaal voor coderen, agenten, kantoortaken, financiële analyse, cyberbeveiliging en computergebruik.

Claude Sonnet 4.5 (preview)

Claude Sonnet 4.5 is een zeer geschikt model dat is ontworpen voor het bouwen van echte agenten en het verwerken van complexe taken met een lange horizon. Het biedt een sterke balans tussen snelheid en kosten voor gebruiksvoorbeelden met een hoog volume. Sonnet 4.5 biedt ook geavanceerde nauwkeurigheid voor computergebruik, waardoor ontwikkelaars Claude kunnen omleiden om computers te gebruiken zoals mensen dat doen.

Claude Haiku 4.5 (preview)

Claude Haiku 4.5 levert grensoverschrijdende prestaties voor een breed scala aan gebruiksvoorbeelden. Het onderscheidt zich als een van de beste coderings- en agentmodellen, met de juiste snelheid en kosten om gratis producten en geschaalde subagents aan te kunnen.

Geavanceerde functies en mogelijkheden van Claude-modellen

Claude in Foundry Models ondersteunt geavanceerde functies en mogelijkheden. De belangrijkste mogelijkheden verbeteren de fundamentele mogelijkheden van Claude voor het verwerken, analyseren en genereren van inhoud in verschillende indelingen en gebruiksvoorbeelden. Met hulpprogramma's kan Claude communiceren met externe systemen, code uitvoeren en geautomatiseerde taken uitvoeren via verschillende toolinterfaces.

Enkele van de kernmogelijkheden die Foundry ondersteunt, zijn:

  • Groot contextvenster: Een uitgebreid contextvenster dat grotere documenten en langere gesprekken verwerkt.

  • Agentvaardigheden: Breid de mogelijkheden van Claude uit met vaardigheden.

  • Citaten: Ground Claude's antwoorden in brondocumenten.

  • Context bewerken: De gesprekscontext automatisch beheren met configureerbare strategieën.

  • Uitgebreid denken: Verbeterde redeneringsmogelijkheden voor complexe taken die beschikbaar zijn voor alle Claude-modellen.

    Aanbeveling

    Voor Opus 4.6 en Sonnet 4.6 ondersteunt de thinking parameter typen: enabled, disableden adaptive. Met adaptive het type kan het model bepalen of het moet denken, op basis van de complexiteit van de query en het inspanningsniveau.

    Voor Mythos Preview ondersteunt de thinking parameter alleenadaptive en enabled.

    Voor Opus 4.7 ondersteunt de thinking parameter alleenadaptive en disabled.

  • Inspanning: De mogelijkheid om de kwaliteit/kosten te beheersen voor reacties.

    Aanbeveling

    De effort parameter ondersteunt inspanningsniveaus: low, mediumen high. Voor Opus 4.7, Opus 4.6 en Sonnet 4.6 ondersteunt max de parameter ook het inspanningsniveau. Gebruik deze parameter met of zonder denken in te schakelen.

  • PDF-ondersteuning: Tekst en visuele inhoud van PDF-documenten verwerken en analyseren.

  • Prompt opslaan in cache: Geef Claude meer achtergrondkennis en voorbeelduitvoer om de kosten en latentie te verlagen.

Enkele van de hulpprogramma's die Foundry ondersteunt, zijn:

  • MCP-connector: Maak rechtstreeks vanuit de Berichten-API verbinding met externe MCP-servers zonder een afzonderlijke MCP-client.
  • Geheugen: Informatie opslaan en ophalen in gesprekken. Bouw in de loop van de tijd knowledge bases, onderhoud project context en leer van eerdere interacties.
  • Web ophalen: Haal volledige inhoud op van de opgegeven webpagina's en PDF-documenten voor uitgebreide analyse.

Zie het overzicht van de functies van Claude voor een volledige lijst met ondersteunde mogelijkheden en hulpprogramma's.

Ondersteuning voor agent

API-quota en -limieten

Belangrijk

Momenteel komen alleen de Enterprise- en MCA-E-abonnementen in aanmerking voor het gebruik van het Claude-model in Foundry.

Claude-modellen in Foundry hebben de volgende frequentielimieten, gemeten in Tokens Per Minuut (TPM) en Requests Per Minute (RPM):

Model Implementatietype Standaard RPM Standaard-TPM Enterprise en MCA-E RPM Tpm voor ondernemingen en MCA-E
claude-opus-4-7 Algemene standaard 0 0 2,000 2,000,000
claude-opus-4-6 Algemene standaard 0 0 2,000 2,000,000
claude-opus-4-5 Algemene standaard 0 0 2,000 2,000,000
claude-opus-4-1 Algemene standaard 0 0 2,000 2,000,000
claude-sonnet-4-6 Algemene standaard 0 0 2,000 2,000,000
claude-sonnet-4-5 Algemene standaard 0 0 4,000 2,000,000
claude-haiku-4-5 Algemene standaard 0 0 4,000 4,000,000

Als u uw quotum wilt verhogen buiten de standaardlimieten, dient u een aanvraag in via het aanvraagformulier voor quotumverhoging.

Best practices voor frequentielimiet

Om uw gebruik te optimaliseren en snelheidsbeperking te voorkomen:

  • Logica voor opnieuw proberen implementeren: 429 antwoorden verwerken met exponentieel uitstel.
  • Batchaanvragen: combineer indien mogelijk meerdere prompts.
  • Gebruik bewaken: houd uw tokenverbruik en aanvraagpatronen bij.
  • Gebruik de juiste modellen: kies het juiste Claude-model voor uw use case.

Verantwoordelijke AI-overwegingen

Houd bij het gebruik van Claude-modellen in Foundry rekening met deze verantwoorde AI-procedures:

Goede praktijken

Volg deze aanbevolen procedures bij het werken met Claude-modellen in Foundry:

Modelselectie

Kies het juiste Claude-model op basis van uw specifieke vereisten:

  • Claude Mythos Preview: Voor defensieve cyberbeveiliging, autonome codering en langdurige agenten.
  • Claude Opus 4.7: Meest geschikt model voor codering, bedrijfswerkstromen en langlopende agentische taken.
  • Claude Opus 4.6: Zeer geschikt model voor het bouwen van agents, codering en bedrijfswerkstromen.
  • Claude Opus 4.5: Beste prestaties voor codering, agents, computergebruik en bedrijfswerkstromen.
  • Claude Opus 4.1: Complexe redenering en bedrijfstoepassingen.
  • Claude Sonnet 4.6: Grensinformatie op schaal voor codering, agenten en de meeste gebruiksvoorbeelden.
  • Claude Sonnet 4.5: Evenwichtige prestaties en mogelijkheden, productiewerkstromen.
  • Claude Haiku 4.5: Snelheid en kostenoptimalisatie, grote volumeverwerking.

Promptengineering

  • Duidelijke instructies: geef specifieke en gedetailleerde aanwijzingen op.
  • Contextbeheer: Gebruik het beschikbare contextvenster effectief.
  • Roldefinities: gebruik systeemberichten om de rol en het gedrag van de assistent te definiëren.
  • Gestructureerde prompts: gebruik consistente opmaak voor betere resultaten.

Kostenoptimalisatie

  • Tokenbeheer: tokengebruik bewaken en optimaliseren.
  • Modelselectie: gebruik het meest rendabele model voor uw use-case.
  • Caching: Implementeer expliciete promptcaching waar nodig.
  • Batchverwerking aanvragen: combineer indien mogelijk meerdere aanvragen.

Probleemoplossingsproces

De volgende tabel bevat veelvoorkomende fouten wanneer u met Claude-modellen in Foundry en hun oplossingen werkt:

Fout Oorzaak Solution
401 Niet geautoriseerd Ongeldige of verlopen API-sleutel of onjuist Entra ID-tokenbereik. Controleer of uw API-sleutel juist is. Controleer of u voor Entra ID de scope https://ai.azure.com/.default gebruikt.
403 Verboden Onvoldoende machtigingen voor de resource of het abonnement. Controleer of u de rol Inzender of Eigenaar hebt voor de resourcegroep. Zorg ervoor dat voor Entra ID de rol Cognitive Services User is toegewezen.
404 Niet gevonden Onjuiste eindpunt-URL of implementatienaam. Controleer of uw basis-URL het patroon https://<resource-name>.services.ai.azure.com/anthropic volgt en dat de implementatienaam overeenkomt met uw configuratie.
429 Te veel aanvragen De frequentielimiet is overschreden voor uw abonnementslaag. Implementeer exponentieel terugtrekken met herhaal-logica. Overweeg de aanvraagfrequentie te verminderen of een quotumverhoging aan te vragen.
Fout bij het bepalen van abonnementsgeschiktheid Niet-Enterprise- of niet-MCA-E-abonnement. Claude-modellen vereisen een Enterprise- of MCA-E-abonnement. Zie API-quota en -limieten voor meer informatie.
Regio niet beschikbaar Implementatie geprobeerd in een niet-ondersteunde regio. Implementeer in VS - oost 2 of Zweden - centraal, de ondersteunde regio's voor Claude-modellen.