你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
人类学的 Claude 模型为 Microsoft Foundry 带来了高级对话式 AI 功能,使你能够使用最先进的语言理解和生成构建智能应用程序。 Claude 模型擅长复杂的推理、代码生成和多模式任务,包括图像分析。
在这篇文章中,你将学会如何:
- 在 Microsoft Foundry 中部署 Claude 模型
- 使用 Microsoft Entra ID 或 API 密钥进行身份验证
- 从 Python、JavaScript 或 REST 调用 Claude 消息 API
- 为用例选择正确的 Claude 模型
Foundry 中的 Claude 模型包括:
| 模型系列 | 模型 |
|---|---|
| 克劳德神话 |
claude-mythos-preview
1 (封闭式研究预览版) |
| Claude Opus |
claude-opus-4-7
2 (预览版)、 claude-opus-4-6 (预览版)、 claude-opus-4-5 (预览版)、 claude-opus-4-1 (预览版) |
| Claude Sonnet |
claude-sonnet-4-6 (预览版), claude-sonnet-4-5 (预览版) |
| 克劳德·海库 |
claude-haiku-4-5(预览版) |
1克洛德神话预览 版仅作为 封闭式研究预览版提供。 对模型的访问权限完全由Anthropic公司裁量决定,并优先用于防御性网络安全用例。 有关负责任的使用指南,请参阅 Claude Mythos 预览版系统卡 。
2 遵循 迁移指南 将消息 API 代码从以前的 Claude 版本迁移到 Claude Opus 4.7。
若要详细了解各个模型,请参阅 可用的 Claude 模型。
先决条件
- 具有有效付款方式的Azure订阅。 如果没有Azure订阅,请创建付费Azure帐户。 有关更多详细信息,请参阅 订阅类型和区域支持 。
- 需要适当的权限来访问 Microsoft Foundry 并创建和管理资源。
- 在受支持的区域之一创建的 Microsoft Foundry 项目:East US2 或 Sweden Central。
- 合作伙伴和社区的Foundry 模型需要访问 Azure 市场 才能创建订阅。 确保你拥有 订阅模型产品/服务所需的权限。
- 对要部署模型的资源组具有参与者或所有者角色。 有关详细信息,请参阅 Azure RBAC 角色。
订阅类型和区域支持
若要在 Microsoft Foundry 中使用 Claude 模型,您必须具有付费 Azure 订阅,该订阅的计费帐户须在 Anthropic 提供模型购买服务的国家或地区。 有关常见订阅相关错误的列表,请参阅 常见错误消息和解决方案。 当前不支持以下订阅类型:
- 位于韩国的企业帐户
- 云解决方案提供商订阅
- Azure没有现用即付计费方法的订阅(例如,学生、免费试用版或基于启动信用额度的帐户)
- 仅使用Azure代金券的赞助订阅。 注意:如果您有一个绑定了信用卡的账户,则会从您的信用卡中扣费, 而非 Azure 额度。
有关支持区域的列表,请参阅 支持的地理位置。 请注意,人类学的“支持区域策略”可能适用于区域中的可用性,请查看 支持的区域 以了解详细信息。
部署 Claude 模型
Foundry 中的 Claude 模型可用于 全局标准部署。 若要部署 Claude 模型,请按照 Foundry 门户中的 Deploy Microsoft Foundry 模型的说明操作。
部署后,使用 Foundry 游乐场 进行交互式测试模型。
调用 Claude 消息 API
部署 Claude 模型后,与其交互以生成文本响应:
使用 Anthropic SDKs 和以下 Claude APIs:
使用身份验证发送消息
以下示例演示如何使用 Microsoft Entra ID 或 API 密钥身份验证将请求发送到 Claude Sonnet 4.6。 若要使用已部署的模型,需要:
- 基 URL,其格式为
https://<resource name>.services.ai.azure.com/anthropic。 - 部署详细信息中的目标 URI,格式为
https://<resource name>.services.ai.azure.com/anthropic/v1/messages。 - Microsoft Entra ID 用于无密钥的身份验证或使用您的部署的 API 密钥进行 API 身份验证。
- 在创建部署期间选择的部署名称。 此名称可以不同于模型 ID。
注释
对于 Opus 4.6 和 Sonnet 4.6,参数 thinking 支持类型: enabled、 disabled和 adaptive。 该 adaptive 类型允许模型根据查询复杂性和工作量级别决定是否思考。
对于 Mythos Preview,参数thinking仅支持adaptive和enabled。
对于 Opus 4.7,参数thinking仅支持adaptive和disabled。
参数effort控制响应的质量/成本权衡,支持工作级别:low和mediumhigh。 对于 Opus 4.7、Opus 4.6 和 Sonnet 4.6,参数还支持 max 工作量级别。 无论是否启用思维功能,均可使用此参数。
使用Microsoft Entra ID身份验证
对于消息 API 终结点,请使用基本 URL 进行 Microsoft Entra ID 身份验证。
安装Azure标识客户端库:安装此库以使用
DefaultAzureCredential。 使用DefaultAzureCredential时,授权最容易,因为它找到在运行环境中使用的最佳凭据。pip install azure-identity将Microsoft Entra ID应用程序的客户端 ID、租户 ID 和客户端机密的值设置为环境变量:
AZURE_CLIENT_ID、AZURE_TENANT_ID、AZURE_CLIENT_SECRET。export AZURE_CLIENT_ID="<AZURE_CLIENT_ID>" export AZURE_TENANT_ID="<AZURE_TENANT_ID>" export AZURE_CLIENT_SECRET="<AZURE_CLIENT_SECRET>"安装依赖项:使用 pip 安装 Anthropic SDK(需要 Python 3.8 或更高版本)。
pip install -U "anthropic"运行基本代码示例 以完成以下任务:
- 使用Microsoft Entra ID身份验证创建具有人类 SDK 的客户端。
- 对消息 API 进行基本调用。 调用是同步的。
from anthropic import AnthropicFoundry from azure.identity import DefaultAzureCredential, get_bearer_token_provider baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name deploymentName = "claude-sonnet-4-6" # Replace with your deployment name # Create token provider for Entra ID authentication tokenProvider = get_bearer_token_provider( DefaultAzureCredential(), "https://ai.azure.com/.default" ) # Create client with Entra ID authentication client = AnthropicFoundry( azure_ad_token_provider=tokenProvider, base_url=baseURL ) # Send request message = client.messages.create( model=deploymentName, messages=[ {"role": "user", "content": "What are 3 things to visit in Seattle?"} ], max_tokens=1048, temperature=1, thinking={"type":"adaptive"}, output_config={"effort": "max"}, stream=False ) print(message.content)预期输出: 一段 JSON 响应,其中包含模型的文本完成以及三个 Seattle 建议。
Reference:Anthropic Client SDK,DefaultAzureCredential
使用 API 密钥身份验证
重要
Claude Mythos 预览版仅支持Microsoft Entra ID身份验证。
对于消息 API 终结点,请使用基本 URL 和 API 密钥对服务进行身份验证。
安装依赖项:使用 pip 安装 Anthropic SDK(需要 Python 3.8 或更高版本):
pip install -U "anthropic"运行基本代码示例 以完成以下任务:
- 通过将您的 API 密钥传递给 Anthropic SDK 的配置,创建一个客户端。 此身份验证方法使你可以与服务无缝交互。
- 对消息 API 进行基本调用。 调用是同步的。
from anthropic import AnthropicFoundry baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name deploymentName = "claude-sonnet-4-6" # Replace with your deployment name apiKey = "YOUR_API_KEY" # Replace YOUR_API_KEY with your API key # Create client with API key authentication client = AnthropicFoundry( api_key=apiKey, base_url=baseURL ) # Send request message = client.messages.create( model=deploymentName, messages=[ {"role": "user", "content": "What are 3 things to visit in Seattle?"} ], max_tokens=1048, temperature=1, thinking={"type":"adaptive"}, output_config={"effort": "max"}, stream=False ) print(message.content)预期输出: 一段 JSON 响应,其中包含模型的文本完成以及三个 Seattle 建议。
参考:人类客户端 SDK
可用的 Claude 模型
Foundry 支持 Claude Mythos Preview、Claude Opus 4.7、Claude Opus 4.6、Claude Opus 4.5、Claude Opus 4.1、Claude Sonnet 4.6、Claude Sonnet 4.5 和 Claude Haiku 4.5 模型,通过全球标准部署。 这些模型具有关键功能:
- 自适应思维:升级为扩展思维,使克劳德能够根据需要尽可能多或少地思考,具体取决于任务和工作水平。
- 扩展思维:用于复杂任务的加强推理。
- 图像和文本输入:具有强大的视觉能力,用于分析图表、图形、技术图、报告和其他视觉资产。
- 代码生成:高级代码生成、分析和调试。
有关模型功能的更多详细信息,请参阅 Claude 模型的功能。
克劳德神话 (限量研究预览版)
重要
克劳德神话预览 版仅作为 封闭式研究预览版提供。 对模型的访问权限完全由Anthropic公司裁量决定,并优先用于防御性网络安全用例。 有关负责任的使用指南,请参阅 Claude Mythos 预览版系统卡 。
Claude Mythos 预览版仅支持Microsoft Entra ID身份验证。
Claude Mythos 预览版是为雄心勃勃的项目而构建的新型智能类别,也是全球在网络安全、自主编码和长期运行智能代理方面的最佳模型。 仅作为封闭式研究预览版提供,其访问权限优先用于防御网络安全用例。 Claude Mythos 预览版具有 1M 令牌上下文窗口和 128K 最大输出,专为以下场景而构建:
- 网络安全:全球最佳防御安全模型。 它可以查找并建议对生产代码库中的实际漏洞进行修复方案,然后帮助验证这些修复是否有效。
- 自主编码:比任何以前的模型更高效地处理整个工程周期 , 从目标到交付,跨大型代码库进行调查、实现和测试。
- 长时间运行的代理:为较长时间范围的智能体工作设定新的标准。 它能够在持续多小时的任务中保持连贯执行,并随着条件的变化进行调整,从而推进工作,减少干预。
Claude Mythos 预览版支持 自适应思维,这一升级为扩展思维,使克劳德能够根据任务和精力水平自由地多思或少思。
克劳德·奥普斯 4.7 (预览版)
小窍门
按照 迁移指南 将消息 API 代码从以前的 Claude 版本迁移到 Claude Opus 4.7。
Claude Opus 4.7 是 Claude Opus 系列中最强大的模型,在编码、企业工作流及长时间运行的主动任务上提升性能的水平。 使用 1M 令牌上下文窗口和 128K 最大输出,Opus 4.7 非常适合代理编码、企业知识工作、长时间运行的多工具工作流、高分辨率多模式推理(高达 2576px/3.75MP)、财务分析和网络安全。 Opus 4.7 支持 自适应思维,这是对扩展思维的一次升级,使克劳德可以根据任务和所需的工作量自由地多思考或少思考。
克劳德·奥普斯 4.6 (预览版)
Claude Opus 4.6 是 Claude Opus 系列中一种高度有能力的模型,用于编码、企业代理和专业工作。 Opus 4.6 具有 1M 令牌上下文窗口和 128K 最大输出,非常适合生产代码、复杂的代理、办公室任务、财务分析、网络安全和计算机使用。
克劳德·奥普斯 4.5 (预览版)
Claude Opus 4.5 是编码、代理、计算机使用和企业工作流的行业领导者。 Opus 4.5 具有 200K 令牌上下文窗口和 64K 最大输出,非常适合生产代码、复杂的代理、办公室任务、财务分析、网络安全和计算机使用任务。
克劳德·奥普斯 4.1 (预览版)
Claude Opus 4.1 是编码行业领导者。 它针对需要集中精力和数千个步骤的长时间运行任务提供持续的性能,大大扩展了 AI 代理可以解决的问题。
克劳德 Sonnet 4.6 (预览版)
Claude Sonnet 4.6 大规模提供前沿智能,专为编程、代理和企业工作流而构建。 使用 1M 令牌上下文窗口和 128K 最大输出,Sonnet 4.6 非常适合编码、代理、办公室任务、财务分析、网络安全和计算机使用。
Claude Sonnet 4.5(预览版)
Claude Sonnet 4.5 是一种高度有能力的模型,旨在生成真实代理并处理复杂的长期任务。 它为大容量用例提供了强大的速度和成本平衡。 Sonnet 4.5 还为计算机操作提供了高级的精准度功能,能够使开发人员指导 Claude 像人类一样使用计算机。
克劳德·海库 4.5 (预览版)
Claude Haiku 4.5 为多个使用场景提供接近前沿的性能。 它作为最佳编码和代理模型之一脱颖而出,具有适当的速度和成本,为免费产品和可扩展子代理提供支持。
Claude 模型的高级特性和功能
Foundry 模型中的 Claude 支持高级特性和功能。 核心功能 增强了 Claude 处理、分析和生成各种格式和用例的内容的基本功能。 工具 使 Claude 能够与外部系统交互、执行代码,并通过各种工具接口执行自动化任务。
Foundry 支持的一些 核心功能 包括:
大型上下文窗口: 处理较大文档和较长对话的扩展上下文窗口。
代理技能: 使用技能扩展 Claude 的功能。
引文:基于源文档来支持 Claude 的响应。
上下文编辑: 使用可配置的策略自动管理聊天上下文。
扩展思维: 所有 Claude 模型均配备复杂任务的增强推理能力。
小窍门
对于 Opus 4.6 和 Sonnet 4.6,参数
thinking支持类型:enabled、disabled和adaptive。 该adaptive类型允许模型根据查询复杂性和工作量级别决定是否思考。对于 Mythos Preview,参数
仅支持 和 。 对于 Opus 4.7,参数
thinking仅adaptive支持和disabled。努力: 能够控制响应的质量/成本权衡。
小窍门
该
effort参数支持工作级别:low、medium和high。 对于 Opus 4.7、Opus 4.6 和 Sonnet 4.6,参数还支持max工作量级别。 无论是否启用思维功能,均可使用此参数。PDF 支持: 处理和分析 PDF 文档中的文本和视觉内容。
提示缓存: 为 Claude 提供更多背景知识和示例输出,以降低成本和延迟。
Foundry 支持的一些 工具 包括:
- MCP 连接器: 无需单独的 MCP 客户端即可直接从消息 API 连接到远程 MCP 服务器。
- 记忆: 跨对话存储和检索信息。 随着时间的推移,构建知识库,维护project上下文,并从过去的交互中学习。
- Web 提取: 从指定的网页和 PDF 文档中检索完整内容以进行深入分析。
有关支持的功能和工具的完整列表,请参阅 Claude 的功能概述。
代理支持
- Microsoft Agent Framework支持创建使用 Claude 模型的代理。
- 使用 Claude 代理 SDK 生成自定义 AI 代理。
API 配额和限制
重要
目前,只有 Enterprise 和 MCA-E 订阅才有资格在 Foundry 中使用 Claude 模型。
在 Foundry 中,Claude 模型有以下速率限制:以每分钟令牌(TPM)和每分钟请求(RPM)为单位。
| 型号 | 部署类型 | 默认 RPM | 默认 TPM | 企业和 MCA-E RPM | 企业和 MCA-E TPM |
|---|---|---|---|---|---|
| claude-opus-4-7 | 全球标准 | 0 | 0 | 2,000 | 2,000,000 |
| claude-opus-4-6 | 全局标准 | 0 | 0 | 2,000 | 2,000,000 |
| claude-opus-4-5 | 全局标准 | 0 | 0 | 2,000 | 2,000,000 |
| claude-opus-4-1 | 全局标准 | 0 | 0 | 2,000 | 2,000,000 |
| claude-sonnet-4-6 | 全局标准 | 0 | 0 | 2,000 | 2,000,000 |
| claude-sonnet-4-5 | 全局标准 | 0 | 0 | 4,000 | 2,000,000 |
| claude-haiku-4-5 | 全局标准 | 0 | 0 | 4,000 | 4,000,000 |
若要提高配额超出默认限制,请通过 配额增加请求表单提交请求。
速率限制最佳做法
优化您的使用并避免频率限制:
- 实现重试逻辑:使用指数退避处理 429 个响应。
- 批处理请求:尽可能合并多个提示。
- 监视使用情况:跟踪令牌消耗和请求模式。
- 使用适当的模型:为用例选择正确的 Claude 模型。
负责任 AI 的注意事项
在 Foundry 中使用 Claude 模型时,请考虑以下负责任的 AI 做法:
在模型推理期间配置 AI 内容安全,因为 Foundry 在部署时不提供 Claude 模型的内置内容筛选。
确保应用程序符合 人类可接受的使用策略。 此外,请参阅 Claude Mythos Preview、Claude Opus 4.7、Claude Opus 4.6、Claude Opus 4.5、Claude Opus 4.1、Claude Sonnet 4.6、Claude Sonnet 4.5 和 Claude Haiku 4.5 的安全评估详细信息。
最佳做法
在 Foundry 中使用 Claude 模型时,请遵循以下最佳做法:
模型选择
根据具体要求选择适当的 Claude 模型:
- Claude Mythos 预览版:针对防御性网络安全、自主编码和长时间运行的代理。
- Claude Opus 4.7:用于编码、企业工作流和长时间运行的自主任务的最强大模型。
- Claude Opus 4.6:用于生成代理、编码和企业工作流的高性能模型。
- Claude Opus 4.5:跨编码、代理、计算机使用和企业工作流的最佳性能。
- Claude Opus 4.1:复杂的推理和企业应用程序。
- Claude Sonnet 4.6:用于编码、代理及大多数用例的大规模前沿智能。
- Claude Sonnet 4.5:均衡性能和功能、生产工作流。
- 克劳德海库 4.5:速度和成本优化,大容量处理。
提示工程
- 明确说明:提供具体和详细的提示。
- 上下文管理:有效使用可用的上下文窗口。
- 角色定义:使用系统消息定义助手的角色和行为。
- 结构化提示:使用一致的格式来获得更好的结果。
成本优化
- 令牌管理:监视和优化令牌使用情况。
- 模型选择:对用例使用最经济高效的模型。
- 缓存:在适当情况下实现 显式提示缓存 。
- 请求批处理:尽可能合并多个请求。
故障排除
下表列出了在 Foundry 中使用 Claude 模型时出现的常见错误及其解决方案:
| 错误 | 原因 | 解决方案 |
|---|---|---|
| 401 未授权 | 无效或过期的 API 密钥,或Entra ID令牌范围不正确。 | 验证 API 密钥是否正确。 对于 Entra ID,请确认使用范围 https://ai.azure.com/.default。 |
| 403 禁止访问 | 资源或订阅的权限不足。 | 验证资源组上是否具有 “参与者 ”或 “所有者” 角色。 对于Entra ID,请确保分配 Cognitive Services User 角色。 |
| 404 未找到 | 终结点 URL 或部署名称不正确。 | 确认基 URL 遵循模式https://<resource-name>.services.ai.azure.com/anthropic,部署名称与配置匹配。 |
| 429 请求过多 | 您的订阅级别已超出速率限制。 | 使用重试逻辑实现指数退避。 请考虑降低请求频率或请求 增加配额。 |
| 订阅资格错误 | 非企业订阅或非 MCA-E 订阅。 | Claude 模型需要企业版或 MCA-E 订阅。 有关详细信息 ,请参阅 API 配额和限制 。 |
| 区域不可用 | 尝试在不受支持的区域中部署。 | 部署到 美国东部 2 或 瑞典中部,支持 Claude 模型的区域。 |