更改模型版本和设置

本文将介绍如何更改提示生成器中的模型版本和设置。 模型版本和设置可能会影响生成式 AI 模型的性能和行为。

模型选择

可以通过选择提示生成器顶部的 “模型 ”来更改模型。 下拉菜单允许您从生成自定义提示答案的生成式 AI 模型中进行选择。

在 Power Apps 或 Power Automate 中使用提示会消耗 prompt builder 信用,而在 Copilot Studio 中使用提示会消耗 Copilot 信用。 有关详细信息,请参阅 AI Builder 文档中的 许可证和提示生成器积分

Overview

下表介绍了可用的不同型号。

模型跨区域具有不同的可用性,并定期更新。 请参阅按区域划分的提示模型可用性及更新以了解更多信息。

注释

  • GPT-4o mini 和 GPT-4o 继续在美国政府管理的区域内使用。 这些模型遵循许可规则,并提供与 GPT-4.1 mini 和 GPT-4.1 分别相当的功能。
  • 人类模型托管在Microsoft外部,并受人类术语和数据处理的约束。 了解更多内容,请参见 “选择外部模型作为主要人工智能模型”。
GPT 模型 许可 功能 Category
GPT-4.1 mini(默认型号) 基础费率 根据截至 2024 年 6 月的数据进行训练。 最多输入128K代币。 小型
GPT-4.1 标准费率 根据截至 2024 年 6 月的数据进行训练。 上下文最多允许 128K 标记。 一般
GPT-5 聊天 标准费率 所用训练数据截止到 2024 年 9 月。 上下文最多允许 128K 标记。 一般
GPT-5 推理 高级费率 所用训练数据截止到 2024 年 9 月。 上下文最多允许 400K 标记。 深层
GPT-5.2 推理 高级费率 根据截至 2024 年 10 月的数据进行训练。 上下文最多允许 400K 标记。 深层
GPT-5.3 对话 标准费率 托管模型。 上下文最多允许 128K 标记。 一般
克洛德·索内 4.6 标准费率 来自 Anthropic 的外部模型。 上下文最多允许 200K 标记。 一般
克洛德作品4.6 高级费率 来自 Anthropic 的外部模型。 上下文最多允许 200K 标记。 深层
Grok 4.1 快速(非推理)(请参阅以下重要说明) 标准费率 xAI 的外部模型。 一般

重要

Microsoft的安全和负责任的 AI 评估发现,Grok-4.1 快速(非推理型)模型在对齐程度上低于其他被评估的模型,导致 (i) 该模型产生潜在有害内容的风险更高,以及 (ii) 在安全和越狱基准分数上的得分较低。 Grok-4.1 快速模式(非推理)可能会生成显式内容,并且这种倾向性可能比其他模型更高。 客户必须遵守 Microsoft企业 AI 服务行为准则xAI 的企业服务条款,包括其 可接受的使用策略。 此外,此模型可能会产生一些类别的危害,这些危害不受Microsoft的内容安全系统所涵盖。 因此,与所有实验模型一样,不建议使用 Grok-4.1 快速(非推理),客户应在选择 Grok-4.1 快速(非推理)之前查看 实验模型和预览模型的限制 ,并进行自己的评估。

许可

在代理、流程或应用中,任何使用模型的提示都将消耗Copilot积分,无论模型处于哪个发布阶段。 了解更多关于 计费率与管理的内容。

如果您有AI Builder 点数,系统在 Power Apps 和 Power Automate 中使用提示时会优先消耗这些点数。 在 Copilot Studio 中使用提示时,系统不会消耗AI Builder的积分。 在 AI Builder 文档的 许可概述 中了解更多信息。

发行阶段

模型会经历不同的发布阶段。 你可以尝试新的、前沿的 实验 和 预览 模型,或者选择可靠、经过充分测试且 普遍可用的 模型。

Tag Description
Experimental 用于实验,而非生产用途。 受预览条款的约束,并且可能对可用性和质量有限制。
Preview 最终会成为通用模型,但目前不建议用于生产用途。 受预览条款的约束,并且可能对可用性和质量有限制。
无标签 普遍可用。 您可以将此模型用于缩放和生产用途。 通常通用模型无可用性与质量限制,但部分模型仍可能存在区域可用性等限制。
重要提示:Anthropic Claude 模型处于实验阶段,即使未显示标签。
Default 所有智能体的默认模型,通常是性能最佳的通用模型。 默认模型会随着新的、功能更强大的模型正式发布而定期升级。 如果所选模型已关闭或不可用,代理还会使用默认模型作为后备。

实验模型和预览模型可能显示性能、响应质量、延迟或消息消耗等方面存在差异。 他们可能会超时或无法接听。 此类模型受预览条款约束。

分类

下表说明不同模型类别特性:

Category 小型 一般 深层
Performance 适用于大多数任务 胜任复杂任务 已被训练用于推理任务
速度 处理速度更快 可能由于复杂性导致速度变慢 速度较慢,因为它在响应之前会进行推理
用例 摘要、信息任务、图像和文档处理 图像和文档处理、高级内容创建任务 数据分析和推理任务,图像和文档处理

当你需要一个经济高效的解决方案来应对中等复杂度的任务、计算资源有限或需要更快的处理时,选择 微型 模型。 迷你模型非常适合预算有限的项目以及客户支持或高效代码分析等应用。

当你处理高度复杂、多模态且需要卓越性能和详细分析的任务时,选择 通用 模型。 对于准确性和高级功能至关重要的大型项目,它是更好的选择。 当你有预算和计算资源支持时,通用模型也是一个不错的选择。 对于随着时间推移复杂性可能会增加的长期项目,通用模型也是首选。

深度 模型非常适合需要高级推理能力的项目。 它们适合需要复杂问题解决和批判性思维的场景。 深度模型在细致入微的推理、复杂的决策和详细分析很重要的环境中表现出色。

根据地区可用性、功能、使用场景和成本选择模型。 请在按区域提供的模型和更新中了解您所在区域可用的模型及模型退役计划。 详细了解 AI Builder 能力费率表中的定价信息。

模型设置

你可以通过选择提示构建器顶部的三个点...进入>设置面板。 您可以更改以下设置:

  • 温度:较低温度产生可预测结果。 较高温度可获得更丰富或更具创意的响应。
  • 记录检索:为知识源检索的记录数。
  • 在回复中包含链接:选中后,回复中将包含检索记录的链接引文。
  • 启用代码解释器:选择后,生成 和执行代码的代码解释 器被启用。
  • 内容审核等级:最低级别产生最多答案,但可能包含有害内容。 最高级别的内容审核会采用更严格的过滤器来限制有害内容,并减少回答。

温度

通过滑块为生成式AI模型设置温度。 范围在0到1之间。 这个数值指导生成式人工智能模型在创造力(1)与确定性答案(0)之间的差异。

注释

GPT-5 推理模型不支持温度设置。 因此选择 GPT-5 推理模型时滑块将不可用。

温度是控制AI模型输出随机性的参数。 较低的温度导致更可预测和更保守的输出。 相比之下,更高的温度允许更多创造性和多样性的回答。 这是一种微调模型输出中随机性和确定性平衡的方法。

与之前创建的提示一样,默认温度为 0。

温度 功能性 应用于
0 更可预测和更保守的输出。
回复更加一致。
要求准确性高且可变性较小的提示。
1 回复更具创造性和多样性。
更多样且有时更创新的回复。
创造新颖独特内容的提示。

调节温度会影响模型的输出,但不能保证一定的结果。 人工智能的回复具有内在的概率性,即使在相同的温度设置下也会有所不同。

内容审核级别

通过滑块设置提示内容的审核等级。 降低审核强度后,你的提示能够提供更多答案。 然而,回答数量的增加可能会影响提示中允许的 有害内容 (仇恨与公平、性、暴力、自残)。

注释

内容审核级别设置仅适用于受管理模型。 因此,当选择Anthropic或Azure AI Foundry模型时,滑块不可用。

调节度从 不等。 提示的默认审核等级为 “中等”。

较低的审核会增加提示回复中出现有害内容的风险。 更高的调节能降低风险,但可能会减少响应数量。

内容审核级别 Description 建议使用情形
可能允许仇恨与公平、性、暴力或自残内容,内容包含明确且严重的有害指示、行为、损害或虐待。 包括支持、美化或推广严重有害行为、极端或非法的伤害、激进化,或非自愿的权力交换或滥用。 用于处理可能被视为有害内容的数据提示(例如,暴力描述或医疗程序)。
温和 可能允许含有仇恨、与公平相关、性、暴力或自残内容,使用冒犯性、侮辱性、嘲讽、恐吓或贬低特定身份群体的语言。 包括寻求并执行有害指令、幻想、美化、中等强度的伤害宣传。 默认过滤。 适合大多数用途。
可能允许仇恨与公平、性、暴力或自残内容,表达偏见、评判或观点。 包括冒犯性语言使用、刻板印象、探索虚构世界的用例(例如游戏、文学)以及低强度的描绘。 如果你需要比中等级别更严格的过滤,可以使用。

要在使用提示时覆盖代理的内容审核设置,请在提示工具的完成界面设置“运行后”设置为发送特定响应(下文指定)。 要显示的消息应包含 Output.predictionOutput.text 自定义变量。

“完成”界面的截图,设置为“发送特定回复(请在下方说明)”。