在 Azure Databricks 上使用代理

本页概述了在Azure Databricks上生成、部署和使用 AI 代理的工具。 若要了解有关代理的详细信息,请参阅 代理系统设计模式

功能 Description
入门:无代码 GenAI 尝试使用 AI Playground 进行基于 UI 的测试和原型制作。
入门:适用于 GenAI 的 MLflow 3 尝试使用 MLflow 进行 GenAI 跟踪、评估和人工反馈。

提供和查询 GEN AI 大型语言模型(LLM)

从 LLM 提供商(如 OpenAI 和 Anthropic)提供一组特选的生成 AI 模型,并通过安全、可扩展的 API 进行提供。

功能 Description
基础模型 提供第一代 AI 模型,包括开源和第三方模型,如 Meta Llama人类克劳德OpenAI GPT 等。

生成和部署企业级 AI 代理

生成和部署自己的代理,包括工具调用代理、检索扩充的生成应用和多代理系统。 如果想从无代码方式开始,请使用 AI Playground 选择一个 LLM、添加工具,并与智能体对话,以便在导出为代码之前测试其响应。

AI Playground 为代理原型制作提供了低代码选项。

功能 Description
AI实验室(无代码) 在无代码环境中原型和测试 AI 代理。 在生成用于部署的代码之前,快速试验代理行为和工具集成。
知识助理 使用直观的界面生成和优化特定于域的 AI 聊天机器人。
生成自定义代理 使用 Python 创作、部署和评估代理。 支持使用任何创作库编写的代理,包括 LangGraph、LangChain、OpenAI 和 LlamaIndex。 与 MLflow 追踪集成。 使用 Databricks Apps 快速迭代。 若要快速开始,请参阅 AI 代理入门
将代理连接到工具 创建代理工具以查询结构化和非结构化数据、运行代码或连接到外部服务 API。
MCP (模型上下文协议) 标准化代理如何使用安全、一致的接口连接到数据和工具。

使用外部代理

如果代理在 Databricks 外部运行,请将其注册为 Unity 目录中的代理服务,使其可供团队发现,并控制谁可以使用它。

功能 Description
代理服务(Beta 版) 在 Unity 目录中注册外部代理。 在统一视图中浏览和发现各团队的代理,并使用与保护表、模型和函数相同的授权来控制访问权限。

评估、调试和优化代理

使用评估和跟踪工具跟踪代理性能、收集反馈并推动质量改进。

功能 Description
MLflow 跟踪 使用 MLflow 跟踪实现端到端可观测性。 记录代理在开发和生产中调试、监视和审核代理行为所要执行的每个步骤。
代理评估 使用代理评估和 MLflow 来衡量质量、成本和延迟。 通过内置的评审应用收集利益干系人和主题专家的反馈,并使用 LLM 评委来识别和解决质量问题。
监视代理 在脱机评估和联机监视中使用相同的评估配置(LLM 法官和自定义指标)。