重要
Lakebase 预置是最初的 Lakebase 产品,使用的是需要手动扩展的预置计算。 有关支持的区域,请参阅 区域可用性。 有关具有自动缩放计算、缩放至零、分支和即时还原功能的最新版本 Lakebase,请参阅 Lakebase 自动缩放。
自 2026 年 3 月 12 日起,新的 Lakebase 实例将作为自动扩缩项目创建。 从 2026 年 6 月开始,现有预配实例将自动升级到自动缩放。 有关详细信息,请参阅 升级到 Lakebase 自动缩放。
Lakebase 是集成到 Databricks 数据智能平台中的完全托管的 Postgres 联机事务处理(OLTP)数据库引擎。 Lakebase 让您可以创建和管理存储在 Databricks 托管存储中的 OLTP 数据库,并能够与 Lakehouse 集成,实现实时的事务处理工作负载。
数据库实例体系结构
数据库实例管理存储和计算资源,并提供用户连接到的终结点。
- 计算节点: 一个节点是 主要节点,用于处理写入操作。 辅助节点是可选的,跨区域分隔以实现高可用性。 可以暂停计算节点,同时停止计算资源时保留存储。
- 端点:默认端点会将读写请求路由到主节点。 可选的只读端点会路由至辅助节点。
- 失败处理: 如果主节点发生故障,并且配置 了高可用性 ,则辅助节点会自动接管。
局限性
- 工作区最多允许十个实例。
- 每个实例最多支持 1000 个并发连接。
- 实例中所有数据库的逻辑大小限制为 2 TB。
- 数据库实例的范围限定为单个工作区,不支持跨工作区访问。
- Databricks 建议将 专用链接 配置为安全最佳做法。
了解已预配 Lakebase
| 主题 | Description |
|---|---|
| 升级到自动缩放 | 了解如何将 Lakebase 预配实例升级到自动缩放平台,包括需要执行哪些更改和哪些操作(如果有)。 |
| Postgres 的角色 | 了解预先创建的角色以及如何管理 Databricks 标识的角色。 |
| PostgreSQL 兼容性 | 了解 PostgreSQL 兼容性、限制和优化提示。 |
开始使用已预配的 Lakebase
对于数据库所有者和管理员
如果要为团队设置新的 Lakebase 数据库:
| 任务 | Description |
|---|---|
| 创建数据库实例 | 设置您的第一个 Lakebase 已预配置的数据库。 |
| 添加用户并设置权限 | 向其他用户授予对数据库的访问权限,并控制他们可以执行的操作。 |
对于数据库用户
如果需要访问现有的 Lakebase 数据库:
| 任务 | Description |
|---|---|
| 连接到数据库 | 获取访问 Lakebase 数据库所需的凭据。 |
| 查询数据 | 使用各种工具查询 PostgreSQL 数据,包括 SQL 编辑器、笔记本和 psql 客户端。 |
数据集成和同步
将 Lakebase 连接到现有的 Databricks 数据和工作流。
| 主题 | Description |
|---|---|
| 注册 Unity 目录系统 | (可选)在 Unity 目录中将 PostgreSQL 数据库注册为联合查询的目录。 |
| 使用同步表为 Lakehouse 数据提供服务 | 创建同步表,以便通过 Lakebase 数据库实例为操作应用程序提供 Unity 目录数据。 |
高级功能
探索高级功能,以支持生产环境的工作负载和企业用途。
| 主题 | Description |
|---|---|
| 还原数据和时光回溯 | 使用子实例执行时间旅行并将数据还原到数据恢复、合规性审核和开发环境的特定时间点。 |
| 监视和可观测性 | 使用内置指标和日志记录监视数据库性能和运行状况。 |
高级配置
探索高级功能,以支持生产环境的工作负载和企业用途。
| 主题 | Description |
|---|---|
| 高可用性 | 为数据库实例配置高可用性,以确保业务连续性。 |
| 还原窗口 | 为数据库实例设置还原窗口,以便进行时间点恢复。 |
区域可用性
支持的区域:
westuswestus2eastuseastus2centralussouthcentralusnortheuropewesteuropeaustraliaeastbrazilsouthcanadacentralcentralindiasoutheastasiauksouth
功能对比
下表比较了 Lakebase 自动缩放和 Lakebase 预置功能。
注释
Lakebase 自动缩放是 Lakebase 的新版本。 新功能开发侧重于 Lakebase 自动缩放。
新的 Lakebase 实例将创建为自动缩放项目。 推出从 2026 年 3 月 12 日开始。 有关详细信息,请参阅 默认情况下的自动缩放。
| 功能 | Autoscaling | 已预配 |
|---|---|---|
| 核心功能 | ||
| 已预配(固定大小)计算资源 | ✓ | ✓ |
| Autoscaling | ✓ | |
| 缩放到零 | ✓ | |
| 分支 | ✓ | |
| 即时还原 | ✓ | |
| 时间点还原 | ✓ | ✓ |
| 只读副本/可读辅助数据库 | • (只读副本,可读辅助数据库) | ✓ (可读备库) |
| 高可用性 | ✓ | ✓ |
| 入站专用链接 | ✓ | ✓ |
| 性能密集型服务的入站专用链接 | ✓ | |
| 合规安全概述 | • (设置为 HIPAA、C5、TISAX 或 None) | |
| 客户管理的密钥 (CMK) | ✓ | |
| 数据集成 | ||
| Unity 分类目录注册 | ✓ | ✓ |
| 同步表(使用 Lakebase 为 Lakehouse 数据提供服务) | ✓ | ✓ |
| Lakehouse Sync (将 Lakebase 表同步到 Delta/Iceberg 表) | • 公共预览版 | |
| 查询联合 | ✓ | ✓ |
| 应用程序集成 | ||
| Databricks 应用 | ✓ | ✓ |
| 功能存储 | ✓ | ✓ |
| Notebooks | ✓ | ✓ |
| 状态化 AI 代理 | ✓ | ✓ |
| 访问控制 | ||
| PostgreSQL 用户角色管理界面 | ✓ | ✓ |
| 工作区访问控制列表 (ACL) | ✓ | ✓ |
| 开发人员工具 | ||
| 基础结构即代码(资产捆绑包、Terraform) | • (Beta) | ✓ |
| 编程访问(REST API、CLI、SDK) | • (Beta) | ✓ |
| PostgREST API 支持 | ✓ (PostgREST 兼容的 数据 API) | • (个人预览版) |
| 成本管理 | ||
| 标签和无服务器使用策略 | ✓ | ✓ |