在 Databricks 笔记本中进行基本编辑

Databricks 笔记本是一种基于 Web 的代码编辑器,可用于编写代码并查看用于交互式数据分析的结果。 本页介绍在 Databricks 中使用笔记本的基础知识,包括如何导航工具栏和执行各种单元格操作。

创建笔记本

可以通过多种方式创建新笔记本:

创建新笔记本时,该笔记本将保存到 Drafts 主工作区中的文件夹。 将笔记本命名后,它会从 Drafts 文件夹移到你的主工作区文件夹。

打开笔记本

若要打开笔记本,请使用工作区 搜索函数 或使用工作区浏览器 导航到笔记本 ,然后单击笔记本的名称或图标。

如果 启用了笔记本和文件的选项卡,则可以 在新选项卡中打开笔记本

并排编辑笔记本

若要并排查看和编辑笔记本,请单击 “列拆分”图标。 若要添加当前笔记本的拆分视图。 你还可以拖动笔记本选项卡并将其放到右侧,以便并排编辑笔记本。

添加拆分视图以并排编辑笔记本文件

笔记本单元格

笔记本包含两种类型的单元格的集合:代码单元格和 Markdown 单元格。 代码单元包含可运行代码。 Markdown 单元格包含以文本和图形的形式呈现的 Markdown 代码。 使用 Markdown 记录或说明代码。 可以在笔记本中添加或删除任一类型的单元格来构建工作。 笔记本最多可包含 10,000 个单元格。

可以运行单个单元格、一组单元格或整个笔记本。 笔记本单元最多可以包含 6 MB,其输出限制为 20 MB。

笔记本工具栏图标和按钮

工具栏包含可用于管理和编辑笔记本的菜单和图标。

笔记本工具栏

笔记本名称旁边是用于 更改笔记本的默认语言 的按钮,如果笔记本包含在 Databricks Git 文件夹中,打开 Git 对话框

若要查看笔记本以前的版本 ,请单击“上次编辑…” 消息。

下表描述了工具栏右侧的图标和按钮:

Icon Description
运行所有按钮 中断执行按钮 运行所有单元格或停止执行。 此按钮的名称会根据笔记本的状态而更改。
笔记本标头计算选择器 打开计算选择器。 当笔记本连接到群集或 SQL 仓库时,此按钮会显示计算资源的名称。
笔记本头作业调度程序 打开作业计划程序
笔记本标头 LDP 选择器 打开 Lakeflow Spark 声明性管道。 仅当笔记本是管道的一部分时,才会显示此按钮。
笔记本头共享按钮 打开 权限对话框

笔记本右侧边栏中提供了多项操作,如下表所述:

Icon Description
注释图标。 打开笔记本注释
“试验”图标。 打开 MLflow 笔记本实验
历史记录图标。 打开笔记本版本历史记录
变量图标。 打开变量资源管理器。 (可用于 Databricks Runtime 12.2 LTS 及更高版本的Python变量。
环境图标。 打开Python环境窗格。 此窗格显示笔记本可用的所有Python库,包括笔记本范围的库、群集库和 Databricks Runtime 中包含的库。 仅当笔记本附加到群集时才可用。

创建单元格

笔记本有两种类型的单元格:代码和 Markdown。

若要创建新单元格,请将鼠标悬停在顶部或底部的单元格上,然后单击以下其中一个:

  • + Code 以添加代码单元格。
  • 点击+ Text以添加 Markdown 单元格。
  • + Genie Code ,使用内联 Genie Code 提示符添加代码单元格。 描述所需内容,Genie Code 在新单元格中生成代码。

用于创建新单元格 的 按钮

默认情况下,代码单元假定笔记本的代码语言,该语言在页面顶部指定。 如果要混合语言,可以为单元格指定其他语言。 请参阅 “设置默认语言”。

Markdown 单元格的内容将呈现为 HTML 格式。 例如,此代码片段包含一级标题的标记:

%md ### Libraries
Import the necessary libraries.

呈现效果如下所示:

呈现的 Markdown 示例

单元格操作

可以对单元格执行各种操作。 通过单元格运行菜单,可以选择是运行单元格、单元格上方的所有单元格,还是运行单元格下方的所有单元格。 可通过单元格图标快速更改编码语言、删除单元格和访问 Genie Code。 通过单元格作菜单,可以剪切和复制单元格、在笔记本中移动单元格以及隐藏单元格中的代码或结果。

运行单元格

若要运行代码单元格,请单击单元格左上角的向右箭头。 若要访问单元格运行菜单,请单击其旁边的向下箭头,然后选择要运行单元格的上下文。

单元格运行菜单。

运行单元格后,单元格运行菜单右侧会显示一条通知,其中显示了单元的上次运行时间及其持续时间。 将光标悬停在通知上以获取更多详细信息。

若要默认显示详细的运行信息,请单击右上角的配置文件图像。 然后单击 设置>开发人员>显示详细的命令运行信息

上次运行图像

如果您有表格数据输出,还可以通过将鼠标悬停在表格右下角的“上次刷新”文本上来访问此信息。

运行选定单元格

可以运行单个单元格或单元格集合。 若要选择单个单元格,请单击单元格内的任意位置。 若要选择多个单元格,请按住 MacOS 上的 Command 键或Windows上的 Ctrl 键,然后单击文本区域外的单元格,如屏幕截图所示。

如何选择多个单元格

若要运行所选单元格,请单击 Run>运行和调试>运行所选单元格或在 macOS 上使用键盘快捷方式 Command + Enter,或在 Windows 上使用 Crtl + Enter。 此命令的行为取决于笔记本附加到的计算资源。

  • 在运行 Databricks Runtime 13.3 LTS 或更高版本的计算资源上,将单独执行所选单元格。 如果单元格中发生错误,则将继续执行后续单元格。
  • 在运行 Databricks Runtime 14.0 或更高版本的计算资源或 SQL 仓库上,所选单元格将作为批处理执行。 任何错误都将停止执行,并且无法取消单个单元格的执行。 可以使用“中断”按钮停止执行所有单元格。

运行所选文本

可以在笔记本单元中突出显示代码或 SQL 语句,并仅运行突出显示的代码。 在您想要快速迭代代码和查询时,这非常有用。

  1. 突出显示要运行的行。

  2. 选择 运行 > 运行所选文本 或使用键盘快捷方式 Ctrl+Shift+Enter。 如果未突出显示任何文本,运行所选文本 执行当前行。

    运行选定的行

如果你在单元格中正在使用编号为 的混合语言,则必须在选择中包含 行。

如果突出显示的选择中包含折叠代码,运行选定文本也会执行该折叠代码。

支持特殊单元格命令,例如 %run%pip%sh

不能在具有多个输出标签页的单元格上使用 运行所选文本(即已定义数据概况或可视化的单元格)。

单元格图标

以下屏幕截图描述了笔记本单元格右上角显示的图标:

右上方单元格图标

语言选择器: 为单元格选择语言。

删除单元格: 删除单元格。

Genie Code: 在代码单元格中切换 Genie Code 内联的打开或关闭状态。 可以输入 Genie Code 的提示,以帮助生成代码。

单元格焦点: 放大单元格以使编辑更加轻松。

显示单元格操作菜单: 打开单元格操作菜单。 对于代码和 Markdown 单元格,此菜单中的选项略有不同。

“单元格操作”菜单

删除单元格

若要删除单元格,请单击单元格右侧的回收站图标。 仅当你将光标悬停在单元格上时,才会显示此图标。

单元格回收站图标

移动单元格

若要向上或向下移动单元格,请单击并按住单元格左侧的拖动手柄图标。

向上或向下拖动单元格

还可以从单元格操作菜单中选择 上移下移

剪切、复制和粘贴单元格

有多种选项可用于剪切和复制单元格。 但是,如果使用 Safari 浏览器,则只有键盘快捷方式可用。

  • 在单元格操作菜单中选择 剪切单元格复制单元格
  • 使用键盘快捷方式:Command-XCtrl-X 剪切和 Command-CCtrl-C 进行复制。
  • 使用笔记本顶部的“编辑”菜单。 选择 剪切复制

剪切或复制单元格后,可以将这些单元格粘贴到笔记本文件中的其他位置、其他笔记本文件或不同浏览器选项卡或窗口中的笔记本文件中。 若要粘贴单元格,请使用键盘快捷方式 Command-VCtrl-V。 单元格粘贴到当前单元格下方。

若要撤消剪切或粘贴操作,可以使用键盘快捷方式 Command-ZCtrl-Z 或菜单选项 编辑 > 撤消剪切单元格编辑 > 撤消粘贴单元格

若要选择相邻单元格,请单击 Markdown 单元格,然后使用 Shift + 向上向下 选择上方或下方的单元格。 使用编辑菜单将所选单元格复制、剪切、粘贴或删除为组。 若要选择所有单元格,请选择 编辑 > 选择所有单元格 或使用命令模式快捷方式 Cmd+A

添加代码注释

若要向单元格中的代码添加注释,请突出显示代码。 单元格右侧会显示一个注释图标。 单击图标以打开批注框。

评论图标

向仪表板添加一个单元格

若要将 Markdown 单元格或具有表格结果的单元格添加到仪表板,请从单元格操作菜单中选择“添加到仪表板”。 有关详细信息,请参阅笔记本中的仪表板

若要获取笔记本中特定命令的 URL 链接,请单击 “全屏”图标。 若要打开焦点模式并从浏览器地址栏中复制 URL。 若要退出焦点模式,请单击“全屏退出”图标。

打开 Genie 代码

可以通过两种方式打开 Genie Code:

  • 在现有单元格中:点击单元格右上角的 Genie Code 图标Sparkle Genie Code 图标。
  • 在新单元格中:将鼠标悬停在顶部或底部的单元格上,然后单击“ + Genie Code”。 有关详细信息,请参阅 “创建单元格 ”。

在代码单元格中使用 Genie Code,以获取有关代码的帮助或建议。 必须在工作区中启用 Genie Code。