为用于 Visual Studio Code 的 Databricks 扩展选择工作区目录

注意

本文适用于适用于 Visual Studio Code 的早期版本的 Databricks 扩展。 有关适用于 Visual Studio Code 的 Databricks 扩展的工作区同步信息,请参阅版本 2 及以上的 使用 Databricks 同步工作区文件夹

本文档已过时,将来可能不会更新。 本内容中提及的产品、服务或技术不再受支持。

本文介绍如何选择 Azure Databricks 工作区目录,以便 Visual Studio Code 的 Databricks 扩展使用。 请参阅 Visual Studio Code 的 Databricks 扩展

以下信息假设您已经为 Visual Studio Code 设置了 Databricks 扩展,以便通过 Azure Databricks 工作区进行身份验证。 请参阅 为 Visual Studio Code 的 Databricks 扩展设置授权

注意

用于Visual Studio Code的 Databricks 扩展仅适用于它创建的工作区目录。 不能在工作区中使用现有工作区目录,除非它是由扩展创建的。

若要将工作区目录与用于 Visual Studio Code 的 Databricks 扩展配合使用,必须使用 0.3.5 或更高版本的扩展,并且Azure Databricks群集必须安装 Databricks Runtime 11.3 LTS 或更高版本。

从扩展版本 0.3.15 开始,工作区目录是默认设置。 但是,如果将扩展设置为使用 Databricks Git 文件夹而不是工作区目录,可以将扩展重新设置为使用工作区目录,如下所示:

  1. 在打开扩展和代码项目后,且已设置好 Azure Databricks 配置文件,在命令面板(命令面板)中键入 ,然后单击 首选项:打开用户设置
  2. 选项卡上,展开,然后单击
  3. 对于“同步: 目标类型”,请选择“工作区”。
  4. 退出并重启Visual Studio Code。

请注意,将设置从使用 Databricks Git 文件夹更改为使用工作区目录后,可能需要手动地将代码重新同步到工作区。 为此,请在下一过程中创建新的工作区目录后,单击“同步目标”旁边的带箭头圆圈(“开始同步”)图标。

“开始同步”图标 0

打开扩展和代码项目后,创建要使用的新Azure Databricks工作区目录,或选择之前使用扩展创建的现有工作区目录。

创建新的工作区目录

若要创建新的工作区目录,请执行以下操作:

  1. 在“配置”窗格中的“同步目标”旁边,单击齿轮(“配置同步目标”)图标。

    “配置同步目标”图标 1

  2. 在“命令面板”中,单击“创建新的同步目标”。

  3. 键入新工作区目录的名称,然后按 Enter。

    该扩展在工作区中创建具有指定目录名称 /Users/<your-username>/.ide 的目录,然后将工作区目录的路径添加到代码项目 .databricks/project.json 的文件,例如 "workspacePath": "/Users/<your-username>/.ide/<your-directory-name>"

    注意

    如果远程工作区目录的名称与本地代码项目的名称不匹配,将显示一个警告图标,并显示以下消息:远程同步目标名称与当前Visual Studio Code工作区名称不匹配。 如果你不要求名称匹配,则可以忽略此警告。

  4. 设置工作区目录后,通过单击“同步目标”旁边的带箭头圆圈(开始同步)图标开始与工作区目录同步。

    “开始同步”图标 1

重要

用于Visual Studio Code的 Databricks 扩展仅执行从本地Visual Studio Code项目到远程Azure Databricks工作区中相关工作区目录的单向自动同步文件更改。 此远程工作区目录中的文件是临时文件。 不要从远程工作区内部对这些文件启动更改,因为这些更改不会同步回本地项目。

重用现有的工作区目录

如果您已经创建了一个现有的工作区目录(使用 Visual Studio Code 的 Databricks 扩展创建的),并且想要在当前的 Visual Studio Code 项目中重新使用,那么请执行以下操作:

  1. 在“配置”窗格中的“同步目标”旁边,单击齿轮(“配置同步目标”)图标。

    配置同步目标图标 2

  2. 命令面板中,从列表中选择工作区目录的名称。

该扩展将工作区目录的路径添加到代码项目 .databricks/project.json 的文件,例如 "workspacePath": "/Users/<your-username>/.ide/<your-directory-name>"

注意

如果远程工作区目录的名称与本地代码项目的名称不匹配,将显示一个警告图标,并显示以下消息:远程同步目标名称与当前Visual Studio Code工作区名称不匹配。 如果你不要求名称匹配,则可以忽略此警告。

设置工作区目录后,通过单击“同步目标”旁边的带箭头圆圈(开始同步)图标开始与工作区目录同步。

“开始同步”图标 2

重要

用于Visual Studio Code的 Databricks 扩展仅执行从本地Visual Studio Code项目到远程Azure Databricks工作区中相关工作区目录的单向自动同步文件更改。 此远程工作区目录中的文件是临时文件。 不要从远程工作区内部对这些文件启动更改,因为这些更改不会同步回本地项目。