首页 > 解决方案 > 从 DBFS 挂载到 Azure Data Lake 创建新表

问题描述

我在 Azure Data Lake 上有一个安装到 Azure Data Bricks 群集的目录。使用 CLI 工具浏览文件系统或仅通过笔记本运行 dbfs utils,我可以看到该目录中有文件和数据。进一步 - 对这些文件执行查询是成功的,数据被成功读入和写出。

我还可以成功浏览到我的挂载的根目录('/mnt',因为这就是这里使用的文档:https://docs.databricks.com/spark/latest/data-sources/azure/azure-datalake。 html)在“创建新表”用户界面中(通过数据 -> 添加表 -> DBFS)。

但是,该根目录下没有列出子目录。

这是 DBFS 的一个怪癖吗?UI的怪癖?或者我是否需要重新配置一些东西以允许我通过该 UI 添加表格?

标签: azureazure-data-lakedatabricks

解决方案


Data UI 当前不支持挂载,它只适用于内部 DBFS。所以目前没有配置选项。如果您想使用此 UI 进行数据上传(而不是例如存储资源管理器),唯一的解决方案是之后通过 dbutils.fs.mv 将数据从内部 DBFS 移动到挂载目录。


推荐阅读