databricks - 以编程方式将库导入 Databricks 中的工作区
问题描述
我想以编程方式将(Python Wheel)库添加到/Shared
Databricks 上的工作区。在 GUI(工作区 > 导入 > 库)中很容易做到,但我无法弄清楚如何在 Databricks CLI 中做到这一点。
所以我认为我有两种可能的策略:
- 将其安装为库
- 将其作为文件复制到工作区
似乎 1) 不可行,因为库术语专用于集群上的实际安装,而 2) 不可行,因为workspace import
需要语言(Python、R、SQL 等)并将文件解释为脚本。
所以我对如何解决这个问题有点迷茫。
解决方案
根据我的观察:
注意: databricks workspace import
“将文件从本地导入 Databricks 工作区。”
我尝试过使用databricks workspace import
cmdlet 并理解它是作为文件复制的。
如何使用 Azure Databricks CLI 安装库?
使用 DBFS CLI 将库从本地目录复制到 DBFS:
databricks fs cp "C:\Users\Azurewala\Downloads\wheel-0.33.4-py2.py3-none-any.whl" dbfs:/FileStore/jars
使用 API 或 UI 创建集群。
使用databricks clusters list
并复制 cluster-id 获取集群 ID。
使用 DBFS CLI 将 DBFS 中的库附加到集群:
databricks libraries install --cluster-id "0802-090441-honks846" --whl "dbfs:/FileStore/jars/wheel-0.33.4-py2.py3-none-any.whl"
使用 Azure Databricks CLI 成功安装了一个库:
希望这可以帮助。
推荐阅读
- c++ - Why can GCC not vectorize this function and loop?
- angular - 无法解析使用 Nativescript/ 错误文件 angular.json 迁移 Angular
- java - 如何避免使用 toString().getBytes("UTF-8") 来避免 OOM 错误?有没有更好的方法从 StringWriter 转换为 byte[]?
- android - Toast 和活动更改时出现 WindowManager$BadTokenException
- java - PageNotFound:在 DispatcherServlet 中找不到具有 URI [../j_spring_security_check] 的 HTTP 请求的映射
- python - 使用 QItemDelegate 绘制图标
- ios - 如何在 Alamofire 中发布带有原始正文的请求?
- php - 如何使用 continue 每 4 次拆分一次
- swift - 无需解码即可读取jpeg的高度宽度和文件大小的快速方法
- amazon-web-services - 如何设置 AWS 在同一 VPC 上的两个弹性 beanstalk 实例之间交换流量?