git - Databricks-GitHub 集成,自动将所有 notebook 添加到存储库
问题描述
我正在尝试为 Databricks设置GitHub 集成。
我们在那里有数百个笔记本,手动将每个笔记本添加到存储库中会很累。
有没有办法自动提交所有笔记本并将其从数据块推送到存储库?
解决方案
由于3个月没有人回答,我将提出自己的解决方案。
在/Shared/
databricks 的 dir 下,我们有笔记本,它们应该同步到notebooks/Shared/
.
我定期运行此脚本,从而使所有笔记本在存储库中保持最新。
databricks workspace export_dir /Shared ./notebooks/Shared -o
git add --all
git commit -m "shared notebooks updated"
git push
-o
标志用于用最新版本覆盖现有笔记本。
请注意,您首先必须在您的机器上设置和配置 databricks-cli: https ://docs.databricks.com/user-guide/dev-tools/databricks-cli.html#set-up-the-cli
推荐阅读
- jena - Jena tdbloader 性能和限制
- mysql - 在单个查询中使用多个 COUNT 子句的正确方法是什么?
- docusignapi - DocuSign - PowerForms 是否支持 Webhooks/Connect
- keycloak - Keycloak - 将角色添加到用户配置文件
- c# - 如何运行循环任务直到其他任务完成
- java - 声纳扫描仪可以在没有启动和运行声纳服务器的情况下工作
- laravel - laravel elequent hasmany 有多个条件
- blazor - Blazor:带参数的路由未解析
- reactjs - 隐藏/删除反应js中的组件
- django - 如何在客户端缓存 api 调用