首页 > 解决方案 > Databricks-GitHub 集成,自动将所有 notebook 添加到存储库

问题描述

我正在尝试为 Databricks设置GitHub 集成。
我们在那里有数百个笔记本,手动将每个笔记本添加到存储库中会很累。

有没有办法自动提交所有笔记本并将其从数据块推送到存储库?

标签: gitgithubautomationdatabricks

解决方案


由于3个月没有人回答,我将提出自己的解决方案。

/Shared/databricks 的 dir 下,我们有笔记本,它们应该同步到notebooks/Shared/.
我定期运行此脚本,从而使所有笔记本在存储库中保持最新。

databricks workspace export_dir /Shared ./notebooks/Shared -o
git add --all
git commit -m "shared notebooks updated"
git push

-o标志用于用最新版本覆盖现有笔记本。

更多信息在这里: https ://databricks.com/blog/2017/11/08/introducing-command-line-interface-for-databricks-developers.html

请注意,您首先必须在您的机器上设置和配置 databricks-cli: https ://docs.databricks.com/user-guide/dev-tools/databricks-cli.html#set-up-the-cli


推荐阅读