airflow - Airflow/Composer 推荐的文件夹结构
问题描述
你们对 Composer 文件夹/目录结构有什么推荐吗?它的结构方式与我们内部 Airflow 服务器现在使用的方式不同。
基于谷歌文档:https ://cloud.google.com/composer/docs/concepts/cloud-storage :
plugins/
: 存储你的自定义插件、操作符、钩子dags/
:存储 dag 和 Web 服务器解析 dag 所需的任何数据。data/
:存储任务产生和使用的数据。
之前我将 key.json 文件放入文件data/
夹时遇到了麻烦,并且无法使用data/
文件夹中的键解析 dags。所以现在我倾向于将所有支持文件放在dags/
文件夹中。
如果我将 dag 支持的文件(sql、keys、schema)放在dags/
文件夹中,调度程序的性能会受到影响吗?是否有使用该文件夹的好用例data/
?
如果你们可以向我展示如何构建 composer 文件夹以支持具有不同 dag、插件和支持的文件的多个项目的示例,将会很有帮助。
现在,我们只有 1 个 Github 用于整个 Airflow 文件夹。每个项目有一个单独的 git 会更好吗?
谢谢!
解决方案
只要您放在 dags 文件夹中的文件不是.py
文件,对调度程序的影响应该是相当小的;但是,您也可以将文件放在插件文件夹中,该文件夹也通过副本同步。
dags/projectA/dagA.py
如果项目足够大,我会使用顶级文件夹来分隔项目(例如),甚至是单独的环境。
推荐阅读
- python - 我应该提出自定义异常吗?
- php - 使用 PHP 中的 files.upload 将文件上传到 slack
- r - R GRMetric:如何个性化情节设计(主题、颜色、图例等)
- assembly - 计算数字的平方并将它们存储在装配 8086 masm 中的 dw 中
- vba - 在 VBA 中的评论中添加 URL 链接
- c++ - 从字符串流(和布尔类型)中提取值后的 rdstate()
- html - 纯css表格固定标题和数据可在浏览器中滚动
- python-3.x - 操作系统使用 3.7 时使用 Python 3.6
- css - 将左浮动元素定位在页面的中心
- sql - SQL 查询之谜