rsync - 是否有任何操作员使用 Airflow 通过 SFTP 在不同主机之间移动文件?
问题描述
Airflow生态系统的菜鸟。我使用 Airflow 的首要目标之一是实现跨机器移动文件的工作流程。特别是,我正在寻找将来自不同 Mac/Linux 机器的数据整合到 NAS(使用 SFTP)中的方法。
我一直在探索不同的 Airflow 运营商,并且大多数传输运营商将数据从本地机器复制到云服务。我还没有看到有人将文件从主机复制到主机,也没有人移动(或复制,然后检查,然后删除)。我假设我可以使用 BashOperator 移动或使用 rsync 处理文件。在这方面是否有关于如何使用 Airflow 通过 SFTP 在不同主机之间移动文件的最佳实践?任何模式可以安全地复制/检查/删除?
解决方案
There is not.
However, you can create your own operators as plugins: https://airflow.apache.org/docs/stable/plugins.html
You may wanna take advantage of SftpHook existing in Airflow to code your operator: https://airflow.readthedocs.io/en/stable/_modules/airflow/contrib/hooks/sftp_hook.html
推荐阅读
- xslt - 如何在xslt中将属性值作为整数取出?
- mysql - FULL OUTER JOIN sql 语句上的 SQL 错误
- python - 杀死进程,包含一个无限循环,显然在多个操作系统上
- powerpoint - 从 Golang 控制 PowerPoint
- kubernetes - 在 helm 升级期间无法重新创建部署,因为 PersistentVolumeClaim 和 Service 无法替换
- amazon-dynamodb - Dynamoose:提供的关键元素与架构不匹配
- selenium - 如何在不使用 browser.pause 的情况下使 E2E 稳定?
- javascript - React JS:未捕获的 TypeError:getState 不是函数
- javascript - 开玩笑期望对象属性值不是对象
- flutter - 扩展和灵活的工作在一行中不太好