python - 用于具有许多任务的工作流的 apache 气流的更快替代方案
问题描述
我目前使用 Apache Airflow 来运行数据聚合和 ETL 工作流。我的工作流程相当复杂,一个工作流程有 15-20 个任务并有分支。我可以将它们组合起来,但这样做会否定我使用的重试、执行计时器等功能。Airflow 运行良好,只是在执行这么多任务时速度很慢。任务之间需要很多时间。
是否有替代方案可以更快地执行任务而不会在任务之间产生间隙?如果可能的话,我还想尽量减少切换所需的工作量。
解决方案
我会推荐Temporal Workflow。它具有对开发人员更友好的编程模型,并且可以扩展到更大的用例数量级。它还已经用于许多公司的多个延迟敏感应用程序。
免责声明:我是 Temporal 项目的技术主管和关联公司的联合创始人/首席执行官。
推荐阅读
- c - 递归删除单链表中所有出现的元素
- apache-kafka - 如何让 Kafka Avro 消费者读取具有特定模式 id / 版本的有效负载,但不生成 Avro 模式 java 类?
- wordpress - 无法在我的网站上查看页面,但可以通过 Wordpress 在预览中查看
- maven - 如何处理 Azure Devops 500 MB 文件大小限制(Maven 包)?
- java - TestNg:如何在测试套件中运行特定测试以在不同参数上重复 n 次
- c - 在 C 程序中查找由 exec() 或 system() 启动的进程的 PID
- java - DocuSign API - Java:帐户之间的信封共享列表(SharedAccess 信封)
- java - 如何修复从 websocket 收到的奇怪字符
- scala - 将子网掩码转换为 cidr 表示法 (Scala)
- html - 如何在 Angular 11 中访问两个父级的路由参数?