首页 > 解决方案 > 使用 Apache Beam(并行)查找组件?

问题描述

给定以下输入:(E1, E2), (E2, E3), & (E3,E4)。是否可以使用 Apache Beam 框架输出(E1、E2、E3、E4)?我的目标是在给定匹配的元素对(并行)的情况下输出所有连接的组件。

标签: pythongraphgoogle-cloud-platformgoogle-cloud-dataflowapache-beam

解决方案


一种简单的方法是使用相同的密钥键入 (E1, E2) 和 (E3, E4),例如 PCollection 然后使用CoGroupByKey


推荐阅读