python - 使用 Apache Beam(并行)查找组件?
问题描述
给定以下输入:(E1, E2), (E2, E3), & (E3,E4)。是否可以使用 Apache Beam 框架输出(E1、E2、E3、E4)?我的目标是在给定匹配的元素对(并行)的情况下输出所有连接的组件。
解决方案
一种简单的方法是使用相同的密钥键入 (E1, E2) 和 (E3, E4),例如 PCollection 然后使用CoGroupByKey。
推荐阅读
- python - Clang Cindex:涉及模板时检索类层次结构的问题
- c# - unity 看不到附加动画
- hadoop - 如何在 HDFS 中恢复损坏文件的部分内容
- sql - SQL Query 根据条件逻辑每组获取一行
- typescript - 在 map 方法中初始化类
- c# - 在 MEF 上下文中使用泛型
- mysql - Why would a ending Group By without an aggregate slow down my query?
- jmeter - JMeter 5.0 分布式测试连接异常错误
- android - 启动搜索对话框时,软键盘不显示放大镜
- arrays - Powershell 数组:HOWTO 去重输出