apache-beam - APACHE BEAM GROUP KEY 数据
问题描述
我有一个
看起来像这样 的PCollection<KV<KV<String, String>, Long>
每个项目:
我想将所有项目分组为相同的日期,但我不知道该怎么做PCollection
KV{KV{date,name},long}
如果有人有想法?
提前致谢
解决方案
一旦你获得了 KV<> 格式的 PCollection。您可以在 apache Beam 中使用 GroupBYKey PTransform,它将所有数据放入具有相同键的 Iterable 中。
使用以下代码:
PCollection<KV<> outputElement = inputElemeny.apply(GroupByKey.<KV<>>create());
然后在输出元素上应用 Pardo 以获得您想要的合适结果。
推荐阅读
- c++ - 使用 push_back() 方法在向量容器中创建新对象
- javascript - 清除固定切换文本
- java - Java迭代动态字符串
- javascript - NodeJS SRCDS 查看孙进程的日志
- python - 将名称值对转换为新的 pandas 数据列
- mysql - 如何在 MySQL GROUP_CONCAT 中将分隔符作为变量传递?
- php - Google Maps iOS / MySQL - 为折线存储经过的路线
- android-8.0-oreo - 由于 bg 限制,不允许 Service.startForeground()
- java - Android - 活动打开时随机播放表格内容
- python-3.x - 使用共享字典的 Python 数据帧和多处理