google-cloud-dataflow - Apache Beam 中的复杂转换
问题描述
我正在检查我们是否可以将 apache beam 用于我们的数据管道。例如,我们需要进行以下复杂的转换和数据汇总。现在我们在 pandas python 中做:
dd_merged_f['group_id'] = dd_merged_f.assign(key=dd_merged_f['record_type'].eq('START').astype(int)).groupby(merge_cols)['key'].cumsum()
只是想知道我们是否可以使用 PTransform 来编写这种代码?我们也应该做一些连接。
解决方案
推荐阅读
- google-sheets - 如何反转 Google 表格上的表单提交顺序
- javascript - React-Bootstrap Modal 仅在纯 HTML 中设置样式
- html - 在 HTML/CSS 中布局标签栏:在较小的元素之前收缩较大的元素
- arrays - 使用 forEach 而不是 map ,尝试访问 Array 中的对象
- python - try: 未拦截的异常:
- qt-creator - QT Creator 有拆分文件视图吗?
- azure - SignalR(无服务器).NET 控制台客户端未收到消息
- python - 有时间限制的静音命令
- php - 雄辩的选择所有具有多对多关系的表
- react-native - TextInput 在 ScrollView React Native 中消失