google-cloud-dataflow - 使用 ParDo 遵循不同的变换 - Apache Beam
问题描述
在 Distinct 之后立即使用 ParDo 是个好主意吗?发生的情况是,Distinct 变换中的 Extract First Element 步骤与以下 ParDo 和后续变换并行工作。由于某种奇怪的原因,管道已经放慢了速度。我应该等待不同的完成,然后通过在侧输入之间创建一个虚拟变换继续前进吗?
请告诉我...
代码片段:
p.apply(TextIO.read().from("gs://"))
.apply(Distinct.<String>create())
.apply(ParDo.of(new DoFn...))
.apply(ParDo.of(new DoFn...))
.apply(SpannerIO.write()...)
解决方案
推荐阅读
- python - 如何根据条件在熊猫中创建行
- javascript - 非空字符串 .charAt(0) 如何返回空字符串?
- ruby-on-rails - 如何在 Rails Gemfile 中指定间接 gem 依赖版本
- php - 不能对 Ajax 使用 POST 方法,不能通过 dd() 获取值;使用 GET 方法后在控制器中,无法将记录添加到数据库
- activemq-artemis - 当消息被转发到没有队列的地址时,是否应该自动创建队列?
- amazon-web-services - Heroku - AWS Cloudfront
- html -
在 FormattedMessage 中用作值(使用 TypeScript ) - javascript - GSAP ScrollTrigger 动画淡入淡出不透明度问题
- mysql - MySql 中的规范化和表
- c# - 'private (string, object)[] s;' 是什么意思?意思/做?