apache-beam - ProfileOptions profile_cpu=True 的数据流作业不写入配置文件
问题描述
我正在尝试分析在 Apache Beam Python 3.7 SDK 2.27.0 上运行的 Dataflow Pipeline 作业的 CPU 使用率。--profile_cpu
我使用和args 设置触发了作业profile_location
,并且可以看到它们是在 Dataflow 控制台中设置的:
显示已设置 profile_cpu 和 profile_location 的数据流管道选项。
但是,在作业完成后,没有文件写入profile_location
GSC 存储桶。
在查看 Dataflow 日志时,jsonPayload.logger:"apache_beam.utils.profiler:profiler.py"
我可以看到“开始分析”和“停止分析”的日志:
但是没有与“将探查器数据复制到:”步骤相对应的日志,即使在profile_location
中设置了ProfilingOptions
,因此应该在Profiler
. 任何有关可能出现问题的建议,或有关当前是否支持此功能的知识都将非常有帮助。
解决方案
这是通过使用--experiments=use_runner_v2
标志解决的。看起来这仅在 Dataflow Runner v2 上受支持,该版本尚未作为默认运行器推出。
推荐阅读
- angular - 有没有人做过一些事情来从 Angular 8 连接到多个 firebase 项目?
- python - pivot_table 没有给出预期的结果
- python - 如何在 python 中读取像素颜色(不是从图像中读取)
- jquery - 单击后悬停事件更改
- scala - Scala mutable.LinkedHashMap:for-loop 移除奇怪的行为
- python - 在使用 python-shell 时在 heroku 中安装 python 模块不起作用
- python - 在没有输入的情况下使用 Python 同时录制 3 个麦克风
- visual-studio - Visual Studio Community Edition 2019 中没有工作流/WCF 模板
- reactjs - ReactJs - 通过异步函数将道具映射到状态
- node.js - 如何从 nodeJS 脚本运行 git update-index skip-worktree