首页 > 解决方案 > Apache Beam - ReadFromText 的窗口化

问题描述

如何配置 Apache Beam 的 ReadFromText 以使用窗口,而不是默认的全局窗口(在 Python 中)?

我正在尝试摄取一个 10gb 的文件,并且在一个大窗口中处理大量记录正在大大拖延我的管道的吞吐量。

标签: pythonapache-beamwindowing

解决方案


推荐阅读