python - Apache Beam - ReadFromText 的窗口化
问题描述
如何配置 Apache Beam 的 ReadFromText 以使用窗口,而不是默认的全局窗口(在 Python 中)?
我正在尝试摄取一个 10gb 的文件,并且在一个大窗口中处理大量记录正在大大拖延我的管道的吞吐量。
解决方案
推荐阅读
- sql - 在sql中加入2个相互不依赖的表
- java - Jackson @JsonFormat 注释在使用导入的服务时丢失
- wpf - GUI 会话 ID 更改,我无法继续 d'automation 界面
- javascript - 如何在移动浏览器上跟踪滚动事件?
- python - Matplotlib 表坐标和 plt.show()
- spring-webflux - Sleuth 3.0.1 + Spring Cloud Gateway = traceids 与请求/响应不相关
- file - 如何使用 PuTTY 获取以前的目录和文件夹?
- python - 单击按钮硒python
- spring-boot - Cookie 在 Feign 客户端无状态调用中传播
- regex - 正则表达式以匹配未知长度的模式 0123456789