google-cloud-dataflow - 有没有办法将 PubSubIO 读取转换为 UnboundedSource 源
问题描述
我想将其用作有界源,以最大限度地降低流管道一直运行的成本。在使用无界源的批处理管道PubSub subscription
之前提出了类似的问题,但没有解决方案。我遇到了这个答案What PipelineRunners说我们可以把它变成一个用于测试的 .Is it possible to use PubSubIO as input here or Is there a way to convert read to ?UnboundedSource
BoundedSource
withMaxNumRecords
PubSubIO
unboundedSource
UnboundedSource<String> unboundedSource = .; // How to Use PubSub here?
PCollection<String> boundedPubsubCollection =
p.apply(Read.from(unboundedSource).withMaxNumRecords(10));
解决方案
PubSubIO 目前还没有很好地支持这一点,而且对于“Beam 模型”来说有点奇怪。一些选项:
- 您是否尝试过启动管道并定期排空它?
- 如果这不起作用,您应该在 Beam 邮件列表或问题跟踪器中发布功能请求。
推荐阅读
- asp.net - 插入 SQL Server 的连接字符串问题
- assembly - x86 汇编语言中的函数调用
- angular - 如何在 Angular 6 中迭代 json 数据?
- r - R - 基于索引值的数据帧中的条件标签,没有循环
- javascript - 如何使用 knexjs 在 psql 中的多行中插入数组
- python - 在 Jupyter 中的一个 matplotlib 图上有 2 个 Ipywidgets - Python
- php - 在 PHP 中实现和理解适配器模式
- laravel - Laravel 两个网站一个认证
- go - 如何检查随机性?
- python - 连接到 Flask SocketIO 实现