google-bigquery - BigQueryIO.writeTableRows 以非常高的延迟写入 BigQuery
问题描述
以下代码片段显示了 BigQuery 的写入方法(它从 PubSub 获取数据)。“写入 BigQuery”数据流步骤接收 TableRow 数据,但它以非常高的延迟(超过 3-4 小时)写入 BigQuery,或者根本不写入数据。日志中没有错误/警告,我可以看到数据到达这里。我希望它尽可能通用,所以不想在代码中提供模式。此代码段是否有任何可能导致此行为的错误?
PCollection<TableRow> tableRows;
...
tableRows.apply("Write to BigQuery",
BigQueryIO.writeTableRows().to(options.getTable())
.withExtendedErrorInfo()
.withCreateDisposition(CreateDisposition.CREATE_NEVER)
.withWriteDisposition(WriteDisposition.WRITE_APPEND)
.withMethod(Method.STREAMING_INSERTS)
.withFailedInsertRetryPolicy(InsertRetryPolicy.retryTransientErrors()));
更新:我将代码修改为:
tableRows.apply("Write to BigQuery",
BigQueryIO.writeTableRows().to(options.getTable())
.withCreateDisposition(CreateDisposition.CREATE_NEVER));
现在它可以正常工作了。原始版本的代码有什么问题?
解决方案
问题已解决,是基础问题。
推荐阅读
- angular - 在材料表 angular 9 上执行自定义验证
- ruby-on-rails - 修复 Rails 中的 n+1 查询
- reactjs - 添加指向对象数组的链接
- java - 如何通过 JDBC 实现与 SAP HANA 数据库的安全连接?
- editor - Source Insight 的其他替代方案是什么?
- r - R:数据框或列表列表中的部分(或完全)匹配
- next.js - 导入期间 Puppeteer 抛出错误:“原始”参数必须是函数类型 | 下一个 Js
- php - 如何从 htaccess PHP 的 IP 中提取拒绝?
- javascript - 首次加载网站时,反应 xarrows 无法正确呈现
- python - json数据处理出错“字符串索引必须是整数”