首页 > 解决方案 > Apache-Beam 中 BigQuery 操作的处理速度非常慢

问题描述

使用beam.io.WriteToBigQuerybeam.io.BigQuerySource

apache-beam 在不分区的情况下无法处理的非常大的数据集有多大?

他们在官方网站上提到:

如果您使用 Beam SDK for Python,如果您编写了非常大的数据集源,您可能会遇到导入大小配额问题

这真是令人困惑!我在一个 BigQuery 表中有 100,000 行数据,我认为不是very large

但是在读取数据并将其再次写入 BigQuery 中的其他表时,我面临着非常高的延迟。

标签: pythongoogle-bigqueryapache-beam

解决方案


推荐阅读