google-cloud-platform - GCP 中的流水线
问题描述
我有大量数据定期从数据源收集并存储在 GCS 存储桶中。目前它们存储在一个本地区域(伦敦)。我们正在使用 ETL 将这些数据与 GCP 服务(即作曲家、数据流或云功能等)组合到驻留在同一区域(例如 europe-west2 London)的 BigQuery 表中。
除此之外,我想将这些数据(例如存储桶)传输到位于不同区域的不同 BQ 表。
因此,总而言之,输出是位于两个不同区域的大查询表,如下所示:
GCS buckets:项目 1,伦敦的 buckets (europe-west2)
输出 1:project1 region1(europe-west2 London) - (existing) 上的 BQ 表
预期: 输出 2:project2 region2 (EU) 上的 BQ 表 - 多区域或比利时
我可以做到这一点,我应该如何有效地做到这一点?
感谢您对此的建议和帮助。谢谢!
解决方案
一种选择是使用 BigQuery 的数据集跨区域副本。该功能目前处于测试阶段,目前免费(请注意,它可能并不总是免费的)。
尽管该服务的位置有限,但 europe-west2 和 EU 均受支持。
推荐阅读
- wordpress - 在管理订单中使用 GTIN 编号搜索产品,同时在 woocommerce 中从后端手动添加新产品
- ruby-on-rails - rails f.number_field vs number_field_tag
- wordpress - Wordpress - Woocommerce:重新缩放透明 png 后的背景噪音
- c# - LINQ - 如何比较组中的前两项然后下一项?
- sorting - elasticsearch有没有办法对数组字段的记录进行排序?
- solidity - Solidity 语法的设计目标是什么
- android - 实时数据返回旧值,onChanged 多次触发
- amazon-web-services - 在计费恐慌中锁定公共站点访问
- c# - 在 UWP 应用中更改 Flyout 的高度和宽度
- android - 单击登录按钮后,React 本机发布签名的 apk 文件崩溃