google-bigquery - 数据仓库中 BigQuery 表的归档解决方案
问题描述
给定一个使用 BigQuery 构建数据仓库的用例,假设是否需要对所有 BigQuery 表进行每月备份。什么是最好的选择?
- 将所有表格数据导出到云存储(csv?)
- 将所有表复制到不同的数据集(可能在不同的项目中)
考虑到成本和维护,最好的选择是什么?如果有其他选择,也请分享。
解决方案
将数据从 BigQuery 移动到 GCS 时,您无需为导出和加载操作付费,如免费操作文档中所述;但是,在 GCS 中存储数据会产生费用,具体取决于所选存储的类型。该服务提供多区域、区域、近线和冷线选项,您可以根据访问存储数据所需的频率进行选择。
基于此,如果您想进行备份并且不经常访问数据,您可以使用Coldline / Nearline存储将数据存储在 GCS 中,或者使用BigQuery 中的长期存储,即当表格连续 90 天未编辑时自动应用,这将是一些更便宜的选择。另一方面,如果您打算积极使用数据,则最好将 BigQuery 与Active Storage一起使用,这与将其存储在具有区域存储的 GCS 中的成本相似;不过,这将取决于您的特定用例以及您希望与数据交互的方式。
关于提取文件格式,BigQuery 支持多种可用于加载数据的格式。我建议您查看此文档,该文档可以帮助您根据您的数据结构确定最适合您当前场景的格式。
推荐阅读
- dart - 无法在 Raspberry Pi 零 W 上加载 Dart SDK
- python - 将字符串类别转换为整数后如何找到结果?
- node.js - 有没有办法在“无头:假”模式下完全重新打开一个网站?
- laravel - Livewire,Laravel - 我可以从 Livewire 组件调用控制器“存储”方法吗?
- r - R readxl excel文件与美元符号
- android - 如何在 Android 中捕获签名时检查空位图
- c# - Visual Studio 无法识别新的表单名称/引用
- sql-server - Entity Framework Core + API .NET Core + n 对 n 关系
- typescript - 元素隐式具有“任何”类型,因为“字符串”类型的表达式不能用于在 angularjs 中进行索引
- android - 模拟器上 SD 文件夹的 Android ACTION_PICK