google-bigquery - 为什么 BigQuery 有自己的存储空间?
问题描述
BigQuery (BQ) 拥有自己的存储系统,与 Google Cloud Store (GCS) 完全分离。
我的问题是:为什么 BQ 不像 Hadoop Hive 那样直接处理存储在 GCS 上的数据?这种设计的好处和必要性是什么?
解决方案
BigQuery 通过拥有自己的独立存储获得了多项好处。
一方面,BigQuery 能够通过在存储数据的磁盘上移动和重新排序数据以及添加更多磁盘并随着数据库变得越来越大而重复该过程来不断优化其数据的存储。
BigQuery 还利用单独的计算层来查询存储层,从而允许存储层扩展,同时运行查询所需的整体硬件更少。这使 BigQuery 能够根据需要调用更多处理能力,但在未执行来自特定数据库的查询时没有空闲硬件。
有关 BigQueries 结构和优化的更深入解释,您可以查看我为 The Data School 撰写的这篇文章。
推荐阅读
- python - 如何减少过期请求?
- jsp - JSP - 未解析的自定义标签
- sql - 如何在 Ruby on Rails 5 中检索随机 GET 请求?
- sql - 在 SQL 中排除大量字符串 (500) 的最简单方法?
- javascript - 具有多个 ID 的 Rest API 资源命名
- google-sheets - 有没有办法将数组公式与过滤视图结合使用并按日期排序
- file-type - 在 Burp Suite 中,我如何完全隐藏文件类型以允许将 .php 文件上传到不安全的站点?
- android - 为什么安装我的游戏(由 unity 2019 制作)时出现此错误?
- c++ - 为什么我可以将可调用目标存储在与类型不匹配的 std::function 中
- microservices - 通信、高可用性和微服务