google-bigquery - Google BigQuery 在小数据集上真的很慢
问题描述
我正在测试 Google BigQuery 以替换我们过去使用的传统数据库(PostgreSQL / MySQL),但发现性能非常(而且奇怪)缓慢。
上传了一个约 6mb 的数据集(约 44,000 行)进行测试。
尝试运行一些简单的查询:
SELECT Sub_Category, COUNT(*) AS COUNT FROM rnd-projects-247203
.test.data GROUP BY Sub_Category
有人可以帮我解释一下为什么对一个小数据集进行如此简单的查询需要超过 20 秒才能运行吗?我在设置中做错了什么/需要做一些不同的事情吗?
谢谢!
补充:S00下展开的执行细节
数据从 Google Drive .csv 文件中获取和加载
解决方案
BigQuery 是 PB 级数据仓库。它是对传统数据库的最佳补充。不应考虑使用它来代替 MySql/Postgres。
BigQuery 对于大规模查询非常快,例如 3-10 秒的 TB/PB 规模。对于小型查询,运行时间也在 1-2 秒左右。无论如何,不像事务数据库那样需要 20 毫秒。
推荐阅读
- html - Angular Routes 在 Angular 12 中不起作用
- postgresql - 从 AWS RDS 备份到 S3 存储桶
- java - 在 Kotlin 中关闭应用程序后,如何将 onItemSelected 保留在选定的同一项目上?
- java - 在多线程环境中处理文件后删除输入目录
- css - Scrollspy 根本不起作用 - 菜单项未突出显示
- python - 努力使用 Requests/Session 登录 Goodreads;我尝试登录网络抓取时缺少什么?
- java - 在 Android Studio 中,我只能看到“创建新类”对话框的简单形式
- php - 如何使用 Laravel 将 PayPal 数组响应详细信息发布到数据库
- linux - 如何在 linux 命令行中使用管道在后台成功之前重新运行某些内容?
- angular - Angular - ngui-auto-complete 意外焦点错误