google-bigquery - 将广泛而深入的 BigQuery 表导入 Google Dataprep
问题描述
在使用 Dataprep 中的导入功能导入具有多列和数百万行的 BigQuery (BQ) 表时,是否有任何选项可以简化数据集?
您可以在整理数据集之前选择列并参数化 BigQuery 导入吗?
我唯一的选择是首先在 BQ 中创建视图 - 以简化行数和列数吗?
理想情况下,当我运行使用此表的任何配方的输出并避免“选择 *”步骤时,我希望最大限度地降低数据流工作流程的成本。
任何提示将不胜感激。
解决方案
目前,在整理数据集之前无法避免列,如果您想减少查询成本和处理时间,使用视图是一个不错的选择。
在创建View的查询中,可以使用一些WHERE条件,尽可能减少数据量。
您还可以升级您的数据流机器类型,这可以减少执行时间和成本。
推荐阅读
- swisscomdev - 尝试删除 s3 存储服务的服务密钥时失败
- node.js - nodejs zlib错误:尝试从数据库解压缩文本数据时无效距离太远
- python - 根据另一列中的值从熊猫列中的列表中提取元素
- c# - C# 无法将多个图像合并为一个宽度超过 65000 且高度为 1800 的图像,即(65000 像素宽度 *1800 像素高度)
- google-sheets - 基于另一个值的百分比的 Google 表格条件格式
- swift - 如何模拟和测试存储字符串的 UserDefaults 计算属性?
- php - 多个方法调用如何链接到 slim 的响应对象上?
- jasperserver - 在 ubuntu 18.04 中安装 JasperReports 7.1.0 错误:BUILD FAILED 在执行 import-export.xml 时发生以下错误
- redirect - 在 IIS 6 上实现 URL 重写模块导致的无限重定向循环 ERR_TOO_MANY_REDIRECTS
- php - 如何使用 Laravel 在 LIKE 搜索中使用 ORM 从两个表中获取数据