python - 将 Dask Dataframe 导入 Bigquery 表?
问题描述
有什么技术可以将 dask 数据帧上传到 bigquery 表中吗?据我所知,Bigquery 支持熊猫。
假设我们将 df 作为 pandas 数据框:
from google.cloud import bigquery
bq_table_path=`project_id.dataset_id.table_name`
bigquery_client=bigquery.client(project=project_id)
bigquery_client.load_table_from_dataframe(df,bq_table_path)
在 dask 数据框中呢?我收到以下错误:
NotImplemented Error: series getitem is only supported for other series objects with matching partition structure"
有什么建议吗?
解决方案
我最近制作了一些原型,您可以在此评论中找到关于 github 问题https://github.com/coiled/dask-bigquery/issues/3#issuecomment-896350178但如果您继续阅读讨论,则此实现存在限制,主要与数据的大小有关。如果您有大量数据并且可以依赖中间存储并使用镶木地板,则可以尝试遵循此要点上的解决方案https://gist.github.com/bnaul/4819f045ccbee160b60a530b6cfc0c98#file-dask_bigquery-py-L188- L271
推荐阅读
- android - 如何解决“应用程序在使用 google play 服务时出现问题。请重试。”
- c++ - 我的二进制图像 OpenCV C++ 没有显示我的直方图
- php - 获取父票的用户 ID - MySQL
- r - 在 R 中对很长的时间序列进行二次采样,以显示它
- php - 调用 zip 命令的 PHP ssh2_exec 函数创建一个垃圾文件而不是完整的 zip
- spring-boot - 执行器的数据源实例化错误
- python - 为什么每个进程都会多次创建同一个对象?
- python - 弹出链表的最后一个元素时出现意外输出
- python-3.x - 将 varBinds 中的 OID 转换为 MIB 的最有效方法
- java - 在 JNI 函数中,当我就地更改从 Java 代码传递的数组时,数组不会修改