python - 使用函数 dask.dataframe.read_sql_table 将多个列名作为输入传递给参数 index_col 以创建 dask 数据帧
问题描述
有了这个,我得到ValueError
:
import dask as dd
data1 = dd.read_sql_table('TABLE', connection_string, index_col = ['DATE','ITEM'],schema= 'CRE') gives me a value error --> ValueError: Use label when passing an SQLAlchemy instance as the index
当我只使用如下所示的日期时,我可以将数据提取到dask dataframe
.
data1 = dd.read_sql_table('TABLE', connection_string, index_col ='DATE',schema= 'CRE')
解决方案
我的猜测是 dd.read_sql_table 需要一个索引列来拆分数据。理想情况下,该列在您的 SQL 数据库中建立索引,以便于分区/分片。
将数据读入 Dask 数据帧后,您就可以对其进行其他操作。但是,请注意,截至 2020-06-27 Dask 数据框不支持多索引。
推荐阅读
- react-native - react-native 捆绑失败:错误:找不到模块 /metro-react-native-babel-transformer/src/index.js
- c++ - 当我尝试使用指针打印数组的元素时,会打印垃圾值
- python-3.x - 如何获取 AWS config 聚合资源
- java - 使用库时出现 ClassNotFoundException 异常
- excel - SSIS 脚本任务 - 使用只读变量名称保存 Excel 模板的副本
- python-3.x - pandas groupby 并根据值填充列
- point-cloud-library - 如何获得 PCL 中带有噪声点的估计正态的正态和协方差?
- sql-server - 数据库不断进入恢复挂起状态
- angular - IONIC - HTTP Post 请求不起作用,可能是标头问题
- java - Kotlin:就地保留、替换或删除每个地图条目