首页 > 解决方案 > Dask:read_sql_table 为 KeyError + Dask join 提供复合索引可用性

问题描述

我正在尝试阅读一个简单的表格并最终出现关键错误,不确定这里的交易

请看我的代码

import numpy as np
import pandas as pd
import sqlalchemy as sa
import dask.dataframe as ddf

start_time = datetime.now() 

sqluri = f'oracle+cx_oracle://test:test@PROD1:1522/?service_name=prddb'
engine = sa.create_engine(sqluri)

daskDF = ddf.read_sql_table(table='test1', uri=sqluri, index_col='ID',schema='testusr')

另外,我们可以通过以下方式使用 SQL 连接吗?

sa_meta = sa.MetaData()
sa_table = sa.Table("test1", sa_meta, autoload=True, autoload_with=engine)
sa_query= sa.select("select /*+ PARALLEL(8) */ a.* , a.id||a.period as d_idx from test1 a join test2 b on test1.id=test2.id where a.acct='Client'")
ddf = dd.read_sql_table(sa_query, sqluri, index_col="d_idx ")

标签: pandassqlalchemydaskdask-dataframe

解决方案


推荐阅读