python - 有没有办法在 dask read_sql_table 中将列设置为空?
问题描述
我正在连接到一个 oracle 数据库并试图通过一个大约有 7700 万行的表。起初我尝试在 pandas 中使用 chunksize,但无论我设置什么 chunksize,我总是会遇到内存错误。然后我尝试使用 Dask,因为我知道它更适合处理大量数据。但是,有些列需要设为 NULL,当您可以写出 sql 查询时,是否可以在 read_sql_table 查询中执行此操作,就像在 pandas 中一样?
干杯
解决方案
如果可能,我建议在 oracle 端进行设置,使用正确的数据类型创建视图,然后使用 read_sql_table。
您可能可以直接执行此操作,因为 read_sql_table 接受 sqlalchemy 表达式。如果您可以这样说,它应该可以工作。
推荐阅读
- php - 使用 str_getcsv 和 fgetcsv 将 CSV 数据转换为 PHP 数组时保留整数和浮点类型
- c# - Ms Teams - 基于用户输入的自适应卡片操作和继续对话
- python - plt.errorbar ValueError 将颜色指定为列表时
- javascript - 如何清除用户存储(Dialogflow)
- google-cloud-platform - 云 SQL 到 BigQuery 的传输成本
- reactjs - 如何使用 react-hook-form 有条件地禁用提交按钮?
- visual-studio - Visual Studio - 使恢复文件对话框消失
- reactjs - 头盔不是有效的 jsx 元素
- llvm - 如何将clang源文件转换为llvm IR?
- c++ - 如何用“*”字符替换输入字符?