python - 使用 Python/Pandas 将数据从 Vertica DB 加载到文件
问题描述
基本上,我正在寻找将非常大的数据集加载到数据框的最快方法。我知道首先将表格从 Vertica 加载到文件中会有所帮助。目前从 DB IDE 将数据保存到 CSV,然后将文件加载到 pandas 比直接从 Vertica 使用 pd.read_sql 快得多。但过程不方便。
有什么建议么?我找到了这个,但不确定如何使用它保存到文件:
cur = connection.cursor()
cur.copy("COPY test_copy (id, name) from stdin DELIMITER ',' ", csv)
很高兴知道这个过程中的瓶颈是什么。
谢谢!
解决方案
推荐阅读
- javascript - 如何使用jquery根据屏幕宽度更改div的类
- reactjs - 反应库中的反应钩子给出无效的钩子调用错误
- django - 从 Django 管理面板安排任务
- python - 离线安装依赖python模块,无需PIP
- php - 如何创建一个帖子,然后将数据条目上传到一个单独的表中,其中的数据条目一次包含先前创建的帖子的 ID?
- ubuntu - 更新脚本后 Hubot 不会启动
- visual-c++ - VC++ 2017:尝试使用 RC 编译 .rc 文件时出错
- mysql - 使用resultmap时如何计算?
- jmeter - 如何在现有的 Jmeter 脚本中设置 CBLite
- reactjs - 当状态中只有一个字段发生变化时,如何避免重新渲染所有 React 纯组件?