python - 如何将大型数据集从 csv 读取到数据框中?
问题描述
遇到错误:ParserError:标记数据时出错。C错误:内存不足
尝试使用较小的 csv 文件,它可以工作,但不适用于较大的文件
import pandas as pd
LARGE_FILE =r'E:\Users\celine_chua\Downloads\flights.csv'
mylist2 = []
for chunk in pd.read_csv(LARGE_FILE, sep=',', chunksize=1000):
mylist2.append(chunk)
flights_df = pd.concat(mylist2, axis= 0)
del mylist2
解决方案
推荐阅读
- javascript - Bootstrap 选项卡中的莫里斯面积图
- java - 我可以在 TreeSet 的构造函数中同时拥有 ArrayList 和 Comparator 吗?
- android - 无法使用 CMake 变量 PROJECT_SOURCE_DIR 定义静态库的绝对路径
- java - Stream 对第一个和最后一个项目做不同的事情,Java 8
- python - PyAutoGUI - 在错误的浏览器中打开 Chrome 控制台
- python - 如何提高 scikit-learn 中预测的准确性
- javascript - 悬停时自定义鼠标动画
- jquery - 使用 CSS 动画/变换。如何将一个 div 向上翻转然后再向下翻转,然后将第二个 div 向上和向下翻转并暂停 + 循环?
- continuous-integration - 持续交付的原则
- apache-spark - Spark DataFrame 与 CreateDataFrame