python - Python中read_csv的内存错误
问题描述
当我尝试读取 csv 文件时,我在 Python 中面临 dtype 警告。我检查了类似的问题,为 dtype 提供值没有帮助,它给出了相同的警告和内存错误。我正在使用房利美性能数据集,为混合类型找到的列是空值或格式为 mm/yyyy 的年份。首先我把它们放在 str 上,然后放在 object 上,但没有这些帮助。难道是文件太大(443,15MB),我的电脑无法处理?我有 2 GHz 的核心 2 双核处理器和 3 Gb RAM 内存。
这是导致问题的一段代码
data=pd.read_csv(os.path.join(settings.DATA_DIR,f),header=None,names=HEADERS[prefix],sep='|',index_col=False,
dtype={"zero_balance_date": str, "last_paid_installment_date": object, "foreclosure_date": object})
这是警告:
DtypeWarning:列 (15,16) 具有混合类型。在导入时指定 dtype 选项或设置 low_memory=False。
推杆low_memory=False
也不起作用。
解决方案
推荐阅读
- python - 如何参数化 AWS EMR 中的步骤名称?
- python - CSV 导入并合并列
- asp.net - 将数据表导出到 Excel 时如何修复 0x800A03EC 错误
- jax-rs - 设置在请求处理期间使用的属性
- c# - 在 Office.Interop.Word C# 中将水印作为文本插入
- r - 可以在传单 R 中实现两个顺序的 flyTo
- java - 如何在 Android Studio 中修复此“重复类错误”
- salesforce - 在目标工具中按外部 ID 映射 Salesforce 查找字段
- javascript - Discord js直接消息等待不起作用
- oracle - 当插入期间日期值为空时,JPA @query 不起作用