python - 使用fillna()导致python内存错误的原因
问题描述
我收到以下错误
numpy.core._exceptions.MemoryError:无法分配具有形状(1329、22474)和数据类型 float64 的数组
这是我的代码:
interactions_df = pd.DataFrame(list(DB[USER_COLLECTION].find({})))
interactions_full_df = interactions_df.groupby(['personId', 'contentId'])[
'eventStrength'].sum().apply(smooth_user_preference).reset_index()
users_items_pivot_matrix_df = interactions_full_df.pivot(index='personId', # edited: interactions_train_df
columns='contentId',
values='eventStrength').fillna(0)
users_items_pivot_matrix = users_items_pivot_matrix_df.as_matrix()
users_ids = list(users_items_pivot_matrix_df.index)
在USER_COLLECTION
中,我有 30009 个文档和 4 列:_id, personId(string), eventStrength(double), contentId(int32)
,我尝试设置增加 ram 但它不起作用,仍然无法弄清楚。
更新:在windows上通过最大内存80000 MB和初始大小5500 MB设置自定义虚拟内存后,重新启动系统,它仍然有内存错误。
解决方案
推荐阅读
- arrays - 如何在ruby中合并地图列表中的值
- java - 整数引用传递给方法但不改变
- python - 如何使用 startfile 和相对路径在程序中启动另一个文件?
- postgresql - 如何使用 sqlalchemy 在 JSON 列上放置 ForeignKey 约束?
- java - 用于“单读”REST API 的适当 HTTP 方法
- python - AWS Lambda 中退出与返回的使用
- excel - 功能:如何使用偏移量从过滤的单元格创建范围
- javascript - 我想以特定的时间间隔将每个列表项插入 div
- python - 我正在尝试在列表中创建一个列表
- kubernetes - 如何为预签名 URL 设置 minio 域?