r - R内存分配与数据表一起使用
问题描述
我正在尝试使用数据表包将大型 csv 数据集(69GB)加载到 R 中。我很难rbindlist()
将数据表对象列表合并到一个数据表中。我正在使用的机器有 64GB RAM,但我遇到了溢出问题,因为数据表对象的列表datlist
大约是 32GB。有没有更有效的方法来管理这个?示例代码:
# read all csvs in a folder, create datatable
library(data.table)
datlist <- lapply(list.files("folderPath",pattern="*.csv$",recursive=TRUE,full.names=TRUE),fread)
data <- rbindlist(datlist, fill=TRUE)
解决方案
推荐阅读
- vba - VBA Selenium 从下拉菜单中选择一个值
- excel - Excel 工作簿打开时如何自动显示 VBA 用户窗体?
- python - 尝试使用 groupby() 函数但不断收到“TypeError:列表索引必须是整数或切片,而不是 str”
- asp.net-mvc - 如何将值从 Javascript 发送到 ActionResult?
- python - 如何防止 Python 请求在运行后中止
- python - 按下提交按钮时,UNIQUE 约束失败。(姜戈)
- php - 如何从 Laravel 7 中包含多个图像的帖子中删除单个图像
- python - 有没有办法在熊猫中对字典进行分组
- ember.js - 即使存在于数据存储中,相关对象也不会显示
- python - 根据数据更改 numpy 数组大小