r - R中的聚类变量和内存使用
问题描述
我正在尝试使用集群库计算 R 中某些变量的集群。代码如下:
d2 <- dist(ant, method = "euclidian")
问题是显示此消息:
Error: cannot allocate vector of size 123.5 Gb
不可能有这么大的内存。我的数据框有超过 180000 行和 12 列。有什么建议吗?
解决方案
选择一种不需要成对距离矩阵的方法,这总是需要 O(n²) 内存......这样的算法存在多种。
首先简化您的数据。例如,将重复项合并为权重,并使用支持加权点的算法/实现。
子样本。如果你有这么多点,你可能不需要全部。而是使用子样本。
推荐阅读
- amazon-web-services - awscli - lambda 函数更新触发器
- angular - 如何在 ngModel 中禁用更改值
- symfony - 如何在不点击 Sylius 的“Ú更新购物车”的情况下更新数量的小计价格
- vba - 使用用户表单将工作表导出为单独的文件并浏览文件路径
- java - 尝试使用 python 3 运行 Spark 时出现几个错误
- ios - 在 WKWebView 中屏蔽广告
- java - Powerbuilder --- 调用返回对象列表的 Java EJB (CMIS) 方法时出错
- javascript - React中的Google Maps MeasureTool - 缩放后测量线消失
- java - (JAVA)为什么我没有结果?主课有问题?我找不到
- c# - 在特定对象上引发 PropertyChanged 事件