r - 如何在大数据上运行层次聚类 hclust?
问题描述
我想在“大”维度矩阵上运行层次聚类,69878 x 10
但无法做到,因为hclust
在 R 中运行需要首先计算成对距离,这样做会在这些维度上崩溃:
> str(x)
num [1:69878, 1:10] 0 0 0 0 0 0 0 9 1 0 ...
- attr(*, "dimnames")=List of 2
..$ : NULL
..$ : chr [1:10] "0.5" "1" "1.5" "2" ...
> d <- dist(x)
Error: cannot allocate vector of size 18.2 Gb
有没有办法绕过这个限制?
解决方案
推荐阅读
- azure - 无法使用 terraform/programmatic 将 Azure 密钥保管库与数据块集成
- amazon-web-services - Cloudformation 和 Codestar-Connections 问题
- graphql - 如何使用反应测试库模拟删除测试中的项目?
- java - 使对象的字段对于存储在数组列表中的每个对象都是唯一的
- microsoft-graph-api - MS Teams 个人选项卡不支持经典 SharePoint 页面?
- ruby - 为什么`which -a ruby`显示错误的路径?
- angular - 角度动态分配模板
- javascript - 开玩笑:toHaveBeenCalled 返回 0 而不是 1
- intellij-plugin - 如何从 github 存储库安装用于 intellij 的 Kotest 插件?
- java - NullPointerException 尽管检查对象不为空?