r - 使用相异矩阵和数据矩阵作为R中聚类输入的区别?
问题描述
我只是在使用聚类时为输入数据结构而苦苦挣扎。
假设我有这样的数据框并且所有变量都是连续变量,那么我想在上面实现 k-means/k-medoids。
df <- data.frame(age = c("20", "50", "35", "45"),
height = c("160", "178", "152", "169"),
weight = c("50", "80", "65", "57"))
在我看来,有两种方法可以实现集群,但我不确定哪一种性能更好,或者它们只是等效的?
- 缩放df并直接进行k-means。
- 首先计算相异矩阵,然后进行k-means。
我知道如果我的数据包含分类变量,我可以利用 Gower 距离首先计算相异矩阵并进行聚类,但我不确定当我的数据不包含任何分类变量时这是一种更好的聚类方法?
解决方案
推荐阅读
- html - 元视口宽度在html文件中不起作用
- python - NLTK 不会对大写单词进行词形还原
- git - 将数据表和/或文档放在 Git 存储库中是标准/良好做法吗?
- python - 使用 Python urllib 获得安全连接的最佳方法
- javascript - 检查字符串中的字符是否为整数,如果是则获取该整数
- windows - 为什么我不能在 IRP 调度函数中使用带有无限超时的 KeWaitForSingleObject?
- javascript - 未捕获的类型错误:无法读取未定义的属性“状态”
- c++ - 如何将数字转换为 8 位二进制而不是 4 位
- mesibo - 从 Messenger 应用程序创建的联系人添加联系人弹出窗口未出现在 Mesibo 控制台中
- python - Python:表面颜色是 RGB 颜色,但颜色条不是