首页 > 解决方案 > 在 R 中聚类分类值

问题描述

我需要对混合数据进行聚类(2 列:1 - 数字和 2 - 字符串)。R 或 python 中是否有一个包可以处理混合数据或分类数据的聚类?

谢谢!

标签: pythonrcluster-analysis

解决方案


使用 RI 建议使用包中的daisy功能cluster

您可以有一种matrix混合数据类型,名义-序数-数字。

如果数据是混合的,它会计算gower每个变量的距离,基本上每个标称值都转换为数字,并且通过每个变量的贡献的加权平均值来测量差异。

即使所有变量都是数字的,也可以使用它,在这种情况下,它将使用标准度量。

有关更多信息和示例,请参阅帮助页面

这里介绍一下高尔距离。


推荐阅读