首页 > 解决方案 > 我在使用 KPrototyping 聚类算法聚类分类和数值数据时遇到错误

问题描述

因此,我使用 KProtoypes 聚类算法对包括分类列和数值列的混合变量进行聚类。我收到一个错误:

在“str”和“int”的实例之间不支持“>”

而且所有功能都具有一致的数据类型。我分享了一个我用来运行的代码片段以及数据的屏幕截图。我只是想对这种类型的数据进行聚类,任何关于聚类的建议都会被接受。

另外,我的数据如下: 数据的excel视图

有关数据的信息如下:数据信息

这是我为 k_prototype 算法编写的代码:

kp = KPrototypes(n_clusters=3, init='random', verbose=True)
kp.fit(X_dummy,categorical=[7,8,9,10,11,12,13])

另外,请检查我在 kp.fit 中传递的分类列表

标签: pythoncluster-analysisnumericcategorical-data

解决方案


此消息表明,您尝试将字符串对象(str)与整数进行比较(int)。您需要在应用算法之前清理数据。垃圾进就是垃圾出。


推荐阅读