首页 > 解决方案 > 如何知道每个簇标签对应于哪个矩阵行?

问题描述

在进行聚类之后,我最终得到了一个存储所有聚类标签的对象,如下所示:

clusterer.labels_

以上通常是列表或数组。然后我总是将标签分配给原始的熊猫数据框(数据集),如下所示:

df['cluster_lables] = cluster.labels_

最后我假设每个元素cluster.labels_对应于我原始数据集的每一行,这个假设是否正确?例如,从上面的列创建中,我最终得到如下内容:

ColA ColB cluster_labels
1    3       -1
2    4         2
...
89  90        45

标签: pythonpandasscikit-learnhdbscan

解决方案


大体上是的,你是对的。我之前使用的聚类类型是 KMeans 聚类(可以在这里找到https://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html),但我不能保证它们都是那样工作。将新列附加到数据框中将按您的想法工作。


推荐阅读