首页 > 解决方案 > 在执行聚类或不使用任何聚类算法之前在数据集中查找质心

问题描述

在机器学习领域对一个无监督问题进行聚类,我将有一个系统,其中输入是一个未标记的数据集,其中聚类的数量基本上是未知的。

我当然可以通过应用聚类算法(例如层次聚类或 DBSCAN 或 k-means 等)通过猜测聚类的数量来找出数据集中可用的质心。

如何在不执行或使用任何聚类算法的情况下找出质心?

注意:我将使用这些质心作为公共点来计算两个不同数据集的欧几里得距离。到目前为止,centroid 给出了 N 个不同数据集的数据点的更准确的预测欧几里德距离,其中这些点不共享以计算距离,而是与公共点成对的距离。

此外,关于使用任何其他统计度量可以找到可能比使用质心作为公共点更好的公共点的任何建议?

如果有人可以回答或指导我解决问题,我将不胜感激。提前致谢!

标签: numpycluster-analysisk-meansunsupervised-learningcentroid

解决方案


推荐阅读