首页 > 解决方案 > sklearn.dbscan 或 sklearn.kmeans 可以用于超过 2 维吗?

问题描述

在我最近的项目中,有人尝试使用 sklearn.dbscan 对多维数据集进行聚类。但我对这种方法非常怀疑。

我们怎么知道 eps 和 min_samples?我的意思是你无法观察到集群的大小,因为数据集是在一个多维空间中。

正如我所见,这些方法已经在 wiki 页面中: https ://en.wikipedia.org/wiki/Clustering_high-dimensional_data

这些方法是我正在寻找的对吗?

我不确定我是否正确解决了这个问题。感谢您的建议!

标签: machine-learningscikit-learncluster-analysisdata-mining

解决方案


这取决于我们谈论的维度。我会说如果它小于〜10,你可以尝试直接使用DBSCAN。否则,某种降维可能会给您带来更好的结果。

无论如何,具体方法将取决于具体问题。


推荐阅读