machine-learning - sklearn.dbscan 或 sklearn.kmeans 可以用于超过 2 维吗?
问题描述
在我最近的项目中,有人尝试使用 sklearn.dbscan 对多维数据集进行聚类。但我对这种方法非常怀疑。
我们怎么知道 eps 和 min_samples?我的意思是你无法观察到集群的大小,因为数据集是在一个多维空间中。
正如我所见,这些方法已经在 wiki 页面中: https ://en.wikipedia.org/wiki/Clustering_high-dimensional_data
这些方法是我正在寻找的对吗?
我不确定我是否正确解决了这个问题。感谢您的建议!
解决方案
这取决于我们谈论的维度。我会说如果它小于〜10,你可以尝试直接使用DBSCAN。否则,某种降维可能会给您带来更好的结果。
无论如何,具体方法将取决于具体问题。
推荐阅读
- javascript - 你如何在javascripts中设计(大)短路分配?
- r - 为什么使用并行处理的克里金法仍然使用内存而不使用我的处理器?
- ios - Swift -'init(cgImage:options:alphaType:)' 已弃用:替换为 MTIImage(cgImage:options:isOpaque:)
- azure-ad-b2c - 忘记密码重定向 - 需要转到 B2C 登录页面而不是 CRM 门户
- javascript - 反应:在承诺解决后更新组件数据/道具
- android - 如何使用图形视图的第二个比例在android中进行绘图
- oracle - 我的带光标的购物车程序抛出错误
- excel - 如何使按钮在另一个用户窗体中显示对象?
- python - 在 Python Zelle 图形中创建 Rectangle 的子类
- linux - 在汇编中拆分字符串