numpy - 在执行聚类或不使用任何聚类算法之前在数据集中查找质心
问题描述
在机器学习领域对一个无监督问题进行聚类,我将有一个系统,其中输入是一个未标记的数据集,其中聚类的数量基本上是未知的。
我当然可以通过应用聚类算法(例如层次聚类或 DBSCAN 或 k-means 等)通过猜测聚类的数量来找出数据集中可用的质心。
如何在不执行或使用任何聚类算法的情况下找出质心?
注意:我将使用这些质心作为公共点来计算两个不同数据集的欧几里得距离。到目前为止,centroid 给出了 N 个不同数据集的数据点的更准确的预测欧几里德距离,其中这些点不共享以计算距离,而是与公共点成对的距离。
此外,关于使用任何其他统计度量可以找到可能比使用质心作为公共点更好的公共点的任何建议?
如果有人可以回答或指导我解决问题,我将不胜感激。提前致谢!
解决方案
推荐阅读
- python - 如何在初始化之外的方法中添加类继承?
- python - pandas DataFrame 样式,如 Excel 分级色标条件格式
- python - 如何打开窗口最大化的应用程序?
- angular-material2 - Material Datepicker 更改月份视图事件
- webpack-4 - 将 webpack 分离的 css 文件注入 html 头部
- java - Java 8 谓词 OR 和 removeIf 奇怪的行为
- sql-server - mssql - 将 INT 值转换为日期时间
- python - 无法从 django 管理员更改视图打开弹出窗口
- jquery - 具有拖放和排序类别的网格
- python - 从 Pandas 中的 json 列中提取的值创建数据框