python - 在表示从一个项目到另一个项目的相对距离的数据集上使用 K 均值聚类意味着什么?
问题描述
在表示从一个项目到另一个项目的相对距离的数据集上使用 K 均值聚类意味着什么?例如,每个项目都被赋予了与其他项目的相对距离。
解决方案
K-means 聚类将项目分配给集群,以使总的集群内距离最小化。因此,唯一需要的输入是距离函数d(a,b)
。通常,这些项目是范数向量空间中的向量,并且d
被选择d(a,b) = ||a-b||
为一些范数||x||
。但一般来说,任何满足d(a,a) = 0
(点到自身的距离为零)、d(a,b) <= d(a,c) + d(c,b)
(三角不等式)和d(a,b) = d(b,a)
(对称性)的距离函数都可以使用。它甚至可以是一个矩阵,其中条目M(i,j)
给出项目之间的距离i
和j
,只要条目遵守上述规则。
推荐阅读
- angular - 站点的 JavaScript 无法正常工作,它使用自定义标头加载到 Angular iFrame 中
- node.js - Axios GET 请求出错,但我在浏览器中看到响应
- javascript - 创建动态号码回调函数
- python - 使用 pd.to_numeric 将数字“01898”转换为 1898 无效
- javascript - 如何将数据提交到另一个网站以检索数据
- react-native - RNFetchBlob.fs.writeFile 如何在完成时获得通知(NOT ALERT MESSAGE)
- javafx - 边框窗格问题
- python - 熊猫划分两个不同大小的数据框
- java - 如何在java中将文件从远程服务器上传到s3?
- c# - Unable to run web api (gateway) project - This localhost page can’t be found. No webpage was found for the web address: