首页 > 解决方案 > 在表示从一个项目到另一个项目的相对距离的数据集上使用 K 均值聚类意味着什么?

问题描述

在表示从一个项目到另一个项目的相对距离的数据集上使用 K 均值聚类意味着什么?例如,每个项目都被赋予了与其他项目的相对距离。

标签: python

解决方案


K-means 聚类将项目分配给集群,以使总的集群内距离最小化。因此,唯一需要的输入是距离函数d(a,b)。通常,这些项目是范数向量空间中的向量,并且d被选择d(a,b) = ||a-b||为一些范数||x||。但一般来说,任何满足d(a,a) = 0(点到自身的距离为零)、d(a,b) <= d(a,c) + d(c,b)(三角不等式)和d(a,b) = d(b,a)(对称性)的距离函数都可以使用。它甚至可以是一个矩阵,其中条目M(i,j)给出项目之间的距离ij,只要条目遵守上述规则。


推荐阅读