首页 > 解决方案 > Canopy Clustering 中是否真的需要参数 T1?

问题描述

由于一个点落入 range(t2, t1) 将不会被删除。我们删除一个点的唯一两个原因是: 1. 用这个点构建一个新的树冠。2. 该点落入另一个树冠的范围(0, t2)。

为什么我们需要参数 t1?

标签: machine-learningcluster-analysismahout

解决方案


檐篷不是集群。

它们是数据集的近似值,以便之后更快地处理。为此,您希望檐篷重叠

你所想的要老得多。它被称为领导者聚类。但是这个质量太低了,它从来没有流行过。


推荐阅读