首页 > 解决方案 > 聚类指标:如何为我的聚类方法获得分数

问题描述

我正在研究文本数据(句子)的聚类方法。实现了一种无监督的聚类方法。当我通过输出时,这是有道理的。我浏览了文献,看看哪些指标可以告诉我们“集群有多好”,但我感到困惑。这将帮助我将我的方法与其他方法进行比较,并可能调整我的方法以更好地执行。我想从研究人员那里知道是否有最适合您的方法:

  1. 给出集群同质性的分数
  2. 给出最佳集群间距离的分数。
  3. 给出集群的重要性
  4. 给出一个关于“最佳聚类数”的数字

注意:我在基于 Bert 的方法之上使用 DBSCAN。

标签: nlpcluster-analysisbert-language-model

解决方案


推荐阅读