nlp - 聚类指标:如何为我的聚类方法获得分数
问题描述
我正在研究文本数据(句子)的聚类方法。实现了一种无监督的聚类方法。当我通过输出时,这是有道理的。我浏览了文献,看看哪些指标可以告诉我们“集群有多好”,但我感到困惑。这将帮助我将我的方法与其他方法进行比较,并可能调整我的方法以更好地执行。我想从研究人员那里知道是否有最适合您的方法:
- 给出集群同质性的分数
- 给出最佳集群间距离的分数。
- 给出集群的重要性
- 给出一个关于“最佳聚类数”的数字
注意:我在基于 Bert 的方法之上使用 DBSCAN。
解决方案
推荐阅读
- node.js - 无法对本地 MongoDB 数据库进行身份验证
- python - 如何告诉 python 脚本在 python 脚本中执行特定的 python 版本
- java - 使用 Recyclerview“ItemClickListener”单击特定项目时显示特定数组
- android - 更改工具栏布局android
- reactjs - 在 reducer 中更新状态后如何重新渲染 UI?
- java - 如何使用触发器的作业数据将不同的输入传递给 Quartz 作业
- javascript - 使用 setTimeout 重新订阅 websocket 频道
- python - 使用另一个数据框填充一个熊猫数据框的最有效方法是什么?
- python - 在函数内部定义全局时出现 UnboundLocalError
- oracle - 对 Key 列进行分组并获取具有一个有效值和零值的记录