machine-learning - 如何进行 ANOVA 测试以比较不同聚类算法的性能
问题描述
我正在尝试比较应用于同一数据集的不同聚类算法结果(k-means++ 和层次凝聚聚类)的性能。我总共有 4 个不同的结果(其中 2 个有 KPCA 预处理,其中 2 个没有),这就是为什么我选择 ANOVA 来得出哪个结果最好的原因。
但是,我不知道要进行 ANOVA 测试的输入是什么。谁能建议我应该从算法结果中获取哪些数据来提供输入?(我正在使用 Python 语言和 sci-kit 学习)
解决方案
在这里使用 ANOVA 可能是个坏主意。
由于 k-means 试图最小化集群方差,这将污染基于方差的分析。
https://stats.stackexchange.com/questions/116294/properness-of-anova-after-k-means-cluster-analysis
推荐阅读
- python - Python - 试图将字典插入 postgres 数据库,看到 keyerror
- c# - .NET Core 构建失败,在 MSBuild 文件夹中找不到 csc.dll 文件
- npm - “npm ci”抛出异常:无法读取未定义的属性“长度”
- microsoft-dynamics - Visual Studio 中的信息日志
- python - 多维直方图中 1 个元素的 bin 边缘
- excel - 在 Excel 文件中运行的脚本,我希望它在 Google 表格中运行
- c# - Firebase 保持同步
- tkinter - 如何使用 tkinter 框架格式化小部件
- python - 抓取谷歌搜索结果页面数据python
- python - 使用 AIY 语音套件和 Raspberry Pi 运行“assistant_library_demo.py”时出现分段错误