首页 > 解决方案 > 具有不同大小组的 tSNE - 减少数据集或设置困惑 = 最大组?

问题描述

用 tSNE 绘制蛋白质组数据集我遇到的问题是我有一个很大的健康组 (70),每个基因型组 (3-8) 的样本很少。在这种情况下我应该如何设置困惑?还是将健康病例与患病病例分开会更好(它们在 PCA 和欧几里得分布中被清楚地分开)?

非常感谢!塞巴斯蒂安

支线任务:您会使用批量校正的数据还是未校正的数据进行可视化?对于 PCA,校正后的看起来好多了,但我想知道在 tSNE 中使用它是否会过拟合?

标签: rdimension

解决方案


推荐阅读