r - 具有不同大小组的 tSNE - 减少数据集或设置困惑 = 最大组?
问题描述
用 tSNE 绘制蛋白质组数据集我遇到的问题是我有一个很大的健康组 (70),每个基因型组 (3-8) 的样本很少。在这种情况下我应该如何设置困惑?还是将健康病例与患病病例分开会更好(它们在 PCA 和欧几里得分布中被清楚地分开)?
非常感谢!塞巴斯蒂安
支线任务:您会使用批量校正的数据还是未校正的数据进行可视化?对于 PCA,校正后的看起来好多了,但我想知道在 tSNE 中使用它是否会过拟合?
解决方案
推荐阅读
- angular7 - Cumulocity 服务器中的 CSS 样式问题
- mysql - 如何使用变量表修复“子查询返回超过 1 行”
- git - 克隆后 Git 签出到标签给出错误
- android - 应用程序在后台时不调用 FCM 的 onMesasageReceived?
- sql-server - SQL 存储过程的 select 语句中标量函数的备用选项
- reactjs - 如何在 reactjs 的其他应用程序中创建可重用组件?
- dart - Flutter中如何存储大数据?
- javascript - 如何在javascript的循环中调用与ajax相关的函数?
- javascript - 如何做这个语句的计算
- javascript - 为什么从 JS 代码调用 innerHTML 不起作用?