r - 给定其中一个成员的名称,获取在 heatmaply 的 stage1(仅包含两个成员)创建的集群的第二个成员的名称和值
问题描述
我有一个数据框 S=[rows x cols] 包含样本 s,这样行名告诉样本的名称,列名告诉各个样本的特征。在这个数据框中,我插入了一个测试样本 t1。现在我想提取与 t1 相似或孪生的特定样本“s”的名称和值。为此,我使用了 heatmaply() 来绘制层次聚类。观察这个图,我可以看到在第 1 阶段(迭代层次聚类过程)创建的集群只包含两个成员,一个是我的测试样本 t1,另一个成员是它的几乎双胞胎或几乎相似的样本。现在我只想从第 1 阶段制作的集群中提取与我的测试样本 t1 相似的孪生或样本 s,仅此而已。请在这方面指导我。
我对 hclust 和 dist 函数略知一二。dist 的问题在于它提供了太多信息,我想不出如何从 dist 矩阵中提取我的测试样本 t1 的孪生。我对 cutree() 有一点了解。据我所知,我认为它可以给出成员所属的集群,具体取决于参数 k 的值。因此,当 k 的值发生变化时,集群的成员也会发生变化。我想知道我是否可以利用 cutree 来获得第一阶段的集群(包含两个成员)并找到与我的测试样本 t1 相似的成员。hclust 对象的值让我特别感兴趣。例如合并和排序。也许有人可以指导我更多关于它的信息,我可以用它们来获得双胞胎
我很抱歉这篇长文。我试图以简洁的方式尽可能清楚地解释,并想表明我已经尝试了我的知识,但非常感谢您的经验来解决这个问题。
解决方案
推荐阅读
- python - 调用类内部的方法将对象保存在字典中
- node.js - nodemailer 错误,获取:无效登录:451 4.7.0 临时服务器错误。请稍后再试。(研究过,stackoverflow上的资源有限)
- remote-desktop - Microsoft 的远程桌面连接 (mstsc.exe) 在哪里缓存 OCSP 响应?
- php - 如何在 WordPress Shortcode 中为 UTF-8 Url 编码转换重音字母
- python - 在 jupyer notebook 中改变 pandas df 的外观
- r - R中的foreach循环为我的数组输出返回NA值
- c++ - 自定义对象的Qt排队连接导致运行时错误
- azure-data-factory - 从 SAP BW Open Hub 将数据导入 Azure 数据湖时,如何在数据工厂中使用文件名前缀?
- iis - 可以为 iis 站点定义 connectionStrings 的所有位置是什么?
- office365 - 在 VDI 上使用 Microsoft 365、Windows 10 部署 Outlook Redemption