首页 > 解决方案 > 是否有用于查找变量之间共享特征的 R 函数?

问题描述

我有一组植物和植物性状的数据集。这是一个包含 150 多种植物和 300 多种不同性状的大型数据集。但是,我没有所有 150 种植物的所有 300 种性状的数据。有些植物有 100 个性状的数据,而其他植物只有 2 或 3 个性状的数据。

我已经弄清楚如何分离出哪些植物具有最多的性状数据,但我不知道如何分离出这些植物具有哪些共同性状

例如。我有 10 株植物,编号为 1-10,这 10 株植物中的每一种都有 75 个性状的数据,性状编号从 1-3000 不等。因此,每种植物都有 75 种不同的性状,但有一些重叠。我想找出哪些特征重叠。我想分析他们共享/共有的所有特征,因此我需要隔离共享特征。

有没有一种简单的方法可以在 R 中做到这一点?似乎应该有一个相对简单的方法,但我不太明白。

我的数据集看起来像这样,只是更大。

样本数据表

在此示例中,我想突出显示特征 #1 和 #4,因为这两个特征具有所有三种植物的数据。

我希望这一切都有意义。提前感谢大家的帮助!

标签: r

解决方案


推荐阅读