r - 是否有用于查找变量之间共享特征的 R 函数?
问题描述
我有一组植物和植物性状的数据集。这是一个包含 150 多种植物和 300 多种不同性状的大型数据集。但是,我没有所有 150 种植物的所有 300 种性状的数据。有些植物有 100 个性状的数据,而其他植物只有 2 或 3 个性状的数据。
我已经弄清楚如何分离出哪些植物具有最多的性状数据,但我不知道如何分离出这些植物具有哪些共同性状
例如。我有 10 株植物,编号为 1-10,这 10 株植物中的每一种都有 75 个性状的数据,性状编号从 1-3000 不等。因此,每种植物都有 75 种不同的性状,但有一些重叠。我想找出哪些特征重叠。我想分析他们共享/共有的所有特征,因此我需要隔离共享特征。
有没有一种简单的方法可以在 R 中做到这一点?似乎应该有一个相对简单的方法,但我不太明白。
我的数据集看起来像这样,只是更大。
在此示例中,我想突出显示特征 #1 和 #4,因为这两个特征具有所有三种植物的数据。
我希望这一切都有意义。提前感谢大家的帮助!
解决方案
推荐阅读
- node.js - 是否可以在 express 应用程序中运行节点工作程序
- python - 如何忽略特定索引?Python
- python - 如何解决此正则表达式问题以匹配可选列和空格?
- python - 带有 TypeError 的自动测试暂停:“str”对象不可调用
- python - Celery - 将任务名称分配给组中的任务
- linux - 如何使用 SFTP 在一行中传递 UserName@HostId、密码、端口号?
- typescript - 在 Angular 12 中使用友好的 URL 而不是 ID 呈现链接
- xcode - 在 Mach-O 文件 Payload/Runner.app/PlugIns/OneSignalNotificationServiceExtension 中找不到合适的架构来链接 arm64
- excel - 在保留代码的同时将 ComboBox 移动/复制到不同的工作表
- laravel - 无法在子域租户中显示端口