首页 > 解决方案 > 使用 R 重塑数据(也许很容易,也许不简单)

问题描述

我需要生成一个表格,其中包含一种且只有特定格式的变量,因为它将用作另一个程序的输入。为此,我试图重塑我的数据(当然使用 R),看起来像这样:

# A tibble: 185,754 x 4
   rowid `SMPDB ID` `HMDB ID`   `TRUE`
   <int> <chr>      <chr>       <lgl> 
 1     1 SMP00004   HMDB0006454 TRUE  
 2     2 SMP00004   HMDB0001451 TRUE  
 3     3 SMP00004   HMDB0000005 TRUE  
 4     4 SMP00005   HMDB0000142 TRUE  
 5     5 SMP00006   HMDB0000060 TRUE  
 6     6 SMP00008   HMDB0000060 TRUE  
 7     7 SMP00009   HMDB0001451 TRUE  
 8     8 SMP00011   HMDB0004249 TRUE  
 9     9 SMP00011   HMDB0003850 TRUE  
10    10 SMP00011   HMDB0006953 TRUE  
# ... with 185,744 more rows

SMPDB ID每个都有不同的HMDB ID,我需要类似的东西:

SMPDB ID    HMDB IDs
HMDB0006454 SMP00004, SMP00027, SMP00060, ...
HMDB0001451 SMP00004, SMP00008, SMP00090, ...
...

只有两列,第一列是 ,SMPDB ID另一列是所有的HMDB ID

你认为有可能像这样重塑它吗?

也许从spread?

如果您想尝试一下,这里是起始表!

先感谢您!

标签: rreshapetidyverse

解决方案


推荐阅读