首页 > 解决方案 > 如何在 R 中使用 grep 函数根据样本名称查找相关性

问题描述

我有两个包含基因信息的数据框。这两个数据框具有相同的尺寸(20,000 行 x 50 列)。我有另一个名为 info 的文件包含这些数据帧之间匹配的主题名称。我想从文件(信息)中查找名称以查找匹配主题之间的相关系数。以下是这些文件的示例:

df1
gene_name    loc1  loc2 .........  loc50
gene1        1        23              25
gene2        24       15              67

df2
gene_name    loc1  loc2 .........  loc50
gene1        21       31              55
gene2        2       65              89

info file
subject     loc_in_df1   loc_in_df2
1                loc1          loc2
2                loc3          loc46   

标签: r

解决方案


尝试如下

首先从信息文件df中提取df1df2根据信息文件建立一个

df <- cbind(df1[, info$loc_in_df1],df2[, info$loc_in_df2]) 

cor = apply(df, MARGIN = 1, FUN = function(x) return(cor.test(x[1:50], x[51:100])$estimate))

1:50 和 51:100 假设您的信息文件中有 50 个配对,但这只是猜测,因为您没有提供可重复的样本


推荐阅读