r - 如何在 R 中使用 grep 函数根据样本名称查找相关性
问题描述
我有两个包含基因信息的数据框。这两个数据框具有相同的尺寸(20,000 行 x 50 列)。我有另一个名为 info 的文件包含这些数据帧之间匹配的主题名称。我想从文件(信息)中查找名称以查找匹配主题之间的相关系数。以下是这些文件的示例:
df1
gene_name loc1 loc2 ......... loc50
gene1 1 23 25
gene2 24 15 67
df2
gene_name loc1 loc2 ......... loc50
gene1 21 31 55
gene2 2 65 89
info file
subject loc_in_df1 loc_in_df2
1 loc1 loc2
2 loc3 loc46
解决方案
尝试如下
首先从信息文件df
中提取df1
并df2
根据信息文件建立一个
df <- cbind(df1[, info$loc_in_df1],df2[, info$loc_in_df2])
和
cor = apply(df, MARGIN = 1, FUN = function(x) return(cor.test(x[1:50], x[51:100])$estimate))
1:50 和 51:100 假设您的信息文件中有 50 个配对,但这只是猜测,因为您没有提供可重复的样本