r - 如何获得仅在一种组织中表达的基因数量
问题描述
我想计算基因(行)的数量:
- 仅在一个组织(列)中表达(值 >0)
- 仅在两个组织(列)中表达(值 >0)
- 仅在 3 个组织(列)中表达(值 >0)
- 在超过 3 个组织(> 列)中表达(值 >0)
我有一张来自 RNA-Seq 数据的表格,我必须得到一个类似的表格:
number_of_tissue nbr_expressed_genes
1 个组织 -> 3000
- 2 个组织 -> 500
- 3 个组织 -> 700
- 超过 3 -> 2500
有没有 R 或 python 的方法可以做到这一点?
先感谢您
解决方案
我相信以下会做你想要的。
首先是复制粘贴形式的数据集。
Tissue1 <- c(0, 0, 1, 45)
Tissue2 <- c(0, 2, 4, 4)
Tissue3 <- c(0, 0, 5, 4)
Tissue4 <- c(1, 4, 90, 0)
rnaseq <- data.frame(Tissue1, Tissue2, Tissue3, Tissue4)
row.names(rnaseq) <- paste0("Gene", 1:4)
现在是代码。
我首先计算每行有多少值Tissue*
大于零。然后这些数字的频率与table
。然后只需将此结果转换为data.frame
.
res <- table(apply(rnaseq > 0, 1, sum))
res <- data.frame(number_of_tissue = paste(names(res), "tissues"),
nbr_expressed_genes = as.numeric(res))
row.names(res) <- NULL
res
# number_of_tissue nbr_expressed_genes
#1 1 tissues 1
#2 2 tissues 1
#3 3 tissues 1
#4 4 tissues 1
推荐阅读
- php - 如何在 laravel eloquent 中加入三个表
- excel - 将嵌入图像更改为链接
- javascript - 如何在 tinymce 4.9.2 上添加自定义插件?
- c# - Dynamics CRM:LINQ 中的复合键连接问题
- reactjs - 将material-ui版本从v4迁移到v5,发现情感问题
- python - 同时安装 Tensorflow 2.4 和 opencv?
- azure - 无法理解 Azure 的角色 JSON
- python - 变形金刚:获取 KeyError:model.fit 上的“sentence_embedding”
- php - WooCommerce 自定义产品类型选项不隐藏自定义产品选项卡
- android - 如何创建一个可以从 ViewModel 和 Activity 访问的函数?