r - 如何知道 .ped 文件中每个 SNP 的不同类型的等位基因
问题描述
我有一个 .ped 文件,其中每个 SNP 的每一列都有不同的等位基因。
弗洛里 JG05001 0 0 0 -9 TCAATCCTTTCTGGAAGGCCC CGGGGA
弗洛里 JG05002 0 0 0 -9 CCAACCTTTTCTGGGAGATCA CGGGGA
弗洛里 JG05002 0 0 0 -9 CCAACCTCTTCTGGGAGATCA CGGGGA
弗洛里 JG05002 0 0 0 -9 CCAACCTCTTCTGGGAGATCA CGGGGT
我想知道每一列不同类型的等位基因的可能性,即对于第 7 列,我将只有 T 和 C 可能性。
谢谢
解决方案
假设文件被加载到名为 data.framedf
中,您可以简单地sapply
unique
:
sapply(df, unique)
这将为您提供一个列表,其中每个元素都是该列中出现的所有等位基因的向量。
推荐阅读
- vb.net - 如何从 VB.net 2017 调用 powershell 脚本传递变量?
- asp.net-core - 为什么我的会话值有时会在 .net core mvc 应用程序中丢失?
- java - FeignException 状态为 0?
- python - 文本二进制分类训练期间的波动损失
- yii2 - Yii2 AdminLTE 安装报错 InvalidRepositoryException
- php - 如何将我的颤振应用程序连接到 remotemsql.com 数据库
- r - 在 R 中,如何创建一个函数,其中向量中的所有数字都重新缩放,Inf 变为 1,-Inf 变为 0?
- c# - 在 Linq orderBy 中使用外部方法
- r - 使用 dplyr 根据列值范围选择列
- json - Azure DevOps Rest API 不保留 System.AreaPath 和 System.IterationPath