首页 > 解决方案 > 如何知道 .ped 文件中每个 SNP 的不同类型的等位基因

问题描述

我有一个 .ped 文件,其中每个 SNP 的每一列都有不同的等位基因。

弗洛里 JG05001 0 0 0 -9 TCAATCCTTTCTGGAAGGCCC CGGGGA

弗洛里 JG05002 0 0 0 -9 CCAACCTTTTCTGGGAGATCA CGGGGA

弗洛里 JG05002 0 0 0 -9 CCAACCTCTTCTGGGAGATCA CGGGGA

弗洛里 JG05002 0 0 0 -9 CCAACCTCTTCTGGGAGATCA CGGGGT

我想知道每一列不同类型的等位基因的可能性,即对于第 7 列,我将只有 T 和 C 可能性。

谢谢

标签: r

解决方案


假设文件被加载到名为 data.framedf中,您可以简单地sapply unique

sapply(df, unique)

这将为您提供一个列表,其中每个元素都是该列中出现的所有等位基因的向量。


推荐阅读