首页 > 解决方案 > 我将如何在具有字母列表的数据集中查找特定的字母序列?

问题描述

如果这是一个简单的问题,我对 R 很陌生,很抱歉。我基本上有一个包含字母列表的数据集。我将如何查找是否存在诸如“agtggt”之类的特定字母序列,如果存在,它们中有多少存在?

我试图用 ifelse 函数做一些事情:

ifelse("a" %in% chain,"yes","no" )

我的方法是基本上告诉 R 找到“a”,如果找到,找到“g”,如果找到,找到“t”,等等。这种方法是否正确?

标签: r

解决方案


也许你可以试试grepl

c("no","yes")[1+grepl("agtggt",chain)]

如果你想知道有多少"agtggt"存在chain,你可以试试

length(regmatches(chain,gregexpr("agtggt",chain))[[1]])

推荐阅读