nsregularexpression - 正则表达式 - 通过特定模板查找字母
问题描述
我需要写一段关于 DNA 的代码。
我需要在一串多字母之间找到需要与模板匹配的 6 个字母的序列。
例如:在索引 0 中它可以是字母 A 或 T,即它,只有那些字母。我用什么来做到这一点?正则表达式中的哪种类型的函数?
the_str = "AAATAAAATAAATAATAAAGAGCCAGAGGCCCTTGAAGAATGGATGGAAT\
TTGGACTTTAGCGGGGCTGGGGGACCCCGGAAATGGACGAGAAGCAGAAC\
CGAGGCCCTTTAGGGCTCAGCGGAGGCCTGCCTGTCTCTCTAAGGTCCCT\
CTTGGAGCAACTGAAGAAACTCCAGGCCATTGTGGTGCAGTCCACCAGCA\
AGTCAGCCCAGACAGGCACCTGTGTCGCAGTGAGTCCTGGTGCCCCCAGG\
CAAGCCGGGGACCTAGGCTTCTGTAGAGGGGCCCATAGGGAGGTGACAAT\
GAGTCCAAGCTCTCCTTGTGCCCCAGCTCAAGTATGATCCAGTCTGGTCT\
TTGGGGCCTCAGTTTCCCTGCCTGTGGGATGGAGATGCTTGCAGGGGAGG\
GGAGGGAGGGGGTGACTCTGCCGCTGTCTCCACCAGGTCCTGTTGCTGTC"
解决方案
听起来你可能需要这样的东西?
(A|T)AGCGG
这将匹配 AAGCGG 或 TAGCGG。
如果第四个字符可以是 C、A、G 中的任何一个,那么它可能如下所示:
(A|T)AG(C|A|G)GG
推荐阅读
- excel - 如何用 VBA 减去组合命名范围
- android - 如何在一台设备上同时使用多个 adb 命令?
- pine-script - 松树中的函数调用返回意外值
- python - 更新到 20.1.1 后 pip 停止工作
- c++ - 将 pthread_cond_broadcast 移植到 std::atomic
- javascript - WebRTC 网络摄像头无法在 Safari 和 Microsoft Edge 上运行
- python - Django 3.0 在 db 转换器中缺少位置参数
- string - PowerShell 字符串计时
- python - 输入1时如何让程序从头开始运行
- python - Python while循环在满足指定条件后未结束