for-loop - 将蛋白质序列的权重与正确的序列配对
问题描述
这段代码是一个更大函数的一部分。我已经创建了一个分子量列表,并且我还定义了我数据中所有片段的列表。我试图弄清楚如何浏览片段列表,计算它们的分子量并检查它是否与另一个列表中的数字匹配。如果匹配,则将该序列附加到一个空列表中。
combs = [397.47, 2267.58, 475.63, 647.68]
fragments = ['SKEPFKTRIDKKPCDHNTEPYMSGGNY', 'KMITKARPGCMHQMGEY', 'AINV', 'QIQD', 'YAINVMQCL', 'IEEATHMTPCYELHGLRWV', 'MQCL', 'HMTPCYELHGLRWV', 'DHTAQPCRSWPMDYPLT', 'IEEATHM', 'MVGKMDMLEQYA', 'GWPDII', 'QIQDY', 'TPCYELHGLRWVQIQDYA', 'HGLRWVQIQDYAINV', 'KKKNARKW', 'TPCYELHGLRWV']
frags = []
for c in combs:
for f in fragments:
if c == SeqUtils.molecular_weight(f, 'protein', circular = True):
frags.append(f)
print(frags)
我猜我不完全知道 SeqUtils.molecular_weight 命令在 Python 中是如何工作的,但如果有另一种方式也很好。
解决方案
您正在比较浮点值是否相等。那是注定要失败的。在处理浮点值时,您总是需要考虑某种程度的错误。在这种特殊情况下,您还必须考虑输入值的误差范围。
所以不要像这样比较浮点数
x == y
而是像这样
abs(x - y) < epsilon
哪里epsilon
是一些精心挑选的任意数字。
我对您的代码做了两处细微的修改:我交换了f
和c
循环的顺序,以便能够存储w
. 为了更好地了解正在发生的事情,我还将 的值附加w
到列表中。frags
您修改后的代码现在如下所示:
from Bio import SeqUtils
combs = [397.47, 2267.58, 475.63, 647.68]
fragments = ['SKEPFKTRIDKKPCDHNTEPYMSGGNY', 'KMITKARPGCMHQMGEY', 'AINV', 'QIQD', 'YAINVMQCL', 'IEEATHMTPCYELHGLRWV',
'MQCL', 'HMTPCYELHGLRWV', 'DHTAQPCRSWPMDYPLT', 'IEEATHM', 'MVGKMDMLEQYA', 'GWPDII', 'QIQDY',
'TPCYELHGLRWVQIQDYA', 'HGLRWVQIQDYAINV', 'KKKNARKW', 'TPCYELHGLRWV']
frags = []
threshold = 0.5
for f in fragments:
w = SeqUtils.molecular_weight(f, 'protein', circular=True)
for c in combs:
if abs(c - w) < threshold:
frags.append((f, w))
print(frags)
这打印结果
[('AINV', 397.46909999999997), ('IEEATHMTPCYELHGLRWV', 2267.5843), ('MQCL', 475.6257), ('QIQDY', 647.6766)]
如您所见,权重的第一个值与参考值相差约 0.0009。这就是为什么你没有用你的方法抓住它。
推荐阅读
- javascript - Javascript发送错误的获取请求
- apache - Certbot 在 Ubuntu 18.04 Apache 2.4.29 上失败
- python - 为什么在使用 Kivy 和 Python 时出现错误 0xC0000005?
- c# - 根据输入字符串中提供的时区解析日期时间
- haskell - 难以将 Relation 类型定义为 Category 类的实例
- java - Elasticsearch范围如何查询Java API中两个字段的总和?
- fortran - 如何让 doxygen 在 .F90 文件中查看预处理器宏的文档?
- android - Firebase:项目中的应用程序过多
- google-sheets - 谷歌表 - 如何更改单元格范围而不删除它
- java - JdbcTemplate如何通过IN子句返回数据