python - 如何在 Pandas DataFrame 中选择具有多个值的行
问题描述
我有一个看起来像这样的 DataFrame:
Entry ribosome protein PDB
0 P46782 s5 4ug0;4v6x;5a2q;5aj0;5flx;5lks;5oa3;5t2c;5vyc;6...
1 P0A7W3 s5 5wf0;5wfs;6awb;6awc;6awd
2 A2RNN6 s5 5myj
3 Q5SHQ5 s5 1fjg;1fka;1hnw;1hnx;1hnz;1hr0;1i94;1i95;1i96;1...
4 Q2YYL4 s5 6fxc
5 A0QSG6 s5 5o5j;5o61;5xyu;5zeb;5zep;5zeu;6dzi;6dzk
6 P33759 s5 5mrc;5mre;5mrf`
我需要提取在“PDB”列中有多个条目的行。例如,在这种情况下,我希望 DataFrame 显示没有“6fxc”和“5myj”(单个条目)的行,但只有多个 PDB,如“5mrc;5mre;5mrf”。
怎么做?
这只是包含此类数据的巨大数据框的一部分,我需要以这种方式进行过滤。
解决方案
可能你可以使用split
和len
过滤它的东西:
df[df['PDB'].str.split(';').str.len()>1]
在评论之后,您也可以尝试简单地计数;
如下:
df[df['PDB'].str.count(";")>0]
推荐阅读
- spring-boot - 在java中将复杂数据sendgrid转换成动态模板数据
- mysql - MySql READ_COMMITTED 增加值时的行为
- python - 如何使用代理艺术家图例更改花哨的箭头宽度
- python - 访问嵌套字典中的值
- azure - Azure 函数使用 Powershell 使用来自事件中心的数据并将其发布到 REST API
- php - 仅在查询中加入条件
- javascript - 是否有 ag-grid 为网格中的每一行生成并附加的唯一 ID
- powerbi - 数据流和电源查询编辑器刷新时间的区别
- amazon-web-services - 从 docker 容器内的 lambda 发布 mqtt 消息时出现异常
- cloudflare - Cloudflare + ELB - nginx-ingress 中的真实源 IP 以将入口列入白名单