python - 当一个序列在 df 的集群中时删除原始数据
问题描述
我有一个数据框,例如:
Cluster sequence_name
1 specie1
1 specie2
1 specie3
1 sequence1
1 sequence2
2 specie8
3 specie2
4 sequence1
4 sequence3
4 specie56
...
我想删除所有只包含一个序列的集群,在这个例子中我应该得到:
Cluster sequence_name
1 specie1
1 specie2
1 specie3
1 sequence1
1 sequence2
4 sequence1
4 sequence3
4 specie56
...
谢谢您的帮助 。
解决方案
使用groupby
and进行布尔索引transform
:
df[df.groupby('Cluster')['sequence_name'].transform('size') > 1]
Cluster sequence_name
0 1 specie1
1 1 specie2
2 1 specie3
3 1 sequence1
4 1 sequence2
7 4 sequence1
8 4 sequence3
9 4 specie56
推荐阅读
- apiconnect-test-monitor - API Connect 测试和监控桌面客户端
- asp.net-mvc - OWIN SSO 和 error=access_denied 的外部登录信息为空
- mysql - 为什么我不能在 mysql 中使用 join 和正则表达式?
- arm - 为什么存储在 NMI Vector 地址中的 NMI 函数地址以 ARM 皮质中的位 1 结尾?
- javascript - 如何在javascript中监听mousdown事件 - react-materialize?
- codeigniter - 如何使用 Codeigniter 框架上传图像?
- c# - 如何在 Linq 中将 select 和 group by 子句与条件 where 结合起来
- python - 包装 Python cProfile runctx API 以参数化任何地方的运行
- r - ggplot 省略了缺少数据的日期
- c# - 使用 lambda 表达式计算 C# 中字符串中超过 x 个字符的单词