首页 > 解决方案 > 如何保留具有重复n次值的行并删除不重复的行

问题描述

我有一个数据框,其中 RoomID 出现在每个 RoomID 的不止一行中。

例如,如果 RoomID 的值 i={1...1000} ,那么我们有多个 1 或 2 或...100,当然表示为行。

我想删除 RoomID 出现次数少于 20 次的行。换句话说,如果一个房间(由 RoomID 表示)至少 20 次不在数据框中,我希望将其删除。

我为澄清而编写的一些伪代码:

        for i in range(1000):
        if len(df[df['RoomID']==i]>20):
            #keep rows with RoomID==i
        else:
            #remove rows with RoomID=i

我是python新手,所以请记住这一点然后回答。

我不会理解复杂的python东西。我以前在 R 中处理过这些问题。

例子:

输入数据框:

房间号 | 颜色 ...

1 | 蓝色的

1 |黑色

1 |紫色

2 | 红色的

n=2 的输出数据帧(所以我们希望所有房间 id 出现超过 2 次):

房间ID|颜色...

1| 蓝色的

1 | 黑色的

1 | 紫色的

标签: python

解决方案


推荐阅读