首页 > 解决方案 > Pandas - 根据特定条件查找数据框中是否存在值

问题描述

我有一个包含工单列表的数据框,以及他们的冲刺和状态如下:

ticket,sprint,status
101,sprint_1,Closed
102,sprint_1,Open
103,sprint_2,Working
103,sprint_3,Fixed
103,sprint_4,Fixed
103,sprint_5,Open
103,sprint_6,Closed

我正在尝试查找不在Closed特定 sprint 中的票,如果它们是另一个 sprint 的一部分。

在给定的样本集中,我们看到工单102在给定的 sprint 中没有完成,但没有未来的 sprint,这是工单103从 sprint_3 移动sprint_2sprint_3并在 sprint_3 中关闭的一部分。

我正在尝试添加查找不在Closed给定 sprint 中的票,如果他们有另一个条目用于未来的 sprint

预期输出:

ticket,sprint,status,part_of_future_sprint_if_not_closed,no_future_sprint_planned_open_tickets
101,sprint_1,Closed,0,0
102,sprint_1,Open,0,1
103,sprint_2,Working,1,0
103,sprint_3,Fixed,1,0
103,sprint_4,Fixed,1,0
103,sprint_5,Open,1,0
103,sprint_6,Closed,0,0

标签: pandas

解决方案


利用:

#test equal
m1 = df['status'].eq('Open')
#test all duplicated tickets
m2 = df['ticket'].duplicated(keep=False)
#test all duplicated sprints
m3 = df['sprint'].duplicated(keep=False)
#test equal
m4 = df['status'].eq('Closed')
#test if at least one Open per group
m5 = m1.groupby(df['ticket']).transform('any')

df['part_of_future_sprint_if_not_closed'] = (m2 & ~m4 & m5).astype(int)
df['no_future_sprint_planned_open_tickets'] = (m1 & ~m2 & m3).astype(int)

print (df)
   ticket    sprint   status  part_of_future_sprint_if_not_closed  \
0     101  sprint_1   Closed                                    0   
1     102  sprint_1     Open                                    0   
2     103  sprint_2  Working                                    1   
3     103  sprint_3    Fixed                                    1   
4     103  sprint_4    Fixed                                    1   
5     103  sprint_5     Open                                    1   
6     103  sprint_6   Closed                                    0   

   no_future_sprint_planned_open_tickets  
0                                      0  
1                                      1  
2                                      0  
3                                      0  
4                                      0  
5                                      0  
6                                      0  

推荐阅读