pandas - Pandas - 根据特定条件查找数据框中是否存在值
问题描述
我有一个包含工单列表的数据框,以及他们的冲刺和状态如下:
ticket,sprint,status
101,sprint_1,Closed
102,sprint_1,Open
103,sprint_2,Working
103,sprint_3,Fixed
103,sprint_4,Fixed
103,sprint_5,Open
103,sprint_6,Closed
我正在尝试查找不在Closed
特定 sprint 中的票,如果它们是另一个 sprint 的一部分。
在给定的样本集中,我们看到工单102
在给定的 sprint 中没有完成,但没有未来的 sprint,这是工单103
从 sprint_3 移动sprint_2
到sprint_3
并在 sprint_3 中关闭的一部分。
我正在尝试添加查找不在Closed
给定 sprint 中的票,如果他们有另一个条目用于未来的 sprint
预期输出:
ticket,sprint,status,part_of_future_sprint_if_not_closed,no_future_sprint_planned_open_tickets
101,sprint_1,Closed,0,0
102,sprint_1,Open,0,1
103,sprint_2,Working,1,0
103,sprint_3,Fixed,1,0
103,sprint_4,Fixed,1,0
103,sprint_5,Open,1,0
103,sprint_6,Closed,0,0
解决方案
利用:
#test equal
m1 = df['status'].eq('Open')
#test all duplicated tickets
m2 = df['ticket'].duplicated(keep=False)
#test all duplicated sprints
m3 = df['sprint'].duplicated(keep=False)
#test equal
m4 = df['status'].eq('Closed')
#test if at least one Open per group
m5 = m1.groupby(df['ticket']).transform('any')
df['part_of_future_sprint_if_not_closed'] = (m2 & ~m4 & m5).astype(int)
df['no_future_sprint_planned_open_tickets'] = (m1 & ~m2 & m3).astype(int)
print (df)
ticket sprint status part_of_future_sprint_if_not_closed \
0 101 sprint_1 Closed 0
1 102 sprint_1 Open 0
2 103 sprint_2 Working 1
3 103 sprint_3 Fixed 1
4 103 sprint_4 Fixed 1
5 103 sprint_5 Open 1
6 103 sprint_6 Closed 0
no_future_sprint_planned_open_tickets
0 0
1 1
2 0
3 0
4 0
5 0
6 0
推荐阅读
- excel - Excel,查看表中的值,其中行和列都是范围
- javascript - 无法更新 javascript 对象属性值
- r - 如何检查数据框中的列中是否有某些字符用于 if 语句?
- java - 尝试创建形状时在 JavaFX 上收到错误
- javascript - Mongoose setOnInsert :在查询中使用计算属性
- c++ - 使用 QListWidget 的 Qt 命令日志
- c# - 创建元素数组 c# 控制台
- cluster-computing - 解决 SLURM “sbatch:错误:批处理作业提交失败:请求的节点配置不可用”错误
- sql - Symfony 4 - SQLSTATE[42000] 未知原因更改表
- java - localhost api 请求的 Http 失败响应:0 未知错误 - Angular