首页 > 解决方案 > Python:计算具有多个条件的唯一性

问题描述

我有一个看起来像的数据框:

公司 投资者 圆形的 投资者类型
X 一个 1 一个
X 未公开 1 一个
X 一个 2 一个
X 未公开 2
X 未公开 3 一个
X 未公开 3
X 未公开 4
X 未公开 4
X 未公开 4
未公开 1 一个
未公开 2
未公开 2
未公开 3 一个
未公开 4
未公开 5

我想做的是创建两个新列:Unique_A 和 Unique_B。如果存在遵循以下规则的“新”唯一未披露投资者,则这些目的是具有虚拟变量:

  1. 如果在 t+1 轮中发现相同数量的 A 类或 B 类未披露投资者,则假定这些未披露投资者相同,因此不计入新的投资者。
  2. 例子:如果我们在X公司第3轮有1个B型未公开投资者,第4轮有3个,差额(3-1)算作新投资者。此示例数据框的结果将如下所示:
公司 投资者 圆形的 投资者类型 未公开 未公开 B
X 一个 1 一个 1 0
X 未公开 1 一个 0 0
X 一个 2 一个 0 0
X 未公开 2 0 1
X 未公开 3 一个 0 0
X 未公开 3 0 0
X 未公开 4 0 0
X 未公开 4 0 1
X 未公开 4 0 1
未公开 1 一个 1 0
未公开 2 0 1
未公开 2 0 1
未公开 3 一个 0 0
未公开 4 0 0
未公开 5 0 0

非常感谢任何帮助!

标签: pythonpandasunique

解决方案


推荐阅读