python - Python:计算具有多个条件的唯一性
问题描述
我有一个看起来像的数据框:
公司 | 投资者 | 圆形的 | 投资者类型 |
---|---|---|---|
X | 一个 | 1 | 一个 |
X | 未公开 | 1 | 一个 |
X | 一个 | 2 | 一个 |
X | 未公开 | 2 | 乙 |
X | 未公开 | 3 | 一个 |
X | 未公开 | 3 | 乙 |
X | 未公开 | 4 | 乙 |
X | 未公开 | 4 | 乙 |
X | 未公开 | 4 | 乙 |
是 | 未公开 | 1 | 一个 |
是 | 未公开 | 2 | 乙 |
是 | 未公开 | 2 | 乙 |
是 | 未公开 | 3 | 一个 |
是 | 未公开 | 4 | 乙 |
是 | 未公开 | 5 | 乙 |
我想做的是创建两个新列:Unique_A 和 Unique_B。如果存在遵循以下规则的“新”唯一未披露投资者,则这些目的是具有虚拟变量:
- 如果在 t+1 轮中发现相同数量的 A 类或 B 类未披露投资者,则假定这些未披露投资者相同,因此不计入新的投资者。
- 例子:如果我们在X公司第3轮有1个B型未公开投资者,第4轮有3个,差额(3-1)算作新投资者。此示例数据框的结果将如下所示:
公司 | 投资者 | 圆形的 | 投资者类型 | 未公开 | 未公开 B |
---|---|---|---|---|---|
X | 一个 | 1 | 一个 | 1 | 0 |
X | 未公开 | 1 | 一个 | 0 | 0 |
X | 一个 | 2 | 一个 | 0 | 0 |
X | 未公开 | 2 | 乙 | 0 | 1 |
X | 未公开 | 3 | 一个 | 0 | 0 |
X | 未公开 | 3 | 乙 | 0 | 0 |
X | 未公开 | 4 | 乙 | 0 | 0 |
X | 未公开 | 4 | 乙 | 0 | 1 |
X | 未公开 | 4 | 乙 | 0 | 1 |
是 | 未公开 | 1 | 一个 | 1 | 0 |
是 | 未公开 | 2 | 乙 | 0 | 1 |
是 | 未公开 | 2 | 乙 | 0 | 1 |
是 | 未公开 | 3 | 一个 | 0 | 0 |
是 | 未公开 | 4 | 乙 | 0 | 0 |
是 | 未公开 | 5 | 乙 | 0 | 0 |
非常感谢任何帮助!
解决方案
推荐阅读
- javascript - Heroku 请求的资源上不存在“Access-Control-Allow-Origin”标头。使用 React JS 使用 API 时
- python - 使用 AWS RDS - Python 连接到 MariaDB/HeidiSQL 实例
- python - 如何通过数据框列表中的数字索引为每个数据框复制一列?
- google-apps-script - 每次在另一个单独的电子表格上进行更新时,将时间戳添加到另一个电子表格
- java - Java 8 volatile 对字节码没有影响
- reactjs - (替换 & 之间有什么区别
) 在反应路由器中 - android - RecognitionService:在没有RECORD_AUDIO权限的情况下调用识别服务;扩展识别服务
- typescript - 嵌套映射类型必须实现子索引的所有模式吗?
- python - EMR 的 Boto3 API 不支持“OnDemandPrice”
- google-colaboratory - 在 Google Colab 上进行 cs231 作业时出错