python - 如何使用数据框中的两个或多个特定条件选择计数?
问题描述
所以我有一个城市不同邮政编码的诊所数据集,这些数据来自不同的时间范围。如何计算 2018-2019 年期间每个邮政编码中的诊所数量?到目前为止,我只能计算每个时间范围内的诊所总数。我还想为结果添加一个新列或数组。请看下面的代码:
df.groupby('Season')['Postal Code','Facility ID'].nunique()
这是结果:
此外,任何人都可以告诉我在 Python 中的数据帧的 SQL 中的 WHERE、GROUP BY 和 HAVING 的等价物。
解决方案
切片Season
,然后分组Postal Code
:
res = df.loc[df['Season'] == '2018-2019']\
.groupby('Postal Code')['Facility ID'].nunique()
您关于 SQL 等价物的问题过于宽泛:您可能会发现Pandas 文档很有帮助。
推荐阅读
- neo4j - 重构大型密码联合查询
- firebase - “未满足的对等依赖 firebase-admin@6.1.0”
- amazon-web-services - AWS Glue:访问拒绝访问具有 S3 源数据的表
- twine-game-engine - TWINE 游戏本地化
- javascript - 删除@和carret之间的单词
- python - 如何设置从数据库调用数据的时间间隔?[Python]
- python - 遍历所有文本并对项目符号执行某些操作
- java - Hibernate 可以插入但不能删除条目
- c# - 如何确定最小的正可表示浮点值?
- java - PostMapping 的问题 - GetMapping 方法 - 链接中的循环。SpringBoot