首页 > 解决方案 > 如何使用数据框中的两个或多个特定条件选择计数?

问题描述

所以我有一个城市不同邮政编码的诊所数据集,这些数据来自不同的时间范围。如何计算 2018-2019 年期间每个邮政编码中的诊所数量?到目前为止,我只能计算每个时间范围内的诊所总数。我还想为结果添加一个新列或数组。请看下面的代码:

df.groupby('Season')['Postal Code','Facility ID'].nunique() 

这是结果:

结果图像

此外,任何人都可以告诉我在 Python 中的数据帧的 SQL 中的 WHERE、GROUP BY 和 HAVING 的等价物。

标签: pythonpandasdataframecountpandas-groupby

解决方案


切片Season,然后分组Postal Code

res = df.loc[df['Season'] == '2018-2019']\
        .groupby('Postal Code')['Facility ID'].nunique()

您关于 SQL 等价物的问题过于宽泛:您可能会发现Pandas 文档很有帮助。


推荐阅读