首页 > 解决方案 > 在 Python 过滤数据中使用 Pandas 进行 DF 分析

问题描述

嘿堆栈溢出用户,

我有以下问题。我有一张表格,其中包含有关各个国家/地区的发病率值的信息。

例如,我想以可以比较美国和德国的发病率值的方式显示数据。

我的问题是发生率值是累积的。如何从列 day = 14 中仅过滤掉 USA 和 Germany 的值。

因此,我只想查看各行中的 14 天值,以便绘制发病率值的时间比较。

数据预览:

在此处输入图像描述

标签: pythonpandasdataframe

解决方案


你可以试试:

m=(df['day'].isin([7,14,21,28])) & (df['countriesAndTerritories'].isin(['USA','Germany']))
#If the names are exact 'USA' and 'Germany'
#OR
m=(df['day'].isin([7,14,21,28])) & (df['countriesAndTerritories'].str.contains('USA|Germany',case=False))
#IF the names are in irregular case i.e some are in uppercase and some are in lowercase

最后:

df[m]
#OR
df.loc[m]

推荐阅读