python - 在 Python 过滤数据中使用 Pandas 进行 DF 分析
问题描述
嘿堆栈溢出用户,
我有以下问题。我有一张表格,其中包含有关各个国家/地区的发病率值的信息。
例如,我想以可以比较美国和德国的发病率值的方式显示数据。
我的问题是发生率值是累积的。如何从列 day = 14 中仅过滤掉 USA 和 Germany 的值。
因此,我只想查看各行中的 14 天值,以便绘制发病率值的时间比较。
数据预览:
解决方案
你可以试试:
m=(df['day'].isin([7,14,21,28])) & (df['countriesAndTerritories'].isin(['USA','Germany']))
#If the names are exact 'USA' and 'Germany'
#OR
m=(df['day'].isin([7,14,21,28])) & (df['countriesAndTerritories'].str.contains('USA|Germany',case=False))
#IF the names are in irregular case i.e some are in uppercase and some are in lowercase
最后:
df[m]
#OR
df.loc[m]
推荐阅读
- asp.net-core - 使用类型化的 HttpClient 创建 LinkedTokenSource
- javascript - 如何在鼠标下获取每个 SVG 元素的列表并在 SVG 中更改 mouseenter/touchstart 下每个元素的颜色
- kotlin - 将具体的泛型类型转换为具有 Any 上限的非 null
- javascript - 向菜单项添加类而不改变样式
- salesforce - 将 Salesforce Einstein 聊天机器人集成到使用 Dot Net 和 Angular 构建的网站中
- elasticsearch - Elasticsearch基于公共字段合并多个索引
- macos - 无法编译库,运行 make 时找不到符号
- python - python中结合线性和非线性回归
- bash - 在直线中将 hql 输出导出到 csv
- c# - 如何在 C# 中将 byteArray 转换为二进制值?