首页 > 解决方案 > 如何在 Jupyter 笔记本中使用 Python 和 pandas 从特定列中提取数据?

问题描述

我正在从以前建立的名为 Police_2013_by_date 的 df 中提取数据。在该 df 中,有名为:shift、disposition_desc 和 unit 的列。

我需要为“DISREGARD / SIGNAL 9”的所有 disposition_desc 制作一个数据子集,以便我可以确定特定年份的“DISREGARD / SIGNAL 9”所有呼叫的百分比是多少?

我尝试了以下方法:

crimes_2013_disregard = police_2013_by_date.query('disposition_desc == "DISREGARD / SIGNAL 9"')
crimes_2013_disregard

返回“UndefinedVariableError:名称'disposition_desc'未定义。但是,当我输入'unit'或'shift'而不是'disposition_desc'时,这个确切的代码有效。

这是主题数据:

police_2013_by_date.head(4)
shift           disposition_desc             unit
A               SUBJECT WARNED               410C
A               DISREGARD / SIGNAL 9         415C
C               GONE ON ARRIVAL              433C
C               LOCATION/BUILDING SECURE     415C   

标签: pythonpandasjupyter

解决方案


您的问题似乎与您真正想要的不同。

police_2013_by_date.disposition_desc.value_counts(normalize=True)

将获得 disposition_desc 的所有比例,包括“DISREGARD / SIGNAL 9”。

但是,如果问题仅用于获取列中的特定值,那么@Brandes 的答案是正确的


推荐阅读