首页 > 解决方案 > 如何使用 pandas 过滤 csv 数据文件

问题描述

我已将 csv 文件作为 df 读入 Python,并将其保存为名为 Master_Clean 的新数据框。

csv 文件包含有关工作列表的信息。我附上了部分 csv 文件的屏幕截图,以便您查看所有列。所有空值都已替换为 NaN。

我将如何显示 2018 年发布的州“纽约”的工作?我遇到了麻烦,因为日期是以 mm/dd/yyyy 格式编写的,而不仅仅是年份。

以下是列名:Index(['Job_id', 'Vertical', 'Company', 'Post_date', 'Fill_date','Time_to_fill', 'Salary', 'Location', 'City', 'State', ' Zip'、'County'、'Region_state'、'Latitude'、'Longitude']、dtype='object')

is_NY_2018 = Master_Clean['State'] == 'NY' print(is_NY_2018)

标签: python

解决方案


这里的日期以字符串形式出现,因此您可以将其拆分以获得仅做您需要做的事情的年份

year = int(Post_date.split("/", 3)[2])

类型转换为 int 数据类型

您可以循环Master_Clean['Post_date']获取 Post_date 值


推荐阅读