python - 如何使用 pandas 过滤 csv 数据文件
问题描述
我已将 csv 文件作为 df 读入 Python,并将其保存为名为 Master_Clean 的新数据框。
csv 文件包含有关工作列表的信息。我附上了部分 csv 文件的屏幕截图,以便您查看所有列。所有空值都已替换为 NaN。
我将如何显示 2018 年发布的州“纽约”的工作?我遇到了麻烦,因为日期是以 mm/dd/yyyy 格式编写的,而不仅仅是年份。
以下是列名:Index(['Job_id', 'Vertical', 'Company', 'Post_date', 'Fill_date','Time_to_fill', 'Salary', 'Location', 'City', 'State', ' Zip'、'County'、'Region_state'、'Latitude'、'Longitude']、dtype='object')
is_NY_2018 = Master_Clean['State'] == 'NY' print(is_NY_2018)
解决方案
这里的日期以字符串形式出现,因此您可以将其拆分以获得仅做您需要做的事情的年份
year = int(Post_date.split("/", 3)[2])
类型转换为 int 数据类型
您可以循环Master_Clean['Post_date']
获取 Post_date 值
推荐阅读
- python - 根据一个简单的条件,将一个数字列表分成几个列表,在列表中领先和落后
- c++ - AVX2:AVX 寄存器中 8 位元素的 BitScanReverse 或 CountLeadingZeros
- ios - 多个表视图使用的单一 UITableViewDiffableDataSource
- javascript - 具有两种不同颜色状态的导航栏
- vb.net - 循环无法读取所有访问记录
- google-drive-api - 如何使用google api获取有权访问共享驱动器的用户列表
- node.js - 如何使用 npm 并发包同时运行 Nextjs 应用程序和 Express 服务器?
- twilio - 从测试帐户购买 Twilio 上的虚拟号码
- javascript - Chart.js 和 react-chartjs-2 属性 translate 缺少类型
- python - 在 Django 中使用 rpy2 调用 R 脚本时出错:UnicodeDecodeError, invalid continuation byte