首页 > 解决方案 > 大规模创建基于当前类别的新类别列

问题描述

我想问一个关于创建一个比较大规模的新品类的问题。

我正在使用 NYPD 投诉数据进行数据清理,并且我喜欢为每个犯罪事件(行)分配一种新型犯罪。我计划将独特类型犯罪的数量从最初的 59 种减少到仅 20 种,我会根据自己的理解来做到这一点(例如,将“突击 2”和“进攻”纳入“突击”)。我正在考虑使用字典映射到数据框中的新列,但我无法弄清楚如何实现这一点,因为我必须将多个值分配给一个新值(例如,我不确定我是否可以使用这样的字典 {'Assault': ('Assault 2', 'Offense')} 或列表方法)

我的问题是什么是最有效和最pythonic的方式来完成这项工作?ps 你可以在这个网站上找到数据:https ://data.cityofnewyork.us/Public-Safety/NYPD-Complaint-Data-Current-Year-To-Date-/5uac-w243

谢谢!

标签: pythonlistdataframedictionary

解决方案


推荐阅读