首页 > 解决方案 > 如何根据其他列的某些相等性向CSV添加新列?

问题描述

这是我的问题。我正在使用 pandas 处理 python CSV 数据集。我正在使用 2 个不同的数据集比较纽约社区的犯罪率和该社区的 Airbnb 租金。我想要做的是检查社区名称是否相同,然后在 air BnB df 的价格列旁边添加犯罪率列。然而,指数并不相同,上东区房屋有 500 起犯罪,而上东区只有 1 个犯罪数字。那么如何结合这些信息呢?非常需要帮助,因为我今晚有报告要交,谢谢

到目前为止,我已经完成了:我只将 csv 文件实现为 df,然后考虑创建一个包含社区和比率的犯罪率数据的字典,如果我发现 aribnb 位置和字典位置相等,我想从字典中添加犯罪率值到一个空列表。在这样做之后,我相信列表将与 Air bnb 位置按顺序排列,以便我可以将此列表作为新列添加到 Air bnb csv。对不起,我的代码不正确,所以我不能在这里发布。此外,我还坚持通过在 2 个 csv 中找到相同的位置来将 dict 的正确值添加到空列表中。

数据集: http ://app.coredata.nyc/?mlb=false&ntii=crime_all_rt&ntr=Community%20District&mz=14&vtl=https%3A%2F%2Fthefurmancenter.carto.com%2Fu%2Fnyufc%2Fapi%2Fv2%2Fviz%2F98d1f16e-95fd -4e52-a2b1-b7abaf634828%2Fviz.json&mln=true&mlp=true&mlat=40.718&ptsb=&nty=2018&mb=路线图&pf=%7B%22subsidies%22%3Atrue%7D&md=table&mlv=false&mlng=-73.996&btl=Borough&atp=neighborhoods

https://www.kaggle.com/dgomonov/new-york-city-airbnb-open-data

标签: pythonpandascsvcomparison

解决方案


推荐阅读