python - 如何根据其他列的某些相等性向CSV添加新列?
问题描述
这是我的问题。我正在使用 pandas 处理 python CSV 数据集。我正在使用 2 个不同的数据集比较纽约社区的犯罪率和该社区的 Airbnb 租金。我想要做的是检查社区名称是否相同,然后在 air BnB df 的价格列旁边添加犯罪率列。然而,指数并不相同,上东区房屋有 500 起犯罪,而上东区只有 1 个犯罪数字。那么如何结合这些信息呢?非常需要帮助,因为我今晚有报告要交,谢谢
到目前为止,我已经完成了:我只将 csv 文件实现为 df,然后考虑创建一个包含社区和比率的犯罪率数据的字典,如果我发现 aribnb 位置和字典位置相等,我想从字典中添加犯罪率值到一个空列表。在这样做之后,我相信列表将与 Air bnb 位置按顺序排列,以便我可以将此列表作为新列添加到 Air bnb csv。对不起,我的代码不正确,所以我不能在这里发布。此外,我还坚持通过在 2 个 csv 中找到相同的位置来将 dict 的正确值添加到空列表中。
https://www.kaggle.com/dgomonov/new-york-city-airbnb-open-data