首页 > 解决方案 > 如何替换数据中的缺失值?

问题描述

在此处输入图像描述

上图是我目前正在处理的数据的一部分,fips 列中的一些数据丢失了。我正在尝试使用其他列中的信息替换缺失值。我想编写一个代码,如果缺少 fips 值,那么它将尝试将县和州详细信息与其他行进行匹配,如果匹配,则使用该行中的 fips 代码来填充缺失的值。有可能做到吗?

标签: python-3.xpandasdataframemissing-datadata-cleaning

解决方案


你能试试这个吗? df.groupby(['state', 'county'])['fips'].apply(lambda x : x.bfill().ffill()))

我假设每个州 + 县的 fips 值是唯一的


推荐阅读