首页 > 解决方案 > 缺失值的插补和除法

问题描述

想象一个如下所示的数据集:

df = pd.DataFrame({'联系人 6M':[4,7,20,5,6,0,1,19], '联系人 3M':[2,3,9,np.nan,np.nan, 0,np.nan,9]})

在此处输入图像描述

可以想象:“Contacts 6M”列是最近 6 个月的联系人计数,另一列包含最近 3 个月的联系人数量信息。所以'Contacts 3M'包含了另一栏的部分信息。

我用前向填充方法估算缺失值:

df.ffill(axis = 1, inplace=True)

我的问题:如何在迭代数据集时将估算值除以 2 并舍入估算值(请不要使用浮点数)?

标签: pythonmissing-dataimputation

解决方案


可以通过这种方式轻松完成:

df.iloc[df[df['Contacts 3M'].isna()].index,1]=df[df['Contacts 3M'].isna()]['Contacts 6M']/2

df['Contacts 3M']=df['Contacts 3M'].astype('int')


推荐阅读