python - 如何使用 pandas 估算缺失值?
问题描述
我试图将缺失值估算为列中其他值的平均值;但是,我的代码没有效果。有谁知道我可能做错了什么?谢谢!
我的代码:
from sklearn.preprocessing import Imputer
imputer = Imputer(missing_values ='NaN', strategy =
'mean', axis = 0)
imputer = imputer.fit(x[:, 1:3])
x[:, 1:3] = imputer.transform(x[:, 1:3])
print(dataset)
输出
Country Age Salary Purchased
0 France 44.0 72000.0 No
1 Spain 27.0 48000.0 Yes
2 Germany 30.0 54000.0 No
3 Spain 38.0 61000.0 No
4 Germany 40.0 NaN Yes
5 France 35.0 58000.0 Yes
6 Spain NaN 52000.0 No
7 France 48.0 79000.0 Yes
8 Germany 50.0 83000.0 No
9 France 37.0 67000.0 Yes
解决方案
您可以执行以下操作,假设df
是您的数据集:
from sklearn.preprocessing import Imputer
imputer = Imputer(missing_values ='NaN', strategy = 'mean', axis = 0)
df[['Age','Salary']]=imputer.fit_transform(df[['Age','Salary']])
print(df)
Country Age Salary Purchased
0 France 44.000000 72000.000000 No
1 Spain 27.000000 48000.000000 Yes
2 Germany 30.000000 54000.000000 No
3 Spain 38.000000 61000.000000 No
4 Germany 40.000000 63777.777778 Yes
5 France 35.000000 58000.000000 Yes
6 Spain 38.777778 52000.000000 No
7 France 48.000000 79000.000000 Yes
8 Germany 50.000000 83000.000000 No
9 France 37.000000 67000.000000 Yes
推荐阅读
- c++ - 改进串口通信的READ功能(举例)
- sql - 枢轴相同的值
- yii2 - 如何在 mpdf 库中使用 writeCell
- amazon-web-services - Terraform:如何提供使用一个资源块创建的资源的属性?
- automation - 在 linux/debian 上进行非交互式 Steam 安装(如何自动接受 EULA?)
- swift - 根据泛型类型实现功能的泛型类
- java - “抛出 ArithmeticException”是否只是方法定义中的装饰?
- pine-script - 如何在行的顶部显示标签?
- ios - 如何居中 TabBarItem - Swift
- javascript - Laravel 5:附加输入文本取决于所选选项 vue js