首页 > 解决方案 > MissForest 插补算法 Python:ValueError:输入包含 NaN、无穷大或对于 dtype('float64')来说太大的值

问题描述

我正在使用错过森林算法来估算丢失的数据。当我在训练时使用它时,它很有魅力,但是当我使用 joblib 导入缺失森林模型来为新数据估算数据时,它会出现以下错误:

ValueError:输入包含 NaN、无穷大或对于 dtype('float64') 来说太大的值

该算法的重点是估算缺失数据。

这是我的参考代码:

from missingpy import MissForest
imp = MissForest(max_iter=10,criterion=('mse', 'gini'),random_state=0)
data[num_variables] = imp.fit_transform(data[num_variables])

import joblib
joblib.dump(imp, "./models_v1/internal_miss_forest.joblib")

import joblib
imp = joblib.load("./models/internal_miss_forest.joblib")
imp.transform(data[num_variables])

我在 num_variables 中的列数相同,dtypes 也相同。没有包含 nan 值的附加列。

有什么建议吗?

标签: pythonimputation

解决方案


推荐阅读