首页 > 解决方案 > 如果我试图预测样本的标签,但样本缺少特征,我应该如何处理?

问题描述

我现在有一个概念问题;我知道当 .predict() 用于具有 NaN 值的示例时,sklearn 不喜欢它,但是如果我想预测具有 NaN/缺失特征的示例的标签,我该怎么办?

目前,我正在用 -999 替换 NaN 单元格作为占位符度量,但我不确定这是否是个好主意。不幸的是,搜索预测样本中的缺失值不会产生有用的结果。

标签: pythonmachine-learningscikit-learnmissing-data

解决方案


您可以尝试的一种方法是使用用于填充训练数据集中缺失值的值来填充测试示例中的缺失值。例如,如果您使用训练数据的平均值填充该特征的缺失值,则可以使用该平均值来填充测试示例中的缺失值。


推荐阅读