python - 如果我试图预测样本的标签,但样本缺少特征,我应该如何处理?
问题描述
我现在有一个概念问题;我知道当 .predict() 用于具有 NaN 值的示例时,sklearn 不喜欢它,但是如果我想预测具有 NaN/缺失特征的示例的标签,我该怎么办?
目前,我正在用 -999 替换 NaN 单元格作为占位符度量,但我不确定这是否是个好主意。不幸的是,搜索预测样本中的缺失值不会产生有用的结果。
解决方案
您可以尝试的一种方法是使用用于填充训练数据集中缺失值的值来填充测试示例中的缺失值。例如,如果您使用训练数据的平均值填充该特征的缺失值,则可以使用该平均值来填充测试示例中的缺失值。
推荐阅读
- python - if 语句返回 false 并且 django 重定向我
- email - 欺骗电子邮件在线服务:它是如何工作的?即 https://emkei.cz/
- angular - 为什么我的 Angular 应用在 Github Pages 上是空白的?
- azure - Azure 搜索索引器每次都会索引整个 Cosmos db 数据源
- inno-setup - 解析相对于另一个文件夹中包含的 .iss 文件的文件路径
- postgresql - Postgresql 使用 CTE 删除行删除所有行
- python - 使用 Dask 下载、处理并保存到 csv
- html - 为 Outlook 格式化 html 电子邮件签名
- java - 有没有办法挂钩对 @Controller 方法的每次调用或对 Spring MVC 调度程序 servlet 的每次调用?
- codeigniter - 使用 codeigniter 构建工作队列