scikit-learn - NNS:有没有办法在预测中省略某些特征?
问题描述
我想训练一个最近邻搜索模型,如下所示 -
| feature_A | feature_B | feature_C |
---------------------------------------------
point_1 | 0.0 | 5.1 | 94.9 |
point_2 | 80.7 | 35.3 | 64.7 |
等等,还有更多的特征和数据点。
然后我们可以传递一个点进行预测,例如[0.3, 5.0, 94.0] -> returns point_1
最近邻搜索中的典型情况。
我还想做的是传递某个特征或特征子集的值并返回最近点,忽略所有其他特征,如下所示:
[None, 5.0, None] -> returns point_1
[80.0, None, 64.7] -> returns point_2
问题是这些空值不能传递给模型,也不能真正推断为 0.0,因为这不是预测所要求的。该特征需要从计算中完全省略。
有没有一种方法可以使用 Sagemaker/Scikit-learn 库本地执行此操作,而无需构建多个模型或编写 NNS 的自定义实现?
解决方案
推荐阅读
- tsql - SQL Server 2014 跟踪信息
- chart.js - 带有 2 个 y 轴的 Chart.js
- python - 使用 python 创建条形图,每周显示数据
- javascript - 无法使用 ReactJS 在输入字段中输入文本值
- html - 如何在 Shiny 中默认选择 verbatimTextOutput 中的文本?
- laravel - paytm pg 错误代码 419(页面已过期),即使表单数据在交易中成功
- r - R one-liner 用于反转列表的嵌套顺序?
- google-sheets - 如何根据 Google 表格中相邻列中的值返回一系列单元格
- java - 按下按钮时没有任何反应
- java - 使用 Jackson 库时如何实现错误处理程序