首页 > 解决方案 > NNS:有没有办法在预测中省略某些特征?

问题描述

我想训练一个最近邻搜索模型,如下所示 -

        | feature_A | feature_B | feature_C |
---------------------------------------------
point_1 |       0.0 |       5.1 |      94.9 |
point_2 |      80.7 |      35.3 |      64.7 |

等等,还有更多的特征和数据点。

然后我们可以传递一个点进行预测,例如[0.3, 5.0, 94.0] -> returns point_1最近邻搜索中的典型情况。

我还想做的是传递某个特征或特征子集的值并返回最近点,忽略所有其他特征,如下所示:

[None, 5.0, None] -> returns point_1

[80.0, None, 64.7] -> returns point_2

问题是这些空值不能传递给模型,也不能真正推断为 0.0,因为这不是预测所要求的。该特征需要从计算中完全省略。

有没有一种方法可以使用 Sagemaker/Scikit-learn 库本地执行此操作,而无需构建多个模型或编写 NNS 的自定义实现?

标签: scikit-learnknnamazon-sagemaker

解决方案



推荐阅读