首页 > 解决方案 > 如何将我的有监督机器学习模型与无监督数据一起使用?

问题描述

我做了一个决策树和逻辑回归模型。我对结果感到满意。如何在无监督数据上使用它?另外:我是否需要始终使用 StandardScaler 处理新数据?

标签: pythonscikit-learn

解决方案


虽然你的问题对我来说太宽泛了,但我仍然想给出一些简短的建议:

  1. 您需要监督数据仅用于模型的训练阶段。当您已经训练有素的模型时,您可以对无监督数据(即没有标签/目标的数据)进行预测,并且模型返回预测的标签。通常你可以通过使用predict方法来做到这一点
  2. 重要时刻:要使用该predict方法,需要以与训练期间相同的形式将数据传输到模型输入 - 相同的特征集和相同数量的特征(当然不包括标签/目标)
  3. 预处理也是如此 - 如果您用于StandardScaler训练数据,您也必须将其用于新数据 - SAME StandardScaler(transform即已安装在 trining 数据缩放器上的调用方法)
  4. 使用StandatdScaler或一些标准化的哲学:很短 - 将其用于线性模型(以及您的逻辑回归)。在这里阅读它,例如:https ://scikit-learn.org/stable/auto_examples/preprocessing/plot_scaling_importance.html 但对于树,这不是必需的。示例:https ://towardsdatascience.com/do-decision-trees-need-feature-scaling-97809eaa60c6

推荐阅读