python - 如何将我的有监督机器学习模型与无监督数据一起使用?
问题描述
我做了一个决策树和逻辑回归模型。我对结果感到满意。如何在无监督数据上使用它?另外:我是否需要始终使用 StandardScaler 处理新数据?
解决方案
虽然你的问题对我来说太宽泛了,但我仍然想给出一些简短的建议:
- 您需要监督数据仅用于模型的训练阶段。当您已经训练有素的模型时,您可以对无监督数据(即没有标签/目标的数据)进行预测,并且模型返回预测的标签。通常你可以通过使用
predict
方法来做到这一点 - 重要时刻:要使用该
predict
方法,需要以与训练期间相同的形式将数据传输到模型输入 - 相同的特征集和相同数量的特征(当然不包括标签/目标) - 预处理也是如此 - 如果您用于
StandardScaler
训练数据,您也必须将其用于新数据 - SAME StandardScaler(transform
即已安装在 trining 数据缩放器上的调用方法) - 使用
StandatdScaler
或一些标准化的哲学:很短 - 将其用于线性模型(以及您的逻辑回归)。在这里阅读它,例如:https ://scikit-learn.org/stable/auto_examples/preprocessing/plot_scaling_importance.html 但对于树,这不是必需的。示例:https ://towardsdatascience.com/do-decision-trees-need-feature-scaling-97809eaa60c6
推荐阅读
- firebase - 在 null 上调用了 Flutter 方法“resetPassword”
- java - 如何为自定义光标创建单独的类
- flutter - 你如何在 Flutter Web 上使用 SVG?
- javascript - 如何将我的数组数组中每个数组的第一个索引从字符串转换为整数?
- android - 如何在 Mapbox android 中添加自定义视图作为标记?
- python-3.x - 如何训练 TensorFlow 读取图像上的可变长度数字?
- grails - 如何在 Spring Security Rest 中自定义登录的响应
- r - 使用 Factanal,我如何将打印数据转换为 excel?
- kubernetes - Ceph Nautilus 分步说明从 Kubernetes pod 访问现有 CephFS 集群
- kubernetes - 如何在 Kubernetes 作业中使用 gosu 运行多个命令