首页 > 解决方案 > 在训练机器学习模型时,我们是否需要一个热编码或标签编码目标列

问题描述

具有列的数据集-目标列-水果名称(数据-芒果,橙,苹果),特征列-大小(数字),颜色(红色,绿色,黄色),重量(数字)

我对颜色列进行了一次热编码并准备了特征,每一列都有数值。

我想使用分类模型进行预测。

如果我有一个我必须进行预测的目标列,它由分类数据(例如苹果、橙色、芒果)组成,所以如果我想使用逻辑回归模型,它是一个基于分类的模型,我做也需要对目标列进行一种热编码或标签编码,就像我们对特征列(名称颜色)所做的那样。

谢谢

标签: machine-learningpysparkdata-scienceone-hot-encoding

解决方案


不,它会起作用,因为给定输入 X,逻辑回归会返回 Y = y 的概率。


推荐阅读