首页 > 解决方案 > 为什么机器学习算法不处理分类数据而需要将分类数据编码为数值数据?

问题描述

总是在使用数据集之前必须强制分类数据编码,为什么?为什么不能创建机器学习模型来直接处理分类数据?

标签: machine-learning

解决方案


我将尝试以您可以理解的方式解释这一点。

分类变量是其值采用标签值的变量。

例如,变量可能是color并且可能取值redgreenblue

有时,一种颜色比另一种颜色对查找结果的影响更大,这意味着一种颜色比另一种颜色具有更多价值,因此为了为其分配一个值,我们需要将其转换为数字。

机器学习算法和深度学习神经网络也要求输入和输出变量是数字。

这意味着在我们可以使用它来拟合和评估模型之前,必须将分类数据编码为数字。


推荐阅读