machine-learning - 为什么机器学习算法不处理分类数据而需要将分类数据编码为数值数据?
问题描述
总是在使用数据集之前必须强制分类数据编码,为什么?为什么不能创建机器学习模型来直接处理分类数据?
解决方案
我将尝试以您可以理解的方式解释这一点。
分类变量是其值采用标签值的变量。
例如,变量可能是color并且可能取值red、green和blue。
有时,一种颜色比另一种颜色对查找结果的影响更大,这意味着一种颜色比另一种颜色具有更多价值,因此为了为其分配一个值,我们需要将其转换为数字。
机器学习算法和深度学习神经网络也要求输入和输出变量是数字。
这意味着在我们可以使用它来拟合和评估模型之前,必须将分类数据编码为数字。
推荐阅读
- javascript - Mongoose 异常的事件名称
- google-apps-script - 如何保存来自用户的任何输入消息,这些消息通过谷歌表和对话流发送到我的在线聊天机器人
- swift - 如何从具有多个目标的项目中创建 xcframework
- github - C# GitHub API - 如何添加/删除拉取请求受让人?
- webpack - Webpack 5 字体解码失败和 OTS 解析错误的问题
- visual-studio - 在 VS2019 中创建的报表服务器项目上使用查询设计器中的“添加表”时出错
- amazon-dynamodb - 从另一列计算指数
- xml - Google Apps 脚本 XML 解释错误
- java - 使用 {spring boot & Thymeleaf} 对表中的外键元素进行排序
- docker - 从 docker 容器中移动配置卷,如何不再设置应用程序