encoding - 调查数据的预处理
问题描述
我有一个数据集,我想构建一个机器学习模型。该数据集由调查问题组成,参与者将问题评为无用、有点有用、有用、非常有用等。
我将特征编码为序数(没用:1,有点用:2,有用:3,非常有用:4)除了这些类型的数据,我还有连续和二进制特征。我用 Standard Scaler 对连续数据进行了缩放,并没有触及二进制数据。但是,我不确定是否要缩放这个序数编码特征。我应该同时缩放它们还是保持原样?
解决方案
推荐阅读
- sql - SQL RegExp 从 URL 中提取 slug
- javascript - 当 3 个表单区域需要具有值时,通过 jQuery 处理按钮启用
- dask - 从队列中向 dask 客户端提交工作的最佳方式是什么?
- xcode - Xcode:如何使用类从主视图控制器重置所有按钮的状态
- sql - ORA-01722: 立即执行中的无效数字
- python - 如何将列表与嵌套列表合并?
- debugging - 在 vscode 中调试 C 文件时遇到问题
- cocoa - NSFileManager 是否将修改日期等元数据与文件一起复制?
- python - 如何在熊猫数据框列中仅过滤掉一个组合
- scala - 如何从 kafka 流中获取最新值