首页 > 解决方案 > 调查数据的预处理

问题描述

我有一个数据集,我想构建一个机器学习模型。该数据集由调查问题组成,参与者将问题评为无用、有点有用、有用、非常有用等。

我将特征编码为序数(没用:1,有点用:2,有用:3,非常有用:4)除了这些类型的数据,我还有连续和二进制特征。我用 Standard Scaler 对连续数据进行了缩放,并没有触及二进制数据。但是,我不确定是否要缩放这个序数编码特征。我应该同时缩放它们还是保持原样?

标签: encodingscalingpreprocessorsurveylikert

解决方案


推荐阅读