首页 > 解决方案 > 具有相反严重性级别的分类值的多列标准化

问题描述

我有一个包含 5 个特征、2 个分类(序数,1-5)、1 个分类(名义)、2 个连续的数据集。

对于 2 分类(序数):
第一个变量的极端值为 5
第二个变量的极端值为 1

对于 2 个连续变量:
第一个变量的值越高越差
第二个变量的值越高越好

最终在规范化之后,我必须在数据集上运行 PCA。在运行 PCA 之前,需要从概念上了解我的选项。

欢迎任何意见/建议/评论。

标签: pythonstatisticsnormalizationpca

解决方案


推荐阅读