首页 > 解决方案 > 如何规范化 Pandas 中一列是分类的数据范围?

问题描述

我一直在尝试预处理一组数据,但由于其中一个列具有分类值,我无法获得正确的值。

数据类型示例

执行标准化后,我得到了教育学位类别的值。 归一化结果

有没有更好的选择来处理这个问题或任何替代方案来使结果更好?

标签: pythonpandasnormalizationscalingpreprocessor

解决方案


只需创建一个必须从数据框中标准化的列列表。

cols = ['A','B']
for col in cols:
  df[col] = (df[col]-df[col].min())/(df[col].max()-df[col].min())

推荐阅读