首页 > 解决方案 > 如何将新列添加到具有 0 和 1 值的特定列的值的数据框中

问题描述

我在数据框中有一列,其值为 XS、S、M、L、XL 和 XXL。我想要的是在数据框中有 6 个新列,分别为 XS、S、M、L、XL 和 XXL,并且每个列都有一个从该列引用的二进制值。这可能吗?

我参加了一个讲座,讲师使用了与此类似的东西,但我无法真正了解她是如何做到的,或者方法是什么。

任何帮助,都将不胜感激。

标签: pythondataframe

解决方案


我认为您要查找的内容称为One Hot Encoding

使用 scikit-learn 非常容易实现。只需尝试以下操作:

df = pd.get_dummies(df, prefix=['SIZE'], columns=['SIZE'])

在这里你必须先导入 sci-kitlearn。'pd' 也是您拥有 SIZE 列的数据框。搏一搏。


推荐阅读