python - 如何将新列添加到具有 0 和 1 值的特定列的值的数据框中
问题描述
我在数据框中有一列,其值为 XS、S、M、L、XL 和 XXL。我想要的是在数据框中有 6 个新列,分别为 XS、S、M、L、XL 和 XXL,并且每个列都有一个从该列引用的二进制值。这可能吗?
我参加了一个讲座,讲师使用了与此类似的东西,但我无法真正了解她是如何做到的,或者方法是什么。
任何帮助,都将不胜感激。
解决方案
我认为您要查找的内容称为One Hot Encoding。
使用 scikit-learn 非常容易实现。只需尝试以下操作:
df = pd.get_dummies(df, prefix=['SIZE'], columns=['SIZE'])
在这里你必须先导入 sci-kitlearn。'pd' 也是您拥有 SIZE 列的数据框。搏一搏。
推荐阅读
- python - 如何在 Python 的父方法中引用子方法?
- java - 在java中验证字符串时如何结合isEmpty、isBlank和null检查
- docker - 使用 Docker 开始使用学位服务器
- angular - 从材料表中删除任何用户会重置页码
- python-3.x - Pandas 按单个字符拆分值,并在需要时将第一个拆分的部分与第二个拆分连接
- php - PHP/Symfony 在 Docker 设置中非常慢
- python - 使用 PySpark 从 Microsoft SQL 查询中提取值并将其设置为变量?
- java - System.currentTimeMillis() 在 Kotlin Springboot 应用程序中返回 0L
- python - Ableton Live 11 远程脚本 Python3,If 语句未捕获空列表
- javascript - 使用immer时如何更新reducer中的状态(初始状态)对象?