python - 列中具有多个标签的一种热编码
问题描述
我有一个简单的数据集。
id,question,category,tags,day,quarter,group_id
1,What is your name,Introduction,Introduction,1,3,0
2,What is your name,Introduction,"Introduction, work",1,3,1
现在,如果您看到,在该tags
列中有多个用逗号分隔的输入。如果我尝试使用pandas get_dummies
函数进行一次热编码,我会将其作为单列获取。但我想为每个标签创建列。我怎么可能做到这一点?
解决方案
我相信需要str.get_dummies
:
df1 = df['tags'].str.get_dummies(', ')
print (df1)
Introduction work
0 1 0
1 1 1
推荐阅读
- excel - 获取运行时 1004:使用单元格时对象“_Worksheet”的方法“范围”失败
- c++ - 致命错误:无法打开文件'-c=':没有这样的文件或目录(SPP,phantompeakqualtools)
- java - 使用单个流数据实现多种功能的 Java 函数式编程
- javascript - 如果第一个方法在 Javascript 中返回 false,则不要调用第二个方法
- mongodb - 为什么 $lookup 中的“as”正在替换整个集合?
- javascript - 我的函数调用不返回值
- c# - 我可以在unity2d中使用c#只使用一个键吗?
- python - 如何将变量从一个 python 脚本传递到另一个?
- android - 如何在 MotionLayout 中运行特定的过渡?
- plugins - RHEL8 (CentOS8):使用 perl 编译 nagios-plugins 错误