python - 如何对包含几个单词的字符串的分类列进行一次性编码?
问题描述
我正在使用 Python 来解决分类问题。我想对当前结果为字符串的列进行一次热编码。下面是我正在寻找的一个例子。如果该列中的一行有一个包含“bleu cheese”的字符串,我想将其编码为 0。对于所有其他结果,我想将其编码为 1。我不想要多个列。我只想保留一列。
Dressing Salad
0 Bleu Cheese Spinach
1 Thick Bleu Cheese Chicken
2 Ranch Chicken
3 Italian Taco
我希望它看起来像这样
Dressing Salad
0 0 Spinach
1 0 Chicken
2 1 Chicken
3 1 Taco
任何想法将不胜感激。
解决方案
您可以使用这样的Pandas
库来执行此操作:
data_dressing = pd.get_dummies(data['dressing'])
或者使用Series
这样的东西:
data['dressing'] = pd.Series([1 if 'bleu cheese' in i else 0
for i in data['dressing']], index=data.index)
推荐阅读
- python - 如何在张量流中为 nlp 编码文本
- ios - 无法从私有 cocoapods 框架访问故事板和视图控制器文件
- android - 在后台颤振测距信标 - Android 8.0
- wordpress - WordPress 可疑访问
- python - 远程套接字 ssh 连接?
- javascript - 如何使用 javascript 在表单输入值中编写 cookie?
- javascript - 上传到dropzone(dropzone.js)的图片使用cropper.js进行裁剪,但发布时不显示裁剪的图片
- python - Clickhouse - 数据转换/解析
- javascript - 如何对使用 Node.js 和 Yeoman 创建的 Javascript Office 插件 (OneNote) 进行故障排除?
- android - Android kotlin 使用 ViewModelFactory 将动态参数/参数传递给 ViewModel