python - 在同一单元格上具有多个类的列上的 Sklearn 编码
问题描述
假设我有以下 DataFrame:
Column
0 A - B - C
1 A - B
2 A - C
3 A
4 B
5 C
我想对“列”进行编码,但我在同一个单元格中有多个类。使用 pandas 我可以执行以下操作来获得正确的编码输出:
df['Column'].str.get_dummies(sep=' - ')
A B C
0 1 1 1
1 1 1 0
2 1 0 1
3 1 0 0
4 0 1 0
5 0 0 1
如何使用 Sklearn 进行相同的转换?
解决方案
另一种方法是使用 MultiLabelBinarizer 类,因为它支持可迭代作为输入。
df['Column'] = df['Column'].str.split(' - ')
enc = MultiLabelBinarizer()
enc.fit_transform(df['Column'])
推荐阅读
- javascript - 如何将 .then .catch 转换为 async/await
- java - 位置更新提供用于计算距离的随机数
- variables - 将 4 维变量转换为 3 维变量 netcdf
- r - Colsums使用r中列表中索引的循环
- javascript - 打字稿承诺导致代码静默崩溃
- c - GetMessageW 正在阻塞调用线程,没有收到任何消息
- c++ - 使用 memcpy 从二维数组中复制一系列元素
- r - 无法为 R 中的列表替换 NA 的错字
- oauth-2.0 - AAD v2.0:无法将 .default 范围与设备代码流一起使用
- java - Java OverlayLayout 项目排列问题