python - 从每个单元格中提取类别并对其进行编码
问题描述
我需要对 column1 的值进行编码。我知道 dtype 何时是分类的,或者它只有一个值。但是对于这种情况,我该怎么办?
Column1 x_val y_val z_val
x; y 1 1 0
y;z;x 1 1 1
x 1 0 0
z;x 1 0 1
x 1 0 0
NaN ? ? ?
注意:x_val、y_val、z_val 是所需的列
解决方案
使用pandas.Str.get_dummies
:
new_df = df["Column1"].str.get_dummies(";").add_suffix("_val")
new_df.loc[~new_df.any(1)] = '?'
print(new_df)
输出:
x_val y_val z_val
0 1 1 0
1 1 1 1
2 1 0 0
3 1 0 1
4 1 0 0
5 ? ? ?
推荐阅读
- f# - 为什么在这种情况下在 F# 中使用引用
- swift - 如何在类内设置计算值的绑定(SwiftUI)
- pyspark - 使用 pyspark 联合 Delta Lake 表
- javascript - 自动滚动到自动完成中的特定选项
- python - 即使我在运行代码后有一个结束条件,我的循环也会无休止地运行
- python - x.reshape([1,28,28,1]) 重塑意义
- api - BigCommerce 通过电子邮件收到的密码重置链接需要通过 Headless App 用于通过 API 调用重置密码吗?
- linux - 从 nginx 日志文件中提取 IP 和引用的简单方法
- javascript - MongoDB Date.now() 格式不同于新的 Date(string) 格式
- laravel - 带有 swoole 身份验证的 laravel 返回 null