首页 > 解决方案 > 如何在 pandas 数据框中从 4 个级别创建两个 bin?

问题描述

我在数据框中的一列pandas如下所示。我想将我的“女儿”列装箱,这样带有 0 的行将收到“无”标签,而包含 1、2、3、4 的行将收到“一些”标签。

包含列的当前数据集

Daughter
0
0
1
2
4
3

预期输出:

Daughter Daugther_fact
0         None
0         None
1         Some
2         Some
4         Some
3         Some

我是python的新手。我知道我必须使用pd.cut来分配我的标签,但我不知道如何实现这一点。任何帮助表示赞赏!

标签: pythonpandas

解决方案


进口pandasnumpy第一。

import numpy as np
import pandas as pd

请您尝试以下操作。

m=df['Daughter']!=0
df['Daughter_fact']=np.where(m,"Some","None")
df

当我们打印时df,输出将如下所示。

  Daughter  Daughter_fact
0  0         None 
1  0         None 
2  1         Some 
3  2         Some 
4  4         Some 
5  3         Some 

推荐阅读