首页 > 解决方案 > 使用 groupby 对多个数据框列进行上采样?

问题描述

有没有办法先按组分组,然后对教育和收入进行上采样(以便以新数据框出现相同/在教育和收入之间平衡的方式复制行)?



df = pd.DataFrame({'group': [1,2,2,1,2,2],
                   'X1':[10,11,30,10,30,8],
                   'X2':[0.2,0.3,0.2,0.2,0.8,0.1], 
                   'education':[2,0,2,2,0,2], 
                   'income':[3,2,6,1,2,1]})

输出将具有相等的类数(平衡):

   group  X1   X2  education  income  
       1  10  0.2          0       3   
       1  10  0.2          0       3   
       1  10  0.2          0       1   
       1  10  0.2          0       1   
       2  11  0.3          2       2   
       2   8  0.1          2       2   
       2  30  0.2          2       6   
       2  30  0.8          2       6   

标签: pythondataframepandas-groupby

解决方案


推荐阅读