首页 > 解决方案 > 我有一个数据集,其列是单词。如何将相同的列相互添加?

问题描述

我有一个数据集,其特征是单词。这些词如“see”、“saw”、“go”、“play”等。我尝试做一些预处理,比如在列中提取词干。我想将相同或相同含义的列相互添加,然后删除添加的列. 像下面

例如,我有一个数据集,例如,

   see  go  see
0   0   0    1
1   2   1    3
2   0   1    1
3   0   0    0

我想将一个“看到”添加到另一个“看到”,然后删除其中一个,如下所示,

   see  go  
0   1   0    
1   5   1    
2   1   1    
3   0   0   

我怎样才能做到这一点?

标签: pythonpandas

解决方案


df.groupby(lambda x:x, axis=1).sum()



   go  see
0   0    1
1   1    5
2   1    1
3   0    0

推荐阅读