python - 我有一个数据集,其列是单词。如何将相同的列相互添加?
问题描述
我有一个数据集,其特征是单词。这些词如“see”、“saw”、“go”、“play”等。我尝试做一些预处理,比如在列中提取词干。我想将相同或相同含义的列相互添加,然后删除添加的列. 像下面
例如,我有一个数据集,例如,
see go see
0 0 0 1
1 2 1 3
2 0 1 1
3 0 0 0
我想将一个“看到”添加到另一个“看到”,然后删除其中一个,如下所示,
see go
0 1 0
1 5 1
2 1 1
3 0 0
我怎样才能做到这一点?
解决方案
df.groupby(lambda x:x, axis=1).sum()
go see
0 0 1
1 1 5
2 1 1
3 0 0