首页 > 解决方案 > 如何对熊猫数据框进行字数统计

问题描述

我知道这可能很愚蠢,但是我为这个问题所做的每一项研究都导致了更复杂的问题,我仍然无法弄清楚基础知识,我只想计算单词的频率

这是我的数据

id descriptions
1  I love you
2  I love you too

这是我的预期输出

id descriptions      word count
1  I love you        3
2  I love you too    4

标签: pythonpandas

解决方案


利用:

df['count'] = df['descriptions'].str.count(' ') + 1

或者:

df['count'] = df['descriptions'].str.split().str.len()

或者:

df['count'] = df['descriptions'].str.findall(r'(\w+)').str.len()

print (df)
   id    descriptions  count
0   1      I love you      3
1   2  I love you too      4

推荐阅读