python - 如何对熊猫数据框进行字数统计
问题描述
我知道这可能很愚蠢,但是我为这个问题所做的每一项研究都导致了更复杂的问题,我仍然无法弄清楚基础知识,我只想计算单词的频率
这是我的数据
id descriptions
1 I love you
2 I love you too
这是我的预期输出
id descriptions word count
1 I love you 3
2 I love you too 4
解决方案
利用:
df['count'] = df['descriptions'].str.count(' ') + 1
或者:
df['count'] = df['descriptions'].str.split().str.len()
或者:
df['count'] = df['descriptions'].str.findall(r'(\w+)').str.len()
print (df)
id descriptions count
0 1 I love you 3
1 2 I love you too 4
推荐阅读
- rust - 如何从函数返回当前工作目录?
- python - python程序将十六进制值转换为ASCII字符串
- html - 当我使用 @ViewChild 在 Angular 组件之间共享布尔数据时,我得到未定义的属性
- git - '你的分支在 'origin/remote-branch' 之前 37 提交。' 合并后
- c - 这个删除链表的功能是否正确?
- loops - Ansible:强化列表以填充字典
- python - IB Python API - 下订单
- html - jQuery获取文本区域的内容
- elasticsearch - 确保在繁重的搜索负载麋鹿下的最小功能
- sql-server - 如何在 SQL 中为 EF Core 中的 RLS 设置会话上下文