python - 一个字符在数据框表单的文本中出现多少次
问题描述
我是 NLP 的初学者,我有一个具有以下形式的数据框
text label
---- -----
This is he # first text first label
This is the # second text second label
.... ....
我想计算这个数据框中的字符“#”被读取了多少次。请你帮助我好吗?我正在寻找一个通用代码,我可以计算“#”或其他字符或单词。
解决方案
也许这不是最好的答案:
def count(text, target):
words = text.split()
counter = 0
for word in words:
if word == target:
counter += 1
return counter
df['counter'] = df.apply(lambda row: count(row['text'], target="#"),axis=1)
sum(df["counter"])
推荐阅读
- python - 使用 Python 从电子商务 Ajax 站点抓取 JSON 数据
- ruby-on-rails - Rails - 基于路由名称的路由重定向
- plsql - 子查询在 PL/SQL 存储过程中连续返回多个
- asp.net-core - EF Core 如何在类实例中获取 DBContext?
- c++ - 为什么在头文件更改时 CMake 构建不会开始构建
- javascript - React / Redux - 发送多个补丁请求 onBlur
- javascript - 如何修复重叠的地图标记?
- security - Thorntail MP JWT / Undertow:需要身份验证
- python - Python networkx 图标签
- vue.js - 使用 v-bind 和 v-on 代替 v-model vuejs