首页 > 解决方案 > 一个字符在数据框表单的文本中出现多少次

问题描述

我是 NLP 的初学者,我有一个具有以下形式的数据框

text                         label 
----                        -----
This is he # first text     first label
This is the # second text   second label 
....                         ....

我想计算这个数据框中的字符“#”被读取了多少次。请你帮助我好吗?我正在寻找一个通用代码,我可以计算“#”或其他字符或单词。

标签: pythonnlp

解决方案


也许这不是最好的答案:

def count(text, target):
    words = text.split()
    counter = 0
    for word in words:
        if word == target:
            counter += 1
    return counter
df['counter'] = df.apply(lambda row: count(row['text'], target="#"),axis=1)
sum(df["counter"])

推荐阅读