首页 > 解决方案 > 检测文本中的多个延伸

问题描述

我正在做一些关于 NLP 的任务。所以,我需要检测文本中的多重延伸和单一延伸。

单伸长示例: simpleeeeeeeeeee

多重延伸示例: Gooooooddddddddd

我已经管理了以下代码来检测文本中的伸长率。

def find_total_elongations(str):
    regex = re.compile(r"(.)\1{2}")
    list = [word for word in str.split() if regex.search(word)]
    return len(list)

示例输入: Whyyyyyyyy arrrrrrreeeeee youuuuuuuu sooooooooooo serrrrrrrrrrriiiiiiious ?

样本输出:

单伸长:[“Whyyyyyyyy”,“youuuuuuuu”,“sooooooooooo”]

多重伸长率:["arrrrrrreeeeee","serrrrrrrrrrriiiiiiious"]

如何更改上述代码以分别检测多伸长和单伸长?

标签: pythonregex

解决方案


试着稍微改变一下:

\w*(.)\1{1}\w*

推荐阅读