python - 检测文本中的多个延伸
问题描述
我正在做一些关于 NLP 的任务。所以,我需要检测文本中的多重延伸和单一延伸。
单伸长示例: simpleeeeeeeeeee
多重延伸示例: Gooooooddddddddd
我已经管理了以下代码来检测文本中的伸长率。
def find_total_elongations(str):
regex = re.compile(r"(.)\1{2}")
list = [word for word in str.split() if regex.search(word)]
return len(list)
示例输入: Whyyyyyyyy arrrrrrreeeeee youuuuuuuu sooooooooooo serrrrrrrrrrriiiiiiious ?
样本输出:
单伸长:[“Whyyyyyyyy”,“youuuuuuuu”,“sooooooooooo”]
多重伸长率:["arrrrrrreeeeee","serrrrrrrrrrriiiiiiious"]
如何更改上述代码以分别检测多伸长和单伸长?
解决方案
试着稍微改变一下:
\w*(.)\1{1}\w*
推荐阅读
- android - 初始化后如何修改 Kotlin Coroutine Flow 的值?
- python - 如何使用 MatPlotLib 绘制分组数据?
- javascript - 如何识别一个 YouTrack 工作流程是否由另一个工作流程触发
- sql - SQL - 查找与多个/可变表变量行的组合关联的外键 ID
- javascript - JS | Switch 语句 | 如何创建密码
- angular - 如何使用角度模式验证空格之间的连字符
- database - 略有不同实体的数据库架构
- google-sites - Google 网站无法正确访问外部网址
- android - Cardview - 透明背景的圆角
- python - 如何使用 Pytesseract 文本识别改进 OCR?