首页 > 解决方案 > 如何删除重复三次或更多次的单词中的替换

问题描述

我正在使用文本数据进行预处理。有些单词的字母重复了,我必须更正它们。
例如下面的句子:

sentence = 'likeeeee sooooo looovvve hmmmmmmm'

必须改为:

sentence = 'like so love hm'

任何人都可以帮忙吗?

标签: pythonstring

解决方案


您可以像这样使用正则表达式和前瞻。随时提出任何问题,我会尽力提供帮助。

import re

s = 'likeeeee sooooo looovvve hmmmmmmm'
print(re.sub(r"(.)(?=\1)","",s))

推荐阅读