首页 > 解决方案 > python W/O正则表达式中的模式匹配

问题描述

为了规范段落,我面临查找和替换模式的挑战。举个例子更容易理解:我有很多词,例如:

等等。问题是我不喜欢这种自定义的正则表达式方法(我的意思是,每种情况我都需要一个正则表达式)。我需要一种“无人值守”的方法,例如发现一种模式是 myfileSOMETHING,另一种模式是 nmSOMETHING.tmp 等等。有什么 NLP 技术可以推荐给我吗?

谢谢!

标签: pythonnlppattern-matchingnltk

解决方案


根据您的描述,您不需要那么多正则表达式来解决这个问题。我的意思是,如果这是你的两种模式,你甚至可以去:(如果'para'是你的段落字符串)

import re
new_para = re.sub(r'myfile\S+|nm\S+', 'REPLACEMENT STRING', para)

那对你有用吗?


推荐阅读