python - python W/O正则表达式中的模式匹配
问题描述
为了规范段落,我面临查找和替换模式的挑战。举个例子更容易理解:我有很多词,例如:
- nm5638238.tmp、nm23345.tmp、nm56382334.tmp等
- myfile0x233454、myfile0x233124、myfile0x23AW54 等
等等。问题是我不喜欢这种自定义的正则表达式方法(我的意思是,每种情况我都需要一个正则表达式)。我需要一种“无人值守”的方法,例如发现一种模式是 myfileSOMETHING,另一种模式是 nmSOMETHING.tmp 等等。有什么 NLP 技术可以推荐给我吗?
谢谢!
解决方案
根据您的描述,您不需要那么多正则表达式来解决这个问题。我的意思是,如果这是你的两种模式,你甚至可以去:(如果'para'是你的段落字符串)
import re
new_para = re.sub(r'myfile\S+|nm\S+', 'REPLACEMENT STRING', para)
那对你有用吗?
推荐阅读
- android - 如何仅监视静态 html 以了解网页中的更改
- c# - C# - 调用 Form.Show() 方法非常慢
- excel - 根据用户窗体自动填充单元格区域
- javascript - 加载javascript而不是解析源
- javascript - 为什么 .NET Framework 不将 javascript 文本日期绑定到 C# DateTime?
- java - 在 Spring Initializr Gradle 项目中启用 Vaadin 流生产模式
- makefile - 关于 Make 的一些基本问题:用图形编制报告
- c - 将双指针传递给 C 和 C++ 中的函数的区别
- java - Java/Swing JButton 不显示其文本并且不执行其操作
- fortran - 读取列具有特定格式的文本文件