regex - 正则表达式从文本中删除所有引用部分?
问题描述
我有一个电影剧本,我需要删除所有引号,因此人们在说什么的部分,fe:“Martin:”。有人知道我应该使用哪个正则表达式吗?
我正在使用脚本语言 Perl。所以我的输入是一个完整的电影剧本。我想要的输出是那个电影剧本,但没有人们谈话的部分。所以“马丁:我饿了。” 应该变成“我饿了”。
我在查找栏中尝试了“\w+\b:”,但它选择了所有带有 : 的实例。我尝试使用 ^ 来标记行的开头,但它给出了错误。
Hower 名称并不总是单一名称。例如,他们也可以是童子军领袖或孩子 #1。
解决方案
你可以试试这个
^"[\w\s\d#]+:\s*
解释
^
- 匹配字符串的开头。
"[a-zA-Z][\w\s\d#]+:
- 匹配"
后跟一个或多个字母或空格或数字或#
后跟:
.
- \s*
- 匹配零个或多个空格字符。
推荐阅读
- reactjs - CORS 缺少允许带有 login_required Django 的来源
- stata - 在不破坏数据的情况下在 Stata 中重新编码分类变量的级别
- c# - 根据添加到 ApplicationUser 的 Locked 属性授权对控制器的访问
- dns - Okhttp dns 缓存失效
- r - 在 R 中将长格式面板数据转换为宽格式
- google-cloud-platform - 未经授权的用户被添加到 GCP 角色
- svelte - 无需覆盖的 Svelte 存储和临时变量
- python - 未找到模块错误:没有名为“pyperclip”的模块
- javascript - 如何对成对应用过滤器?
- python-3.x - 循环遍历数据类并填充值