首页 > 解决方案 > 正则表达式:过滤掉以某个字符串开头的组

问题描述

我要解析的文本如下:

<p class="p p1"><strong>Analysts</strong></p>\n<p class="p p1">Mark Troman - BofA Merrill Lynch, Research Division</p>\n<p class="p p1">Ben Uglow - Morgan Stanley, Research Division</p>

使用reg = <p class="p p[1-9][0-9]{0,1}">(.+?)<\/p>,我可以得到两组:

但是,我想过滤掉以 开头<strong>和结尾的组</strong>,只保留 Ben Uglow - Morgan Stanley, Research Division

有没有办法重写正则表达式并在一行正则表达式中完成过滤?

标签: htmlregex

解决方案


我想过滤掉以

此正则表达式应仅匹配不包含的组<strong>

<p class="p p[1-9][0-9]{0,1}">([a-zA-Z0-9, -]+?)<\/p>


推荐阅读