首页 > 技术文章 > 正则匹配所有的a标签

kimshen 2017-07-04 08:18 原文

<a\b[^>]+\bhref="([^"]*)"[^>]*>([\s\S]*?)</a>

分组1和分组2即为href和value

解释:

<a\b                        #匹配a标签的开始

[^>]+                       #匹配a标签中href之前的内容

\bhref="([^"]*)"        #匹配href的值,并将匹配内容捕获到分组1当中

[^>]*>                     #匹配a标签中href之后的内容

([\s\S]*?)                #匹配a标签的value,并捕获到分组2当中,?表示懒惰匹配

</a>                       #匹配a标签的结束

推荐阅读