首页 > 解决方案 > 使用正则表达式获取表中的所有内容 (html)

问题描述

"<td style="text-align: center; background-color: #20c41d"><a href="http://bugbuster.fronius.com:8080/job/Platforms/job/Coyote/job/ExecutedTests/job/DM-HM-Coyote%20UpdateHelper/581/">581</a></td>"

你好,有人可以帮我用这个表的正则表达式。

我想要的是获取其中的所有内容,例如,在这段代码中,我想要 0, Testing123, 0, 0, No Results

我试过了

<td>(.*?)<\/td>

这只在确切的短语 td 内给了我所有内容 - 有没有办法制作正则表达式,所以即使有 <a href 或其他任何东西,我也能得到一切

标签: regex

解决方案


您可以使用此正则表达式:

<([^\/<> ]+)(?: [^<>]*)?>([^<>]+)<\/\1>

< Group#1(没有“/<>”的东西空间?一些参数> 组#2(数据 </匹配组#1 >

捕获组 #1 包含 a、td、span 或任何其他标记

捕获组 #2 包含您想要的数据

使用您的数据,组 #1 匹配:

a
td
span
span
span

和第 2 组比赛:

0
Testing123
0
0
No Results

推荐阅读