首页 > 解决方案 > 用于捕获 HTML 元素中的属性值的正则表达式

问题描述

我在使用正则表达式提取 html 标记中的文本时遇到问题。

我想从以下 html 代码中提取文本。

<a href="http://google.com/" target="_self" title="TEXTDATA" class="encyclopedia">Google</a>

结果:

TEXTDATA

我只想提取文本TEXTDATA

我已经尝试过,但我没有成功。

标签: htmlregexhtml-parsingregex-greedyhtml-parser

解决方案


使用这个正则表达式:

title=\"([^\"]*)\"

请参阅: 正则表达式


推荐阅读