首页 > 解决方案 > 当内部文本已知时,使用 Java 正则表达式从特定 HTML 标记内的属性中提取值

问题描述

我得到的 HTML 响应中有多个 HTML 标记,它们基本上是 Select Drop Down 中的值。当我知道 HTML 标记内的文本是下拉列表中选择的值的名称时,我需要获取特定属性的值。

例如。

<option value="01" id="01" >ABC</option>                        
<option value="02" id="02" >XYZ</option>  

像这样的多个选项标签。等等

我在变量中有值 ABC/XYZ,并且基于该变量,我需要使用 Regex 获取“值”属性中的值。而 Regex 是应该使用的唯一方法。

来自“值”标签的值是我需要获取的,如果它是 ABC 值标签下的全部数据也足够了。

我尝试使用下面的正则表达式,但这似乎在数据更改时给出了错误的结果。下面的表达式尝试从满足条件的选项标签返回全部内容。(?<=option)(?=[^#]*ABC)[^#]+(?=

标签: javaregexregex-negationregex-lookaroundsregex-group

解决方案


推荐阅读