首页 > 解决方案 > 如何使用正则表达式匹配 Java 中的 HTML 标记内容

问题描述

我想要完成的事情:

我想匹配评论之外的某些明确内容。

一个例子:

<div>
    <div>Hello $world$</div>
    <div>Another text <!-- $example$--></div>   
</div>
<div>
    How are $you$?
</div>
<!-- 
<div>
    Lorem ipsum $dolor$ sit
</div>
-->

我想匹配的词: $world$ ,$you$

我不想匹配的话: $example$ ,$dolor$

到目前为止,我只能匹配全部或不匹配。

我不能做的:

我无法删除所有评论,因为它需要提供我过滤的源代码。

标签: javaregex

解决方案


我不知道你的代码来自哪里,但你需要将你的页面读入一个字符串或字符串 [],然后在它上面运行一个正则表达式来提取你想要过滤的字符串。

如何在java中使用带有正则表达式的流:

如何创建正则表达式匹配流?

如何在java中使用正则表达式:

https://www.tutorialspoint.com/java/java_regular_expressions.htm

在部署它之前测试你的正则表达式:

https://regexr.com/


推荐阅读