首页 > 解决方案 > 使用java从xml文件中读取html标签

问题描述

我正在使用 xml 解析器 (DocumentBuilderFactory) 来解析我的 Java 代码中的 xml 数据(从 API 调用获得的 I/p)。我在要保留的 xml 节点中有一些 html 标签(样式信息),但解析器通过将它们视为 xml 标签并读取它们之间的文本内容来忽略这些标签。

例如:

<xmltag1 type="">
<div id=""> 
<p> text content1 </p>
</div>
</xmltag1>

当我解析上面的 xml 节点“xmltag1”时,我只能读取“text content1”,尽管 html 标记包含在 xml 标记之间。请帮忙。

PS:我对 i/p(xml 数据)没有任何控制权,所以我不能使用 CDATA 部分。

标签: javahtmlxml-parsing

解决方案


推荐阅读