首页 > 解决方案 > 如果节点值包含类似,则 JSOUP 无法将 html 字符串解析为文档

问题描述

尝试通过 JSoup 将 HTML 字符串转换为文档,并以无效的 XML 字符失败。

当用户从 Outlook 复制电子邮件地址时,可能会发生此错误。

看起来,如果带有特殊字符的文本以 > 开头,JSoup 可能会失败。例如,<test@>,<test!>。

<html>
<table>
<tr>
   <td>
        <test@test.com>
   </td>
 </tr>
</table>
</html>

任何想法,可以使这个工作?

标签: javajsouphtml-parsing

解决方案


推荐阅读