java - 如果节点值包含类似,则 JSOUP 无法将 html 字符串解析为文档
问题描述
尝试通过 JSoup 将 HTML 字符串转换为文档,并以无效的 XML 字符失败。
当用户从 Outlook 复制电子邮件地址时,可能会发生此错误。
看起来,如果带有特殊字符的文本以 > 开头,JSoup 可能会失败。例如,<test@>,<test!>。
<html>
<table>
<tr>
<td>
<test@test.com>
</td>
</tr>
</table>
</html>
任何想法,可以使这个工作?
解决方案
推荐阅读
- javascript - Promise.all 导致 Jest 显示 UnhandledPromiseRejectionWarning
- python - 使用 XPath 在内部属性中接收数据
- tensorflow - 将神经网络拆分为 2 个微服务
- python - 如何使用 Graph API 和用户令牌抓取 Facebook 数据?
- python - 理解模块/包的问题
- r - 在 R Shiny with Leaflet 中选择多个过滤器选项的问题
- laravel - Laravel 路由组问题(空白页)
- node.js - 在 chrome 扩展启动时加载最后查看的页面
- shell - 在awk中处理两个文件中的打印内容
- angular - 在 Angular 中显示 formControlName 的验证消息