java - Jsoup 移除父元素
问题描述
我想删除包含 app_paragraph 属性的标签。
但是不应该删除孩子。
代码
String url = "https://someurl";
Connection conn = Jsoup.connect(url);
Document html = conn.get();
Elements rawContent = html.select(".writing_view_box div[style]").last().children();
rawContent.select("#dcappheader").remove();
System.out.print(rawContent);
当前输出(原始内容)
<p></p>
<div app_paragraph="Dc_App_text_0" app_editorno="0">
<div>
Title
</div>
</div>
<p xss="removed"></p>
<div app_paragraph="Dc_App_Img_0" app_editorno="1">
<img src="image_src">
</div>
<p></p>
<div app_paragraph="Dc_App_text_1" app_editorno="2"></div>
期望输出
<p></p>
<div>
Title
</div>
<p xss="removed"></p>
<img src="image_src">
<p></p>
解决方案
推荐阅读
- ember.js - Ember Power Select 问题
- javascript - Using D3 and blobs to render svg to image
- android - 如何使用 ADB shell 从串行端口读取和显示数据?
- bash - How to compare percent file size in an if
- jquery - how to disable dropdowns as default on radio button which checked first?
- powershell - 命令提示符不执行 powershell 脚本
- containers - How to implement service discovery in AWS ECS?
- android - 在Android中,是否可以在复合设备上获得接口2中的类的权限
- python - 尝试创建一个函数,该函数返回列表中奇偶数的元组
- excel-formula - Excel:用一串文本替换缩写