kotlin - 如何选择性地提取 HTML 标记中的数据
问题描述
我正在尝试使用 Jsoup 从一个看起来像的列表元素中提取数据
<li>"Peanut"<span>FREE</span></li>
现在,当我试图提取它时,我得到的是“Peanut FREE”,而我想要的是“Peanut”。
如何在 Jsoup 中做到这一点?
这是我的代码
val url = "..."
val document = Jsoup.connect(url).get()
val body = document.body()
val elements = body.getElementsByTag("li")
Log.d("TAG_TAG_TAG", "Noo")
for (i in elements) {
Log.d("TAG_TAG_TAG", i.text())
}
解决方案
尝试
val body = document.body()
val elements = body.select("li")
elements.select("span").remove()
for (i in elements) {
println(i.text())
}
推荐阅读
- scala - 在 `LabelledGeneric` 等中使用 `String` 而不是 `Symbol`
- ios - wkWebView 加载请求失败,错误域=NSURLErrorDomain 代码=-999
- c# - Wacom Signature SDK 重新设计按钮
- javascript - 异步行为。递归 setTimeout 未完成
- firebase - Firebase 检查部署的文件
- rust - 为什么我的 actix 主管不重试停止的演员?
- sql - 将查询结果与表进行比较并检索特定字段
- php - $loader = new loader($registry) classloader' not found in
- json - Ansible RAW 模块 - Curl 和 JSON 文件 (Kubernetes)
- javascript - javascript:history.go(-1) 不适用于 IE 和 Chrome