首页 > 解决方案 > 提取里面的文字

使用 jsoup 的多个标签

问题描述

我正在尝试提取给定元素内的文本

<div class="PuzzleDetails-date--1HNzj"><span>Sunday </span>"February 17, 2019"</div>

为此,我使用下面给出的代码:

Elements dates = document.select("div.PuzzleDetails-date--1HNzj");
for (Element date : dates) {
    System.out.println("Date: " + date.text());
}

但是,我没有看到任何输出。我想看到这样的输出:

日期:2019 年 2 月 17 日星期日

标签: javahtmljsoup

解决方案


尝试

div[class='PuzzleDetails-date--1HNzj']

String s ="<div class=\"PuzzleDetails-date--1HNzj\"><span>Sunday </span>\"February 17, 2019\"</div>";
Document doc = Jsoup.parse(s);

Elements dates = doc.select("div[class='PuzzleDetails-date--1HNzj']");
System.out.println(dates.text());

输出:

Sunday "February 17, 2019"

推荐阅读