首页 > 解决方案 > 使用 JSOUP 从另一个网站获取数据

问题描述

基本上,我需要一张包含所有可能存在的书籍的桌子,我不想这样做,因为我是一个非常懒惰的人 xD。所以,我的问题是..我可以使用一个我想到的网站,就像切断这个网站的其余部分(我不需要)并只留下搜索部分(也许做一些改变布局)...然后,进行搜索,找到这本书并在我的数据库中仅存储对我有意义的数据。那可能吗?我听说 JSOUP 可以提供帮助。所以,我只是想要一些提示。(感谢阅读)。

网站:http ://www.isbn.bn.br/website/consulta/cadastro

标签: javajsoup

解决方案


是的,您可以使用 Jsoup 执行此操作,主要问题是您共享的 URL 使用 JavaScript,因此您需要使用 Selenium 强制执行 JS,或者您还可以获取图书 URL 并对其进行解析。

使用 Jsoup 解析网页的方法是:

Document document = Jsoup.connect("YOUR-URL-GOES-HERE")
                         .userAgent("Mozilla/5.0")
                         .get();

您在 Document 中检索整个 HTML,因此您可以使用 CSS 选择器获取 Element 中包含的任何元素,例如,如果您想在 HTML 中检索 Web 的标题,您可以使用:

Elements elements = document.select("title");

对于您要从中检索信息的每个 HTML 标记。您可以查看 Jsoup Doc 并查看一些解释的示例:Jsoup

我希望它对你有帮助!


推荐阅读