首页 > 解决方案 > 如何使用 Jsoup 获取 HTML?

问题描述

如何像这样获取网站的所有 HTML:https ://www.ranker.com/crowdranked-list/the-best-movies-of-all-time

 Document doc = Jsoup.connect(url).get();

这段代码只给了我加载电影的第一部分(从第 1 到第 25 位)。向下滚动后如何获取所有显示的内容?

标签: htmlweb-scrapingjsoup

解决方案


首先只有前 25 个HTML 中。稍后使用 JavaScript 将其动态添加到页面中。

如果您想要其他人,那么您需要将 Jsoup 替换为将执行 JavaScript 的工具,或者您需要对 JavaScript 进行逆向工程并复制它的功能。


推荐阅读