首页 > 解决方案 > 为什么 Splash 没有返回与我检查网站时相同的 HTML?

问题描述

所以我试图从这个网站获取 html(注意它是一个互联网存档链接)。在浏览器上检查网页时,您可以看到表格的每一行都是div具有类的元素ReactVirtualized__Table__row tableRow___3EtiS 但是当我在启动时(在我的浏览器中)运行一个非常简单的 LUA 脚本以从该网站获取 html 时,我得到了一些非常不同的东西不包含ReactVirtualized__Table__row tableRow___3EtiS. 这是我的代码:

function main(splash, args)

    url = args.url
    assert(splash:go(url))
    assert(splash:wait(1))
    return splash:html()

end

有谁知道这是为什么以及如何解决它?谢谢!


ps:我知道你不需要splash来获取这个特定的html,这只是问题的最基本版本,不需要过于复杂。

标签: luascrapyscrapy-splash

解决方案


推荐阅读