首页 > 解决方案 > 网页抓取:Servlet

问题描述

我正在尝试从网站(JS)下载一个 zip 文件,现在我使用 selenium 来做到这一点,我做了以下丑陋的 python 脚本:

base_url = "https://agreste.agriculture.gouv.fr/agreste-web/disaron/SAANR_DEVELOPPE_2/detail/"
driver.get(base_url)
driver.find_element_by_xpath("/html/div/div/div[2]/div/button[2]").click()
driver.find_element_by_xpath("/html/body/form/div[2]/div/div[1]/div[2]/div/div/section/div/div[3]/div/article/div/div[1]/div").click()
driver.find_element_by_xpath("/html/body/form/div[2]/div/div[1]/div[2]/div/div/section/div/div[3]/div/article/div/div[2]/div/table/tbody/tr/td[3]/a").click()

有没有办法实现相同的结果,但不必用 selenium 模拟 Web 浏览器?

我试图找到一个底层服务器,但似乎链接生成了一个我不太了解的 JS servlet。

任何帮助将不胜感激。

谢谢,

标签: javascriptpythonseleniumweb-scraping

解决方案


推荐阅读