javascript - 网页抓取:Servlet
问题描述
我正在尝试从网站(JS)下载一个 zip 文件,现在我使用 selenium 来做到这一点,我做了以下丑陋的 python 脚本:
base_url = "https://agreste.agriculture.gouv.fr/agreste-web/disaron/SAANR_DEVELOPPE_2/detail/"
driver.get(base_url)
driver.find_element_by_xpath("/html/div/div/div[2]/div/button[2]").click()
driver.find_element_by_xpath("/html/body/form/div[2]/div/div[1]/div[2]/div/div/section/div/div[3]/div/article/div/div[1]/div").click()
driver.find_element_by_xpath("/html/body/form/div[2]/div/div[1]/div[2]/div/div/section/div/div[3]/div/article/div/div[2]/div/table/tbody/tr/td[3]/a").click()
有没有办法实现相同的结果,但不必用 selenium 模拟 Web 浏览器?
我试图找到一个底层服务器,但似乎链接生成了一个我不太了解的 JS servlet。
任何帮助将不胜感激。
谢谢,
解决方案
推荐阅读
- python - 如何在几个 Numpy 数组的特定索引处查找和提取值?
- pandas - 如何在熊猫数据框中用今天的日期填充空数据?
- captcha - 简单的验证码解决
- git - linguist-vendored 和 linguist-language 在 .gitattributes 文件中不起作用
- sql - 使用选择查询的结果作为交叉表中的列定义列表
- javascript - 滚动到该部分时如何使我的导航栏链接处于活动状态?
- java - 无法从 SimpleIntegerProperty 转换为 Property
- php - 会话未在 PHP 7.4 中开始,但相同的代码在 PHP 7.1 中有效
- c++ - 为什么我的程序没有做适当的对角线差(C++)?
- php - 如何使用 PayPal 智能按钮在商品缺货时显示已售罄消息