首页 > 解决方案 > 使用 Python 下载打开的 PDF

问题描述

我正在开发一个程序,该程序将利用 Selenium/Webdriver 打开网页,输入一些数据,然后打开一个 PDF 新页面。最终,我想将该 PDF 下载到一个文件夹中。我知道如果您的脚本中有 URL,则可以将 PDF 下载到文件夹中,但是如果在程序中打开它,我正在努力寻找下载它的方法。

A) 有没有办法下载使用脚本在 Chrome 中显式打开的 PDF?B)有没有办法从打开的网页中提取 URL,然后反馈到程序中下载?

标签: pythonseleniumselenium-webdriver

解决方案


当我在做一个 selenium 项目时,我遇到了类似的问题。

我会单击指向 PDF 文件的链接,但不会下载,selenium chromedriver 只会在新选项卡中打开它。

解决我的问题的是,在我开始新的 chromedriver 会话后,我手动禁用了此功能:

  1. 在您的 Chrome 设置中,转到Privacy and Securtiy
  2. 选择Site Settings
  3. 向下滚动并单击其他首选项
  4. 查找名为“PDF 文档”的部分
  5. 打开“下载 PDF 文件而不是在 Chrome 中自动打开它们”选项

现在,您单击的任何 PDF 链接都将下载文件,而不是在新选项卡中打开它们。请注意,每次启动新的 chromedriver 时都需要执行此操作。在您的主 Chrome 应用程序中更改此设置将无济于事。


推荐阅读