python - 使用 Python 下载打开的 PDF
问题描述
我正在开发一个程序,该程序将利用 Selenium/Webdriver 打开网页,输入一些数据,然后打开一个 PDF 新页面。最终,我想将该 PDF 下载到一个文件夹中。我知道如果您的脚本中有 URL,则可以将 PDF 下载到文件夹中,但是如果在程序中打开它,我正在努力寻找下载它的方法。
A) 有没有办法下载使用脚本在 Chrome 中显式打开的 PDF?B)有没有办法从打开的网页中提取 URL,然后反馈到程序中下载?
解决方案
当我在做一个 selenium 项目时,我遇到了类似的问题。
我会单击指向 PDF 文件的链接,但不会下载,selenium chromedriver 只会在新选项卡中打开它。
解决我的问题的是,在我开始新的 chromedriver 会话后,我手动禁用了此功能:
- 在您的 Chrome 设置中,转到
Privacy and Securtiy
- 选择
Site Settings
- 向下滚动并单击其他首选项
- 查找名为“PDF 文档”的部分
- 打开“下载 PDF 文件而不是在 Chrome 中自动打开它们”选项
现在,您单击的任何 PDF 链接都将下载文件,而不是在新选项卡中打开它们。请注意,每次启动新的 chromedriver 时都需要执行此操作。在您的主 Chrome 应用程序中更改此设置将无济于事。
推荐阅读
- python - 仅当 25% 分位数高于给定值时才选择数据
- xpath - xpath - 如何从 Quora 中的节点获取文本?
- sitecore-sxa - Sitecore-SXA 搜索结果和方面
- post - 带参数的 Axios Vuejs POST 请求
- javascript - 在 JavaScript 对象中制作重复动画循环
- hdfs - Pig 无法创建 .bz2 文件但创建 .deflate 文件
- node.js - 从 Buffer node.js 前面移除元素
- html - 内文本的 CSS 选择器
- 元素(定义列表标签)
- vba - 如何将单元格值分成多个单元格(名称、街道、城市、州、邮编)
- arrays - Laravel 数组分组并合并每个组