python - 如何使用 selenium Web 驱动程序托管由 Web 抓取提供支持的后端服务?
问题描述
所以我正在开发一个项目来抓取网站并向用户提供数据,但是我正在使用 selenium/selenium web 驱动程序和 python/flask。我本来打算用beautifulsoup,但是我正在抓取的网站需要在页面上进行一些交互。
我的所有东西都可以使用刮板,如果我想使用诸如 heroku 之类的服务在网站上托管此服务,我只是想找出一种使这项工作普遍工作的方法。
目前 Selenium 正在打开一个 chrome 浏览器并以这种方式浏览页面。有没有一种聪明的方法可以在不打开浏览器的情况下做到这一点,并且在使用某些服务托管时可以无缝工作?
解决方案
您可以为您的驱动程序使用“--headless”参数。
该参数将完成这项工作,但无需打开实际的浏览器。
例子:
chrome_options = Options()
chrome_options.add_argument("--headless")
driver = webdriver.Chrome(r"drivers/chromedriver.exe",options=chrome_options)
推荐阅读
- flutter - 因为sdk的flutter_test的每个版本都依赖... sdk的flutter_test被禁止,版本求解失败
- node.js - Exec-NPM-Install 为本地连接抛出错误
- sql-server - SQL Server xml 查询不返回预期结果
- python - 使用“python --version”命令显示错误消息
- python - PyOpenGL - 当一些场景元素需要消失时更新三角形数组
- sql-server - 删除语句需要很长时间
- javascript - 如何在角度 6 的单选按钮中执行验证?
- php - 谷歌日历更新时区问题
- sql - 如何将整数转换为数据和时间格式
- ios - 当我使用 iPhone XS Max 从 Xcode 12 中的照片库中选择图片时,应用程序崩溃了