javascript - 空白页:Python 中的 Selenium Chrome 自动化
问题描述
我正在尝试在 Python 中使用 selenium 和 chrome 浏览器自动化一个过程。我的浏览器在大多数页面上都能正常工作,但无法呈现一些页面,包括chrome://version/
.
对于一般自动化(无头),它正确返回页面和页面源,而对于无头浏览,它返回一个空白页面,页面源如下
<html><head></head><body></body></html>
我在不同的操作系统中尝试过 chrome,包括 OpenSUSE、fedora 和 Windows。我尝试过很多事情,例如:删除所有初始参数,使用无头浏览器。
供参考:如果我运行此代码
from selenium.webdriver import Chrome
from selenium.webdriver import ChromeOptions
options = ChromeOptions()
# to remove all arguments
options.add_experimental_option( 'excludeSwitches', ['disable-hang-monitor', 'disable-prompt-on-repost', 'disable-background-networking', 'disable-sync', 'disable-translate', 'disable-web-resources', 'disable-client-side-phishing-detection', 'disable-component-update', 'disable-default-apps', 'disable-zero-browsers-open-for-tests', '--enable-automation', '--use-mock-keychain', '--user-data-dir', '--enable-blink-features', '--disable-popup-blocking', '--enable-logging --force-fieldtrials=SiteIsolationExtensions/Control', '--enable-logging', '--force-fieldtrials', '--ignore-certificate-errors', '--load-extension', '--log-level', '--no-first-run','--password-store','--remote-debugging-port','--test-type'
])
options.add_argument("--headless")
options.add_argument("--no-sandbox")
browser = Chrome(executable_path=driver_path,options=options)
browser.get("chrome://version")
print(browser.page_source)
它为无头返回相同的空白页
<html><head></head><body></body></html>
如果 chrome 在没有无头选项的情况下运行,它将完全正常工作。
<!doctype html>
<!--
about:version template page
-->
<html id="t" dir="ltr" lang="en">
<head>
<meta charset="utf-8">
<title>About Version</title>
<link rel="stylesheet" href="chrome://resources/css/text_defaults.css">
<link rel="stylesheet" href="chrome://version/about_version.css">
......................
解决方案
我猜 selenium 正在无头启动浏览器,因为它是chrome://version
从本地文件中获取的,所以它无法渲染它。
我认为chrome://
如果在无头模式下运行,所有(以及本地文件如 .pdf 或其他文件)都会发生同样的情况。
尝试在 chrome 浏览器中打开一些 pdf 文件,然后:driver.get(<path_to_pdf>)
headless 和 normal
推荐阅读
- reactjs - 使用 toHaveBeenCalledWith 检查 EventTarget
- azure-active-directory - 将 AAD 克隆到另一个启用了 B2C 功能的租户
- ios - 更新照片后 Firebase Swift 崩溃
- html - 与动画一起使用时,背面可见性不起作用
- azure - 创建自签名证书并将其上传到 Azure 应用服务的最简单方法
- android - 从 Activity 返回时如何获取最后一个 ListView 状态
- java - 为什么我在运行 Spring Boot 项目时总是得到状态为“404”的 Whitelabel 错误页面
- emacs - 带有常春藤/律师的 Emacs (26.3) 挂在查找文件上
- python - 如何使用 Python 和 Tkinter 绘制熊猫数据框的各个元素
- python - 如果 3 个或更多值(天)缺少数据,则删除日期范围内的所有行