首页 > 解决方案 > 用户代理问题呈现不可读的标签 html 源数据

问题描述

在 Chrome 中打开以下 URL 代码检查会产生以下消息:

拒绝设置不安全的标头“User-Agent”

该网站背后的代码如下所示:

<div dir="auto" class="rn-13yce4e rn-fnigne rn-ndvcnb rn-gxnn5r rn-deolkf rn-cme181 rn-1471scf rn-14xgk7a rn-1b43r93 rn-o11vmf rn-ebii48 rn-vw2c0b rn-t9a87b rn-1mnahxq rn-61z16t rn-p1pxzi rn-11wrixw rn-wk8lta rn-9aemit rn-1mdbw0j rn-gy4na3 rn-bauka4 rn-q42fyq rn-qvutc0">24 Count</div>

在 Internet Explorer 中打开相同的链接似乎可以正确呈现标签,例如: gbcvs-c-addToCart__inner 可以找到。

Selenium 用于读取页面,它曾经与 Chrome 一起使用。有没有办法设置用户代理知道程序将在 Linux 中运行?

我尝试了以下没有运气..

options = webdriver.ChromeOptions()
options.add_argument('--user-agent="Mozilla/5.0 (Windows NT 6.3; Trident/7.0; rv:11.0) like Gecko"')

我想继续使用 chrome 驱动程序。

标签: htmlgoogle-chromeselenium-webdriveruser-agent

解决方案


没有通用的方法可以做到这一点,但是对于 chrome,您可以使用像这样的插件来伪造您的用户代理标头。当使用来自 Selenium 的 chrome 时,您可以加载该扩展并使用它来更改所有请求的标头。


推荐阅读