python - 访问页面内容而不是 cookie 弹出窗口 (SELENIUM PYTHON)
问题描述
几天来,我一直在寻找解决问题的方法,但没有找到任何可行的方法。我正在创建一个抓取网站的程序,我想收集“p”和“hn”标签的所有内容。我唯一的问题是,在某些网站上,会出现一个 cookie 弹出窗口,并且无法正确抓取。
问题是我抓取了每种类型的网站,所以这意味着它并不总是相同的模式,并且几乎不可能被 xpath / CSSselector 接受。
我尝试了很多东西,比如搜索按钮,然后查看里面是否有“接受”:
try:
btns = driver.find_elements_by_tag_name('button')
btntxt = [elem.text for elem in btns]
print(btntxt)
btntitle = [elem.get_attribute('title') for elem in btns]
for i in range(0, len(btns)-1):
if btn[i].find("accept") != -1:
btns[i].click()
except NoSuchElementException:
pass
我也尝试接受所有 cookie,但它无助于我关闭弹出窗口:
cookies_list = driver.get_cookies()
for cookie in cookies_list:
cookies_dict = {}
cookies_dict['name'] = cookie['name']
cookies_dict['value'] = cookie['value']
driver.add_cookie(cookies_dict)
有没有人有其他想法来接受 cookie 并关闭这些弹出窗口?或者另一种完全忽略弹出窗口的解决方案?在此先感谢希望我已经足够清楚了!
解决方案
推荐阅读
- javascript - 没有找到平台=linux arch=x64 runtime=electron abi=85 uv=1 libc=glibc 的原生构建
- matlab - MATLAB 递归帕斯卡三角形
- numpy - 获取嵌套数组中的元素
- python - 如何使用字典映射张量
- java - 如果类在 java 中有公共字段,我该如何使用它们的组合?
- html - 仅在输入而不是标签上应用悬停选择器
- postgresql - 在 postgres 中正确设置角色的 statement_timeout
- javascript - 用于条件加载变体字段的 Jquery Click 功能无法正常工作
- javascript - 为什么箭头函数可以解决其他需要 .bind 的问题?(SetInverval 调用使用 setState 的函数)
- pdf - FileMaker Pro 电子签名