python - 是否有可能从硒变成beautifulsoup?
问题描述
我想抓取一个网站。我必须使用 selenium 来传递登录表单,并且我在问自己,既然我已经使用了 selenium,是否有办法使用 beautifulSoup 来抓取网站?
解决方案
简单的组合
from bs4 import BeautifulSoup as soup
from selenium import webdriver
url = "url"
browser = webdriver.Firefox()
browser.get(url)
# login/scroll/etc
full_page = browser.page_source
page_soup = soup(full_page, "html.parser")
# parse/find
推荐阅读
- unix - 配置 unix telnet 以显示和接收十六进制字符的命令
- python - 连接两个模型时断开连接的图
- python - pycharm无法在函数内引用全局变量
- amazon-web-services - AWS SAM:REST API 不包含任何方法
- javascript - 禁用/启用按钮的逻辑
- java - 将 .class 文件导入 Eclipse 项目
- python - 如果我们创建的线程数超过了 CPU 的承受能力,会发生什么?操作系统是否处理它?: Python - 线程
- r - mlr 包 - 尝试集成一个新的聚类学习器。par.vals 中的默认值被忽略(在 makeRLearnerCluster 方法中)
- github - 如何在不发送拉取请求的情况下在我的程序中实现在分叉的 Git 存储库中所做的更改?
- r - 在 R 中,分类模型中的弹性网络缺失类