python - 在寻找元素方面使用 Selenium 和 Beautiful Soup
问题描述
总的来说,我对网络抓取和数据科学还很陌生。根据各种消息来源,beautifulsoup 在网页抓取方面比 selenium 更快。我正在编写一些通过社交媒体评论爬行的代码。我正在使用 Selenium 自动单击检索旧评论的按钮并使用
driver.find_element_by_xpath()
我知道 beautifulsoup 没有允许我直接输入 xpath 来查找元素的功能。
在这种情况下,我是否应该放弃对使用 xpath 的依赖,并尝试使用可以被漂亮汤使用的选择器来更舒服?
尽管我只处理了大约 120 条评论,但我现在的代码感觉非常笨重并且需要几分钟时间。
抱歉,如果以前有人问过这个问题;我无法在网站上找到它。谢谢!
解决方案
听起来您的代码运行良好。不知道你在找什么很难说,但是使用 requests 和 beautifulsoup 是很常见的
你会喜欢汤中的 CSS 选择器
for cell in soup.select('table#foobar td.empformbody'):
# your code
推荐阅读
- python - 如何通过 ctypes 或 PyWin32 使用 SHChangeNotify
- devise - 通过 ruby-saml gem 的 omniauth:request.env['omniauth.auth'] 总是 nil
- mongodb - 如果对象 id 匹配则更新数据,否则在 mongodb mongoose 中创建一个新对象
- angular - Angular E2E 访问环境变量
- mongodb - 在匹配条件下从 mongodb 获取数据
- xml - 为什么 Amazon Tag ProductType 会引发 XML 解析错误
- javascript - 是否有一个javascript函数可以将文件移动到垃圾箱而不是直接从磁盘中删除?
- jupyter-notebook - Jupyter 配置不写错误日志?
- asp.net-mvc - 如何使用 IIS 和 ASP.NET Core 从另一台服务器获取文件
- css - 根据从数据库中检索的值动态更改文本颜色