python - 使用 ratemyprofessor 的加载更多按钮刮取数据
问题描述
当我尝试从 ratemyprofessor.com ( http://www.ratemyprofessors.com/ShowRatings.jsp?tid=860968# ) 抓取评论文本时遇到了问题。我目前正在使用 BeautifulSoup 和请求。
我很想得到所有的评论内容,而点击“加载更多”后的数据是无法访问的。我尝试了在 StackOverflow 和 Reddit 上发布的不同方式,不幸的是,它们都不适合我。
正在检查的加载更多按钮:onclick="javascript:mtvn.btg.Controller.sendLinkEvent({ linkName:'PROF:LoadMore', linkType:'o' } );"
如果有人能帮助我解决这个问题,我将不胜感激。谢谢你。
解决方案
这似乎是一个 JS 网站。我认为你需要使用像 Selenium 这样的东西来刮这个。通过使用 Selenium,您可以指示 Web 浏览器滚动到最后并以这种方式捕获您正在寻找的所有数据。
推荐阅读
- amazon-web-services - S3 生命周期策略会生成事件吗?
- kubernetes - 如何解释这个内核消息:cgroup out of memory: Kill process 1234 .... score 1974 or祭祀孩子?
- python - Python 类,没有得到预期的返回值,与内部方法混淆
- go - 在 Go 中使用 os.Lstat 返回值
- sql - 为行设置递增和重置值
- batch-file - 使用批处理文件为所有子文件夹中的所有文件名添加前缀
- python - 在 Go 项目文件夹中运行 python 脚本(使用脚本的项目/相对文件路径)
- objective-c - Xcode objective-c 错误:预期的标识符
- android-studio - 为什么我会收到此 Android Studio 错误:“使用 -fPIC 重新编译”?
- vba - VBA,日期格式问题