python - 我如何从网站上抓取所有课程
问题描述
我想抓取此页面上的每个课程名称 [此页面][1] 这是我的代码
URL = 'https://www.bachelorsportal.com/search/bachelors-degrees/computer-science-it/#q=di-24|lv-bachelor?'
page = requests.get(URL)
soup = BeautifulSoup(page.content, 'html.parser')
results = soup.findAll(class_='StudyTitle')
print(results)
我得到空数组
解决方案
@baduker 是对的,课程内容通过 JS 动态加载。查看 URL 的主请求空响应:
显而易见的解决方案是使用 selenium 的浏览器自动化(例如无头 Chrome)。
哈克
您可能会发现 XHR/Ajax 请求返回课程内容(以 json 格式)并由 Python 执行以获取内容。
推荐阅读
- android - AWS 代码在发布版本时不存在,但在调试版本中存在
- javascript - 将 JavaScript 测试用例转换回测试构造函数
- python - 合并具有相同列的两个数据框并覆盖
- c# - 在数据网格行中的每列分隔对象
- reactjs - Opentok-reactjs 样式不适用于发布者和订阅者
- html - 我需要用 Simple_format 正确显示我的 form.text_area
- swift - 如何交换字典中的项目
- activemq-artemis - Artemis 持久订阅消息存储
- tfs - 如何解决运行代码分析任务TFS中文件无法被索引两次错误?
- matlab - ROS 视频回调工作时 CTRL + C 不工作