python - 使用 Python 和 BeautifulSoup 抓取 Ajax.requests - 看似随机的页码返回空白
问题描述
我正在用 BeautifulSoup 抓取一个书评网站,其中有 10 页评论,每页有 30 条评论。我可以从 10 页中得到 8 页,但第 4 页和第 6 页似乎返回空白刮痕。
这是一个简单的演示:
import pandas as pd
from pandas import Series,DataFrame
from bs4 import BeautifulSoup
import requests
import fnmatch
import os
url='https://www.goodreads.com/book/reviews/1202.Freakonomics?amp;page=4'
result = requests.get(url)
soup = BeautifulSoup(result.content, 'lxml')
soup.prettify()
这将返回空白。但是,用 1-10 中的任何其他页面替换 4 或 6 将返回完整的抓取页面。
对于这里可能发生的事情,我将不胜感激。谢谢
解决方案
推荐阅读
- python - 如何访问在类中初始化的列表
- cassandra - 如何在 cql 中转义 & 字符 (&)?
- python - 熊猫:如何使用 .agg()
- excel - 如果单元格 A2 = 单元格 B2 那么 C2 的下拉列表进行选择?
- php - wp-admin 重定向 404 未找到页面
- web - ESP8266 向 Web 服务器发送数据
- visual-studio-code - 保存“*.php/*.vue”:运行“PHP Intelephense/Vetur”格式化程序
- azure-ad-b2c - 如何使用 Web.TPEngine.Providers.SelfAssertedAttributeProvider 禁用自动浏览器 cookie 登录
- c# - WPF取消选择MVVM中的ListBox项目
- python - 平均活跃时间