python-2.7 - BeautifulSoup 网页表格抓取
问题描述
from urllib2 import urlopen, Request
from bs4 import BeautifulSoup
site = 'https://racing.hkjc.com/racing/information/English/racing/LocalResults.aspx/'
hdr = {'User-Agent': 'Mozilla/5.0'}
req = Request(site, headers=hdr)
res = urlopen(req)
rawpage = res.read()
page = rawpage.replace("<!-->", "")
soup = BeautifulSoup(page, "html.parser")
table = soup.find("table", {"class":"f_tac table_bd draggable"})
print (table)
这项工作完美地得到了一个表格输出,直到我将 url 更改为下一页没有任何输出(无)
请帮助网址或代码有什么问题?
解决方案
您必须将查询字符串添加到 url 的末尾:
示例:从第 2 页获取表:
site ='https://racing.hkjc.com/racing/information/English/racing/LocalResults.aspx/?RaceDate=2020/03/14&Racecourse=ST&RaceNo=2'
推荐阅读
- python - 如何配置 django 媒体文件夹?
- c# - System.TypeLoadException:无法加载类型 System.Net.HttpStatusCode、netstandard,同时解码自定义属性:(null)
- python - 将整数与无类型进行比较
- vba - 编译函数时出错
- scala - Scalafmt 配置用于在 ~> 运算符上换行
- java - 将 Angular 连接到 Spring 的 CORS 错误(localhost 8080 <--> localhost 4200)
- python - 如何在python(熊猫)中将嵌套JSON格式的特定部分解析为csv
- python - Python - 当真:尝试除其他 - 程序流问题
- flutter - Flutter:flutter_swiper 包控制幻灯片之间的空间
- php - 不知道有多少参数时的准备语句