python - 使用显示空表的请求进行网络抓取?
问题描述
from lxml import html
import requests
page = requests.get('http://www.freejobalert.com/upsc-advt-no-17/31908/')
tree = html.fromstring(page.content)
tables = tree.xpath('//table/text()')
print(tables)
在这里,我想从上面的 url 获取所有表格。但它即将出现空列表,尽管网页中有许多表格可用。
解决方案
这是我创建和测试的示例代码,它将表格打印到可以在浏览器中打开的 html 文件中。
from lxml import html
from lxml import etree
import requests
page = requests.get('http://www.freejobalert.com/upsc-advt-no-17/31908/')
tree = html.fromstring(page.content)
tables = tree.cssselect('table')
file = open("output.html","wb")
for table in tables:
file.write(etree.tostring(table))
推荐阅读
- c# - 在此示例中需要帮助识别类/原始实例变量
- html - 滑动时引导轮播滚动顶部
- node.js - 使用 nodejs 和 mailgun 发送电子邮件时出错
- android - 如何测试从 Kotlin 中的函数返回的 lambda
- php - 如何根据复选框限制选择框选项?
- javascript - Node express 中间件有未定义的输入
- c++ - 如何在 C++ 中四舍五入到 1decimal?
- google-apps-script - 用于发送带有 PDF 的电子邮件的 Google 电子表格循环不起作用
- python - 如何计算Mask Rcnn中对象的单个蒙版区域
- python - 在服务器后台运行 python 脚本并获取脚本输出