首页 > 解决方案 > 使用显示空表的请求进行网络抓取?

问题描述

from lxml import html
import requests
page = requests.get('http://www.freejobalert.com/upsc-advt-no-17/31908/')
tree = html.fromstring(page.content)
tables = tree.xpath('//table/text()')
print(tables)

在这里,我想从上面的 url 获取所有表格。但它即将出现空列表,尽管网页中有许多表格可用。

标签: pythondjango

解决方案


这是我创建和测试的示例代码,它将表格打印到可以在浏览器中打开的 html 文件中。

from lxml import html
from lxml import etree
import requests

page = requests.get('http://www.freejobalert.com/upsc-advt-no-17/31908/')
tree = html.fromstring(page.content)
tables = tree.cssselect('table')

file = open("output.html","wb") 

for table in tables:
    file.write(etree.tostring(table))

推荐阅读