python - requests_html 的 HTMLSession 没有获得完整的网页
问题描述
我正在尝试获取网页的 html 并将其保存为.html
文件。但它没有获得页面的完整内容。有时它会获得完整的页面,但有时它会丢失页面中的特定表格。以下是我的代码:-
from requests_html import HTMLSession
session = HTMLSession()
r = session.get(url)
f = open('/home/ubuntu/log/{}.html'.format('UPS_httpsession'), 'w+', encoding='utf-8')
f.write(str(r.html.html))
f.close()
我想告诉的另一件事是,当我在本地机器上运行它时,它一直运行良好,并且只有在我在生产服务器上运行它时才会产生问题。
解决方案
推荐阅读
- mongodb - MongoDB:从数组中单独获取所有 $matched 元素
- autodesk-forge - 获取 IFC 架构版本
- parquet - 未为此向量容器设置记录计数
- mysql - mysql - 授予时丢失连接
- excel - 使用 VBA 代码中的 tdmsAddIn.Connect 插件将 TDMS 文件导出到 excel 时出现运行时错误
- r - 计算“严重”分区数据集中的组差异
- javascript - 如何使用 ES2016 在不同条件下过滤数组?
- javascript - 预期的模拟函数被调用了一次,但它被调用了零次
- ms-access - 更新文本框中公式的结果
- r - 努力在 R 中创建数据透视表