python - 如何使用 python 请求获取本网站的 html?
问题描述
我正在尝试从以下网站下载 html 文件:
如果我在 Google Chrome 中查看源代码,我可以毫无问题地获取 HTML。但是,我想用 Python 请求下载多个页面。但是,如果我尝试以这种方式获取 html,则会遇到错误。
使用:
response = requests.get(url)
content = response.text
with open('filename', 'w') as dat:
dat.write(content)
我收到以下错误:
requests.exceptions.TooManyRedirects: Exceeded 30 redirects.
我也尝试使用“allow_redirects=False”,但是,如果我这样做,我会得到一个错误的 html,它只包含以下文本:
Object Moved
This document may be found here.
我想知道如何才能使用 python 中的请求下载此 html。
如果我添加标题:
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.54 Safari/537.36'
代码确实运行,但再一次,没有给出我正在寻找的 html。它创建的 html 就像这样
<html><head><title>avto.net</title><style>#cmsg{animation: A 1.5s;}@keyframes A{0%{opacity:0;}99%{opacity:0;}100%{opacity:1;}}</style></head><body style="margin:0"><p id="cmsg">Please enable JS and disable any ad blocker</p><script>var ...
解决方案
推荐阅读
- typescript - TypeScript 循环遍历元组数组
- angular - 父属性更改时如何不重新初始化子组件?
- java - 用 mockito 模拟 android.content.res.Configuration
- python - 无法在 Python 中的列表列表中索引多个元素(使用 : 运算符)
- reactjs - 如何修复不允许输入文本的表单?
- python - 如何加入 2 个表并获得对象上的结果
- javascript - 调用json文件时没有出现文本,但app没有中断
- php - 如何修复使用 PHP 计算纯文本中的单词的错误?
- reporting-services - 用于着色表行的嵌套 SWITCH 语句取决于字段值
- google-apps-script - Google Classroom API 创建材料