python - 尝试使用 python-request 获取网页时网站给出错误页面
问题描述
我正在尝试从 Yahoo Finance 页面获取 HTML 代码,以便进行一些网络抓取工作并从数据等中创建表格。
问题是我尝试使用的任何网站都将我重定向到错误/机器人页面,因此我无法获取我需要的代码或实际页面,我正在使用 Pycharm Python 编辑器和request
模块
import requests
from bs4 import BeautifulSoup
url = 'https://finance.yahoo.com/cryptocurrencies'
page = requests.get(url)
soup = BeautifulSoup(page.text, 'lxml')
print(soup)
我可以告诉我我在错误的页面上,因为 HTML 中有类似的内容robot
,error
因此我无法在我的项目中继续前进。
注意:它适用于某些网站,但对于其他一些网站,我会自动被发送到错误页面
解决方案
推荐阅读
- javascript - 如何单独播放由 MediaRecorder 创建的 WEBM 文件
- python - 如何从 python 脚本执行 cd 命令并在新终端中执行附加命令?
- angular - 角度垫表:无法读取未定义的属性“地图”
- php - Laravel Horizon 不执行挂起的作业 - Kubernetes 和 Docker 环境
- json - Scala Circe JSON 库 - 在示例中理解隐式编码器
- php - 如何从 PHP 变量设置 Bing 地图图钉?
- html - 网页未正确调整大小
- java - Android Studio 中的调用自定义 Java 错误
- reactjs - 如何将从数据库接收到的数据作为道具传递给 Reactjs 中的另一个组件
- reactjs - 反应如何在提交上存储状态值