python - 我收到 HTTP 错误 403:检查 url 列表时出现禁止错误
问题描述
我是 python 新手。我试图从存储在 xlsx 文件中的 url 列表中检查损坏的 url。前几个 url 运行良好,但随后停止并显示“HTTP Error 403: Forbidden”。我不确定这是否是“用户代理”的问题。我尝试了几种方法,但没有奏效。希望您能看到我的代码的哪一部分是错误的。
这是我的代码的一部分:
import pandas as pd
import urllib.request
import time
file = pd.read_excel('tests.xlsx')
opener = urllib.request.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/49.0.2')]
error_url=[]
for i in range(0,len(file)):
url=file.values[i][0]
test = urllib.request.urlopen(url).read()
try :
opener.open(url)
print(url+' : succeed')
if 'scholarship' in test.decode() or 'award' in test.decode():
print(" Yes")
else:
print("No")
错误是这样的: 错误信息
解决方案
推荐阅读
- list - 在 Kotlin 中转换后返回第一个非空值
- python - 如何从 ip(例如 192.168.1.3)Linux Shell 或 python3 在本地找到设备主机名
- c# - 在数据库中插入项目:存储更新、插入或删除语句影响了意外的行数 (0)
- css - TailwindCSS 中的中心固定元素
- laravel - 为望远镜 OctoberCMS 创建插件时出错
- r - R 找不到函数“write.vector” - 我该怎么办?
- vim - 如何修复 MacVim 中损坏的错误消息?
- ios - Ionic v1 项目无法在 ios/xcode 上构建和运行
- c# - 使用 Publish 部署时 log4net 中断
- json - PostgreSQL-如何选择jsonb列数组对象值