首页 > 解决方案 > 我收到 HTTP 错误 403:检查 url 列表时出现禁止错误

问题描述

我是 python 新手。我试图从存储在 xlsx 文件中的 url 列表中检查损坏的 url。前几个 url 运行良好,但随后停止并显示“HTTP Error 403: Forbidden”。我不确定这是否是“用户代理”的问题。我尝试了几种方法,但没有奏效。希望您能看到我的代码的哪一部分是错误的。

这是我的代码的一部分:

import pandas as pd
import urllib.request
import time


file = pd.read_excel('tests.xlsx')

opener = urllib.request.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/49.0.2')]

error_url=[]
for i in range(0,len(file)): 
    url=file.values[i][0]
    test = urllib.request.urlopen(url).read()
    try :     
        opener.open(url)
        print(url+' : succeed')
        if 'scholarship' in test.decode() or 'award' in test.decode():
            print(" Yes")
        else:
            print("No")

错误是这样的: 错误信息

标签: pythonurlhttp-status-code-403

解决方案


推荐阅读