python-3.x - urllib.error.HTTPError:HTTP 错误 429:Python googlesearch 包的 search() 中的请求过多
问题描述
实际上,我正在 python 的 GoogleSearch 包的 search() 中运行一个查询,它以列表格式提供来自 google 搜索的多个链接
search(query, tld='com', lang='en', num=20, start=0, stop=None, pause=2.0):
我也能得到结果,但过了一段时间它给出了一个错误,比如
for i in search(query, tld='com', lang='en', num=20, start=0, stop=None, pause=2.0):
File "E:\crawling\venv\lib\site-packages\googlesearch\__init__.py", line 312, in search
html = get_page(url, user_agent)
File "E:\crawling\venv\lib\site-packages\googlesearch\__init__.py", line 176, in get_page
response = urlopen(request)
File "C:\Users\shubh\Anaconda3\lib\urllib\request.py", line 222, in urlopen
return opener.open(url, data, timeout)
File "C:\Users\shubh\Anaconda3\lib\urllib\request.py", line 531, in open
response = meth(req, response)
File "C:\Users\shubh\Anaconda3\lib\urllib\request.py", line 641, in http_response
'http', request, response, code, msg, hdrs)
File "C:\Users\shubh\Anaconda3\lib\urllib\request.py", line 563, in error
result = self._call_chain(*args)
File "C:\Users\shubh\Anaconda3\lib\urllib\request.py", line 503, in _call_chain
result = func(*args)
File "C:\Users\shubh\Anaconda3\lib\urllib\request.py", line 755, in http_error_302
return self.parent.open(new, timeout=req.timeout)
File "C:\Users\shubh\Anaconda3\lib\urllib\request.py", line 531, in open
response = meth(req, response)
File "C:\Users\shubh\Anaconda3\lib\urllib\request.py", line 641, in http_response
'http', request, response, code, msg, hdrs)
File "C:\Users\shubh\Anaconda3\lib\urllib\request.py", line 569, in error
return self._call_chain(*args)
File "C:\Users\shubh\Anaconda3\lib\urllib\request.py", line 503, in _call_chain
result = func(*args)
File "C:\Users\shubh\Anaconda3\lib\urllib\request.py", line 649, in http_error_default
raise HTTPError(req.full_url, code, msg, hdrs, fp)
urllib.error.HTTPError: HTTP Error 429: Too Many Requests
我还增加了搜索参数中的暂停时间,但对我没有帮助。
解决方案
推荐阅读
- graphql - graphql - 没有PK的多对多关系
- r - 按类别绘制 R 中的大型面板数据
- r - 如果同一时期有质量好的数据,则删除质量差的列
- python - 画布背景图像不适合整个窗口 tkinter python
- reactjs - 将 CRA (Create React App) 创建的 React App 部署到具有不同 URL PATHS 的不同 ENVIRONMENTS?
- angular - Angular 的 FormControl 导致无限循环
- python - 没有numpy的列表切片
- nginx - 如何在生产环境中启动 laravel-echo 服务器?
- browser - 在 Google Chrome 上 - 搜索字符串即使存在也不显示组合
- javascript - 通过 JS 填充的模式中的按钮不起作用