python-3.x - 我的刮板不适用于 403 禁止的 google-compute-engine
问题描述
我用它写了一个网络爬虫,python3.6
它在我自己的服务器上运行良好。
当我试图在我的 上运行它(完全相同的 URL)时google-compute-engine
,它失败了HTTP Error 403: Forbidden
。
我的服务器上的代码和结果
再次,它运作良好。
>>> import urllib.request
>>> from bs4 import BeautifulSoup
>>> response = urllib.request.urlopen("http://www.kumkangho.co.kr/bk.popup.info.php?date=20190413&pa_uid=1")
>>> print(response.readline())
b'<!-- <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> -->\r\n'
google-compute-engine 上的结果
我认为它没有被 url 所在的服务器阻止,而是被 GCE 阻止。
解决方案
经过一堆测试,我发现对面的服务器正在阻止来自不需要的国家的访问。
我设置了http_proxy
它,它现在正在工作。
@Supratik Majumdar 感谢您的帮助。
推荐阅读
- ios - 如何从 DocumentPicker 的显示对话框中隐藏不相关的 contentType
- pyrevit - 如何解决 pyRevit 错误:ImportError: cannot import _usd from pxr.Usd
- c++ - 图结构实现
- java - Spring Data MongoDB 通过 id 查询不返回结果
- groovy - JMeter:获取列标题列表及其索引
- c++ - C++ 在 Windows 中获取控制台应用程序以像在 linux 中一样快速打印
- hocon - 如何使用 hocon config 将对象定义为环境变量
- r - RStudio 自发地自我更新到更高版本
- solidity - 尝试编译代码时出现 Remix Solidity 错误
- python - 如何在 Django 中跨多个类运行测试装置?