python - 无法获取包含请求的 url
问题描述
对于我的工作,我正在尝试自动化网络搜索和数据查询,我们每周都会在线监控商业零件号的价格,这至少需要 2 小时。这是重复和无聊的,我想自动化它。
这基本上是我第一次尝试beautifulsoup,我阅读并观看了一些关于它的视频。如果有人有完美的tuto,豌豆分享,我有点失落;)
因此,我尝试从 url 获取 HTML 代码:' https://www.bom.ai/ic/STM32F030C8T6.html ',但我收到一条错误消息,并且无论我给出什么 url。// 目前我严格遵循我在网上找到的示例 // 我尝试过更简单的网站、维基百科页面、我非常非常基本的 html 页面......总是相同的错误消息
import requests
import urllib.request
import time
from bs4 import BeautifulSoup
def create_website(CP):
return(str('https://www.bom.ai/ic/'+str(CP)+'.html'))
url=create_website('STM32F030C8T6')
response=requests.get(url)
ConnectionError: HTTPSConnectionPool(host='en.wikipedia.org', port=443): Max retries exceeded with url: /wiki/Cam%C3%A9lia_Jordana (由 NewConnectionError(': 无法建立新连接: [WinError 10060) ] 连接尝试失败,因为连接方在一段时间后没有正确响应,或者连接失败,因为连接的主机没有响应'))
解决方案
您提到您正在工作,您可能有一个公司代理阻止您的请求!您可以尝试以下方法:
- 使用代理(如果您在机器上配置了它(可能由您的公司完成)):
import requests
r = requests.get('your_url')
print(r.text)
- 没有代理:
import requests
proxy = {
'http_proxy': '',
'https_proxy': ''}
r = requests.get('your_url', proxies=proxy)
print(r.text)
两个都试试!
推荐阅读
- php - 如何使用 PHP 在 Firebase 中自动导入存储桶 - Google Cloud Storage
- javascript - React - 解析错误:意外的令牌,预期的“;”
- mysql - 当应用于 MySQL 表列中的变量时,+0E0 究竟做了什么?
- pandas - 计算不同年份的每日平均值(日期时间)
- django - Celery/systemd 不与我的 django 应用程序对话
- java - 如何将opentrace拦截器添加到restTemplate?
- reactjs - 使用 React 在按键上播放声音
- python - If else 具有多个条件的函数-Python
- java - 如何将 Mapstruct 与 Ad Hoc Setter 一起使用
- sql - 使用一张表过滤另一张表而不连接