首页 > 解决方案 > 无法获取包含请求的 url

问题描述

对于我的工作,我正在尝试自动化网络搜索和数据查询,我们每周都会在线监控商业零件号的价格,这至少需要 2 小时。这是重复和无聊的,我想自动化它。

这基本上是我第一次尝试beautifulsoup,我阅读并观看了一些关于它的视频。如果有人有完美的tuto,豌豆分享,我有点失落;)

因此,我尝试从 url 获取 HTML 代码:' https://www.bom.ai/ic/STM32F030C8T6.html ',但我收到一条错误消息,并且无论我给出什么 url。// 目前我严格遵循我在网上找到的示例 // 我尝试过更简单的网站、维基百科页面、我非常非常基本的 html 页面......总是相同的错误消息

import requests
import urllib.request
import time
from bs4 import BeautifulSoup

def create_website(CP):
    return(str('https://www.bom.ai/ic/'+str(CP)+'.html'))

url=create_website('STM32F030C8T6')

response=requests.get(url)

ConnectionError: HTTPSConnectionPool(host='en.wikipedia.org', port=443): Max retries exceeded with url: /wiki/Cam%C3%A9lia_Jordana (由 NewConnectionError(': 无法建立新连接: [WinError 10060) ] 连接尝试失败,因为连接方在一段时间后没有正确响应,或者连接失败,因为连接的主机没有响应'))

标签: pythonpython-requests

解决方案


您提到您正在工作,您可能有一个公司代理阻止您的请求!您可以尝试以下方法:

  • 使用代理(如果您在机器上配置了它(可能由您的公司完成)):
import requests
r = requests.get('your_url')
print(r.text)
  • 没有代理:
import requests
proxy = {
    'http_proxy': '',
    'https_proxy': ''}
r = requests.get('your_url', proxies=proxy)
print(r.text)

两个都试试!


推荐阅读