python - 网页拒绝连接
问题描述
大家好,我正在尝试使用 BeautifulSoup 进行一些 Web Scraping,在这种情况下,我收到此错误:
ConnectionRefusedError Traceback (most recent call last)
urllib.error.URLError: <urlopen error [Errno 10061] No connection could be made
because the target machine actively refused it>
这是我的代码:
from urllib.request import urlopen
from bs4 import BeautifulSoup
import base64
import pytesseract as pyt
import requests
from PIL import Image
import matplotlib.pyplot as ptl
import numpy as np
pyt.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
login_url = 'http://www.root-me.org/?page=login&lang=fr'
payload = {
'var_login': 'email',
'password': 'pass'
}
with requests.Session() as s:
response = requests.post(login_url , payload)
scrap_url= urlopen('http://challenge01.root-me.org/programmation/ch8/')
soup = BeautifulSoup(scrap_url)
img = soup.find('img')['src'].split(',')[1]
with open('captcha.png', 'wb') as guardar:
decodificar = base64.b64decode(img)
guardar.write(decodificar)
leer_img = Image.open('captcha.png', 'r')
ptl.imshow(np.asarray(leer_img))
texto_captcha = pyt.image_to_string(leer_img)
print(texto_captcha)
问题是当我登录这个页面时,我得到了验证码,然后在注销后我收到了上面描述的错误。有什么建议么?
解决方案
推荐阅读
- php - PHP Profiler - 使用 C++ 从 PHP 扩展中获取客户端 IP 和 URL
- asp.net - 调用控制器后,MVC 视图不显示 Temp Data 值
- java - java/android - 无法访问 SD 卡上的文件
- arrays - 数组codeIgniter中的多个数据?
- git - 如何合并推送存储库中的三个旧提交?
- node.js - 每次我在 NodeJs 中重新加载页面时创建一个文件夹
- git - 本地分支和远程跟踪分支之间的 git diff
- android - 安卓 | 无法构建多风味维度
- jquery - 无法读取 iframe 元素上替换“未定义”的属性
- laravel - php artisan storage:链接链接错误的目录