python-3.x - 文件以单一名称重复保存,不循环,不测距
问题描述
我的代码运行良好,但有一个缺陷。他们没有相应地储蓄。例如,假设我捕获了 3 个 jpeg 文件,当我运行代码时,它在 slot 1 上保存了 3 次,在 slot 2 上保存了 3 次,在 slot 3 上保存了 3 次。所以我最终得到了 3 个相同的文件。
我认为我的循环逻辑有问题?如果我更改for n in range(len(soup_imgs)):
为for n in range(len(src)):
,该操作将无限保存最后的 jpeg 文件。
soup_imgs = soup.find(name='div', attrs={'class':'t_msgfont'}).find_all('img', alt="", src=re.compile(".jpg"))
for i in soup_imgs:
src = i['src']
print(src)
dirPath = "C:\\__SPublication__\\"
img_folder = dirPath + '/' + soup_title + '/'
if (os.path.exists(img_folder)):
pass
else:
os.mkdir(img_folder)
for n in range(len(src)):
n += 1
img_name = dirPath + '/' + soup_title + '/' + str({}).format(n) + '.jpg'
img_files = open(img_name, 'wb')
img_files.write(requests.get(src).content)
print("Outputs:" + img_name)
我是编码的业余爱好者,不久前才开始作为我的爱好。请各位大佬指点一下。
解决方案
在编写图像文件时试试这个:
from os import path
for i, img in enumerate(soup_imgs):
src = img['src']
img_name = path.join(dirPath, soup_title, "{}.jpg".format(i))
with open(img_name, 'wb') as f:
f.write(requests.get(src).content)
print("Outputs:{}".format(img_name))
您需要遍历所有图像源,而不是使用前一个块中的最后一个src
值。for
我还添加了一种更安全的方法来加入应该独立于操作系统的目录和文件路径。最后,当打开一个文件时,总是使用这个with open() as f:
结构——这样 Python 会自动为你关闭文件句柄。
推荐阅读
- ruby-on-rails - 图像未在 Database Rails 5 中上传 | 回形针
- c# - Rider 中最流行的 C# 代码样式设置是什么?
- jquery - 使用 jQuery 扩展菜单
- python - 从多个数据框创建单个箱线图
- r - 如何在 R 中获得更好的性能:一个大文件还是几个小文件?
- android - 缺少可访问性标签:在 Android Studio 警告中
- sql - 根据整数长度查询值
- php - 如何阻止除超级管理员以外的所有用户的网址
- java - 如何获取 jdbc 的输出或错误流
- .net - 在解决方案级别管理 Microsoft 和 StyleCop 代码分析规则