首页 > 解决方案 > 文件以单一名称重复保存,不循环,不测距

问题描述

我的代码运行良好,但有一个缺陷。他们没有相应地储蓄。例如,假设我捕获了 3 个 jpeg 文件,当我运行代码时,它在 slot 1 上保存了 3 次,在 slot 2 上保存了 3 次,在 slot 3 上保存了 3 次。所以我最终得到了 3 个相同的文件。

我认为我的循环逻辑有问题?如果我更改for n in range(len(soup_imgs)):for n in range(len(src)):,该操作将无限保存最后的 jpeg 文件。

soup_imgs = soup.find(name='div', attrs={'class':'t_msgfont'}).find_all('img', alt="", src=re.compile(".jpg"))
for i in soup_imgs:
    src = i['src']
    print(src)

dirPath = "C:\\__SPublication__\\" 
img_folder = dirPath + '/' + soup_title + '/'
if (os.path.exists(img_folder)):
    pass
else:
    os.mkdir(img_folder)

for n in range(len(src)):
    n += 1
    img_name = dirPath + '/' + soup_title + '/' + str({}).format(n) + '.jpg'
    img_files = open(img_name, 'wb')
    img_files.write(requests.get(src).content)
    print("Outputs:" + img_name)

我是编码的业余爱好者,不久前才开始作为我的爱好。请各位大佬指点一下。

标签: python-3.xbeautifulsouppython-requestspython-os

解决方案


在编写图像文件时试试这个:

from os import path

for i, img in enumerate(soup_imgs):
    src = img['src']
    img_name = path.join(dirPath, soup_title, "{}.jpg".format(i))
    with open(img_name, 'wb') as f:
        f.write(requests.get(src).content)
    print("Outputs:{}".format(img_name))

您需要遍历所有图像源,而不是使用前一个块中的最后一个src值。for

我还添加了一种更安全的方法来加入应该独立于操作系统的目录和文件路径。最后,当打开一个文件时,总是使用这个with open() as f:结构——这样 Python 会自动为你关闭文件句柄。


推荐阅读