python - 如何在 Python 中将多个 PDF 转换为同一文件夹中的图像?
问题描述
from pdf2image import convert_from_path
images = convert_from_path('path.pdf',poppler_path=r"E:/software/poppler-0.67.0/bin")
for i in range(len(images)):
images[i].save('image_name'+ str(i) +'.jpg', 'JPEG')
但现在我想将 100 多个 pdf 文件转换为图像。有什么办法吗?提前致谢。
解决方案
您可能需要使用 os 模块。
第一步:
- 像这样使用 os.listdir 函数
os.listdir(path to folder containing pdf files)
获取该文件夹中的路径列表。
更具体地说os.isfile()
,检查当前路径是文件还是文件夹。
- 如果路径指向这样的文件,请执行转换。
images = convert_from_path('path.pdf',poppler_path=r"E:/software/poppler-0.67.0/bin")
for i in range(len(images)):
images[i].save('image_name'+ str(i) +'.jpg', 'JPEG')
否则使用递归进一步遍历文件夹。这是一个 repo 的链接,我在其中递归地调整了文件夹中的图像大小。消化这个想法可能很有用。 链接到给定路径中图像的递归调整大小。
推荐阅读
- javascript - 检测某人何时对机器人创建的消息做出反应
- ios - 将一个 SKShapeNode 切成两半
- sql-server - 无法清除 SQL Server sysmail 队列
- python - pdftotext(linux poppler-utils)有没有办法获取二进制文件而不是pdf文件?
- multithreading - 为什么单线程异常会使整个程序崩溃(如何防止这种情况?)
- c - 比较C中文本文件中的字符串
- opencv - 如何使用opencv2从每个矩形部分的图像中检测黑色百分比?
- java - Collection.sort(list) 也在排序或反转我的旧列表,例如 mList、myList
- r - 如何使用 R 中的 list.files 函数重新排序存储
- c++ - 从数组调用方法不会改变对象