python-3.x - Python 3 - 拆分 PDF 文件
问题描述
我希望从我的 PDF 文件中提取第 30 到 34 页并将其制成一个文档。但是,我的代码似乎只能让我获得第 34 页。
import os
from PyPDF2 import PdfFileReader, PdfFileWriter
path = 'file_path'
pdf = PdfFileReader(path, "rb")
for page in range(29, 33):
pdf_writer = PdfFileWriter()
pdf_writer.addPage(pdf.getPage(page))
output_fname = "Output.pdf"
with open(output_fname, 'wb') as out:
pdf_writer.write(out)
print ("PDF file has been split")
好的,我注意到如果我更改了代码的中间部分以手动添加页面,它就可以工作。但我确实需要一种不那么笨重的方法来提取大量页面。
output.addPage(pdf.getPage(29))
output.addPage(pdf.getPage(30))
解决方案
Nvm 我意识到我的错误。应该刚刚从循环语句中排除 pdf_writer = PdfFileWriter() 。
import os
from PyPDF2 import PdfFileReader, PdfFileWriter
path = 'file_path'
pdf = PdfFileReader(path, "rb")
pdf_writer = PdfFileWriter()
for page in range(29, 33):
pdf_writer.addPage(pdf.getPage(page))
output_fname = "Output.pdf"
with open(output_fname, 'wb') as out:
pdf_writer.write(out)
print ("PDF file has been split")
推荐阅读
- c# - 零有不同的十进制值吗?
- macos - 如何找到我的 Mac 上安装的所有 Clang 版本?
- python - 在简单的 Python 垃圾邮件发送者中,每个套接字地址(协议/网络地址/端口)通常只允许使用一次
- c - 查找输入文件中的最大行长和最大行数,但出现段错误?
- r - 是否有用于导入 JSON 文件特定部分的 R 函数?
- c# - 如何从 Main() 方法调用一个类?
- c++ - 如何从文件中读取内容并将其放入 Trie 中?
- json - HashMap 与 Object ?最终生成带有 KEY 和 VALUE 的 JSON 输出哪个更好
- git - 将分支向后变基到主分支?
- python - Python Pandas to_csv 使用 period 类型的列慢 20 倍[D]