python - 使用 Pandas 数据框和 PyPDF2 组合多个 PDF
问题描述
我试图通过首先遍历数据框然后遍历文件路径来组合两个 PDF。
重命名和移动功能有效,但是,该程序只结合了我列表中的前两个 pdf。下面是我的代码:
#set paths
path = 'C:\\Users\\sferrier\\Desktop\\test_1'
dest = 'C:\\Users\\sferrier\\Desktop\\test_1_output'
os.chdir(path)
#creater empty lists to later append to
slipsheet = []
document = []
new_file = []
#load the dataframe
df = pd.read_excel('slip_sheet_exs.xlsx', columns = ['slipsheet', 'filename'])
#iterate through excel and add columns to a list
for index, row in df.iterrows():
slipsheet.append(row['slipsheet'])
document.append(row['filename'])
#define merger and i for later use in the for loop
merger = PdfFileMerger()
i = 0
#combine the pdfs and move them
for files in os.dir():
merger.append(slipsheet[i])
merger.append(document[i])
merger.write(slipsheet[i] + " - " + document[i])
new_file = path + '\\' + slipsheet[i] + " - " + document[i]
shutil.move(new_file, dest)
i= i+1
if slipsheet == slipsheet[i-1]:
continue
elif i == len(df):
break
以下内容一定有问题,但我不确定是什么:
for files in os.dir():
merger.append(slipsheet[i])
merger.append(document[i])
merger.write(slipsheet[i] + " - " + document[i])
解决方案
推荐阅读
- java - Pyspark:出现错误 py4j.protocol.Py4JJavaError:调用 o6604.save 时出错。\n:java.lang.OutOfMemoryError:Java 堆空间
- html - 如何在 SSRS 中设置报告以在单个 .rdl 中以 HTML 和 PDF 输出查看
- python - 下载 yolov3 的预训练权重时出错
- javascript - 从 Redux 迁移到 Redux 工具包
- javascript - 无法在 Google Drive 插件中生成缩略图
- java - 带阈值的最大和子序列
- html - 如何在每页打印浏览器后完全打印一次背景图像?
- html - 我正在尝试从 mls 网站上抓取房地产列表,并且很幸运能喝到漂亮的汤,也许硒会更容易?
- node.js - 我无法让 express-fileupload 或 multer 工作.. 一直显示为未定义 - middlware 问题?
- android - 从 QR 扫描启用 .APK 下载