首页 > 解决方案 > pdf转txt后保存文件

问题描述

我已将一些 pdf 文件转换为以 txt 格式阅读。但是,转换后如何保存?我试图使用file.write('file1')选项,但它似乎不起作用。

file1 = pdf_to_txt("important_file_1.pdf")
file2 = pdf_to_txt("important_file_2.pdf")

感谢您的帮助。

标签: pythonjupyter-notebook

解决方案


您需要使用以下write模式打开一个新文件:

file1 = pdf_to_txt("important_file_1.pdf")
f = open('pdf_to_text.txt', 'w')
f.write(file1)
f.close()

要使其可重用,请执行以下操作:

import time
def save_pdf_to_text(file_to_save, filename=None):
    if not filename:
        timestr = time.strftime("%Y-%m-%d-%H-%M-%S")
        filename = '{}.txt'.format(timestr)
    with open(filename, 'w') as f:
        f.write(file_to_save)

用法:

file1 = pdf_to_txt("important_file_1.pdf")
save_pdf_to_text(file1)

它将创建一个带有时间戳的文件。或将文件名作为第二个参数传递。


推荐阅读