python - pdf转txt后保存文件
问题描述
我已将一些 pdf 文件转换为以 txt 格式阅读。但是,转换后如何保存?我试图使用file.write('file1')
选项,但它似乎不起作用。
file1 = pdf_to_txt("important_file_1.pdf")
file2 = pdf_to_txt("important_file_2.pdf")
感谢您的帮助。
解决方案
您需要使用以下write
模式打开一个新文件:
file1 = pdf_to_txt("important_file_1.pdf")
f = open('pdf_to_text.txt', 'w')
f.write(file1)
f.close()
要使其可重用,请执行以下操作:
import time
def save_pdf_to_text(file_to_save, filename=None):
if not filename:
timestr = time.strftime("%Y-%m-%d-%H-%M-%S")
filename = '{}.txt'.format(timestr)
with open(filename, 'w') as f:
f.write(file_to_save)
用法:
file1 = pdf_to_txt("important_file_1.pdf")
save_pdf_to_text(file1)
它将创建一个带有时间戳的文件。或将文件名作为第二个参数传递。
推荐阅读
- python - 如何比较数据框中不同年份的月度值变化,Pandas/Python
- android - 我应该采用哪种格式和字体大小?
- javascript - 为什么我的 Firestore 文档包含对象的名称?
- android - 使用 Gson 和 Volley 删除额外的括号
- python - 从科学格式的文本文件中读取两列并用 Python 绘图
- java - 无法在 Android O 中构建 NotificationCompat.Builder
- javascript - 用不同的变量命名变量
- php - SQL:如何在两个表中使用 REPLACE INTO 并且只有特定值匹配?
- django - 如何在 django-heroku 中部署媒体文件?
- ts-node - 如何将参数传递给 ts-node 处理的脚本