python - 如何在 Python 中使用 Docx 打开 PDF 文件?
问题描述
我想从我的 mac 打开一个 pdf 文件,但我收到此错误:
'这个文件打不开。它可能已损坏或具有预览无法识别的文档结构。
这是我正在使用的代码:
from docx import Document
#open the document
doc=Document('./testDoc.docx')
a = input('Whats your name ')
b = input('Whats your date of birth ')
Dictionary = {"name": a, "dob": b}
for i in Dictionary:
for p in doc.paragraphs:
if p.text.find(i)>=0:
p.text=p.text.replace(i,Dictionary[i])
#save changed document
doc.save('/my/path/contract{}.pdf'.format(a))
有谁知道出了什么问题?
解决方案
docx
模块无法将 word 文档转换为 PDF。
您可以使用pywin32
模块。
import win32com.client
def wordToPdf(input_path, output_path):
word = win32com.client.Dispatch("Word.Application")
doc = word.Documents.Open(str(input_path))
doc.SaveAs(str(output_path), FileFormat=17)
doc.Close()
word.Quit()
推荐阅读
- lambda - Azure 认知搜索 $filter Lambda:将最近的值与以前的值进行比较?
- slurm - 在 SHELL 脚本中提交大量作业
- javascript - Javascript Promise 和事件循环
- java - 如果用户直接输入链接,我如何重定向到某个 url。此外,如果按钮已经存在于特定的 url(在 spring boot 中)
- ios - 无法打开文件“xxxx.sqlite”,因为它的格式不正确
- c# - 是否可以在 Xamarin Shell 堆栈中看到以下页面?
- python - 使用 Pandas/Python 获取每年大于每日平均值的平均天数
- python - 如何保持 AWS Lightsail 虚拟服务器运行
- java - Spring 无法使用内部类解决依赖关系
- c# - MVC 后台进程阻止在运行时导航到其他页面