首页 > 解决方案 > 如何在 Python 中使用 Docx 打开 PDF 文件?

问题描述

我想从我的 mac 打开一个 pdf 文件,但我收到此错误:

'这个文件打不开。它可能已损坏或具有预览无法识别的文档结构。

这是我正在使用的代码:

from docx import Document
#open the document
doc=Document('./testDoc.docx')
a = input('Whats your name ')
b = input('Whats your date of birth ')

Dictionary = {"name": a, "dob": b}

for i in Dictionary:
    for p in doc.paragraphs:
        if p.text.find(i)>=0:
            p.text=p.text.replace(i,Dictionary[i])

#save changed document
doc.save('/my/path/contract{}.pdf'.format(a))

有谁知道出了什么问题?

标签: pythonpdfdocxconverters

解决方案


docx模块无法将 word 文档转换为 PDF。
您可以使用pywin32模块。

import win32com.client
def wordToPdf(input_path, output_path):
    word = win32com.client.Dispatch("Word.Application")
    doc = word.Documents.Open(str(input_path))
    doc.SaveAs(str(output_path), FileFormat=17)
    doc.Close()
    word.Quit()

推荐阅读