python - 当我使用 pywin32 将 pdf 转换为 word 时,文件似乎已损坏
问题描述
我想将pdf转换为word,我使用pywin32来实现目标。但我得到了这个错误:
Traceback (most recent call last):
File "H:/test in Pycharm/nb.py", line 11, in <module>
wb = word.Documents.Open(input_file)
File "<COMObject <unknown>>", line 8, in Open
pywintypes.com_error: (-2147352567, 'Exception occur', (0, 'Microsoft Word', 'The file appears to be corrupted.', 'wdmain11.chm', 25272, -2146822496), No
ne)
我发现我的pdf很好,我不知道为什么会出错。代码如下:
import win32com.client
import os
word = win32com.client.Dispatch("word.Application")
word.visible = 0
doc_pdf = "nbdemo1.pdf"
input_file = os.path.abspath(doc_pdf)
print(input_file)
wb = word.Documents.Open(input_file)
output_file = os.path.abspath(doc_pdf[0:-4]+"docx".format())
wb.SaveAs2(output_file,FileFormat=16)
print("Pdf to DOCx is completed")
wb.Close()
word.Quit()