首页 > 解决方案 > 当我使用 pywin32 将 pdf 转换为 word 时,文件似乎已损坏

问题描述

我想将pdf转换为word,我使用pywin32来实现目标。但我得到了这个错误:

Traceback (most recent call last):
  File "H:/test in Pycharm/nb.py", line 11, in <module>
    wb = word.Documents.Open(input_file)
  File "<COMObject <unknown>>", line 8, in Open
pywintypes.com_error: (-2147352567, 'Exception occur', (0, 'Microsoft Word', 'The file appears to be corrupted.', 'wdmain11.chm', 25272, -2146822496), No
ne)

我发现我的pdf很好,我不知道为什么会出错。代码如下:

import win32com.client
import os

word = win32com.client.Dispatch("word.Application")
word.visible = 0

doc_pdf = "nbdemo1.pdf"
input_file = os.path.abspath(doc_pdf)
print(input_file)

wb = word.Documents.Open(input_file)
output_file = os.path.abspath(doc_pdf[0:-4]+"docx".format())
wb.SaveAs2(output_file,FileFormat=16)
print("Pdf to DOCx is completed")
wb.Close()
word.Quit()

标签: pythonpdfpywin32

解决方案


推荐阅读