首页 > 解决方案 > 读取并重写到新文件后获取损坏的 PDF 文件

问题描述

我正在探索 PDF 文件格式并尝试编辑和操作其内部数据。问题是我注意到在对文件进行任何细微更改后我总是会收到损坏的文件所以我尝试了一个非常简单的示例来读取 pdf 数据并将其重写为新的“file.pdf”而不进行任何更改,如下所示:

file = open('sample.pdf','r',encoding='ansi').read()
file_ = open('output.pdf','w').write(file)

但是我又得到了一个损坏的文件(无法使用 Adode 阅读器打开),所以我尝试使用 Google Chrome 打开它并且它工作正常但字体已更改为默认字体而不是原始字体文件。

我打开输入和输出文件并使用notebad++进行比较,两个文件完全匹配!

我还打开了输出文件并复制了它的内容并将其粘贴到输入文件中,令人惊讶的是,它运行良好,与输入文件完全一样。

有什么想法有什么问题吗?

标签: python-3.xpdf

解决方案


推荐阅读