python - 将元数据添加到 pdf 文档 PyPDF2-在“详细信息”中可读
问题描述
在使用 pypdf2 更改 pdf 文件的元数据的帮助下,我编写了下面的代码以将新的元数据添加到运行完美的 pdf 文档中。不过,在打开文档的详细信息时,我无法查看新的元数据。如何查看详细信息中的新元数据?
注意:我需要添加对 Elasticsearch 可读的元数据“comments”
from PyPDF2 import PdfFileReader, PdfFileWriter
def editMeta(file, text):
fin = open(file, 'rb')
reader = PdfFileReader(fin)
writer = PdfFileWriter()
writer.appendPagesFromReader(reader)
metadata = reader.getDocumentInfo()
writer.addMetadata(metadata)
writer.addMetadata({
'/comments': text
})
fout = open(file, 'ab')
writer.write(fout)
fin.close()
fout.close()
if __name__ == "__main__":
file = 'Test_Angebot.pdf'
editMeta(file, '#cool')
通过 python 读取元数据:
def get_info(file):
with open(file, 'rb') as f:
pdf = PdfFileReader(f)
info = pdf.getDocumentInfo()
print(info)
解决方案
推荐阅读
- python - 即使我使用的是范围,浮点对象也是不可迭代的
- c++ - 类不能使用 boost::json 序列化自己
- javascript - 为.pdf链接抓取网页并将所有匹配的链接写入nodeJS中的文本文件
- php - 修改容器内的 JSON 配置文件的问题 (PHP)
- docker - docker容器中gitlab runner的Maven存储库?
- sql-server - 无法通过 localhost SQL Server 连接字符串中的指定用户登录
- python - Python请求标头我可以使用二维字典吗?
- blockchain - 为闹钟搭建链环节点
- laravel - npm run watch/hot 仅在第一次运行时成功
- javascript - 如何将嵌套对象展平为对象数组