首页 > 解决方案 > 将元数据添加到 pdf 文档 PyPDF2-在“详细信息”中可读

问题描述

在使用 pypdf2 更改 pdf 文件的元数据的帮助下,我编写了下面的代码以将新的元数据添加到运行完美的 pdf 文档中。不过,在打开文档的详细信息时,我无法查看新的元数据。如何查看详细信息中的新元数据?

注意:我需要添加对 Elasticsearch 可读的元数据“comments”

from PyPDF2 import PdfFileReader, PdfFileWriter

def editMeta(file, text):
    fin = open(file, 'rb')
    reader = PdfFileReader(fin)
    writer = PdfFileWriter()

    writer.appendPagesFromReader(reader)
    metadata = reader.getDocumentInfo()
    writer.addMetadata(metadata)

    writer.addMetadata({
        '/comments': text
    })

    fout = open(file, 'ab') 
    writer.write(fout)

    fin.close()
    fout.close()


if __name__ == "__main__":
    file = 'Test_Angebot.pdf'
    editMeta(file, '#cool')

通过 python 读取元数据:

def get_info(file):
    with open(file, 'rb') as f:
        pdf = PdfFileReader(f)
        info = pdf.getDocumentInfo()
    print(info)

标签: pythonelasticsearchpdfmetadata

解决方案


推荐阅读