首页 > 解决方案 > 使用 Python 从 Adob​​e Signed(电子签名)Acroforms 中提取表单字段数据

问题描述

我正在尝试从我上传到Adob​​e Sign并获得电子签名的电子签名 PDF 表单中提取字段名称和相应的字段值。请参阅链接:https ://documentcloud.adobe.com/us/en/ 。

在上传 PDF 表单之前,它是一个 Acroform,即包含表单域的可编辑 PDF。

从 Acroform PDF,我能够使用 PDFTK 提取字段名称和字段值。此外,在 Adob​​e Reader 上签署此表单后,虽然 PDF 不再可编辑(字段被锁定),但我仍然可以使用 PDFTK 从 PDF 文档中提取数据。

但是,在使用Adob​​e Sign请求和获取签名后,我很难使用 PDFTK 和 Python 提取字段名称和值。Adobe Sign 确实单独提供了表单字段,但我正在寻找一种使用 Python 的解决方案(它可以在 .py 脚本中包含诸如 PDFTK 之类的 shell 命令)从电子签名的 PDF 文档本身中提取字段名称和值。

任何人都可以使用Python提供解决方案来提取该文档的字段名称及其对应值(包括留空的字段)吗?

尝试使用以下 Adob​​e Signed PDF 表单: https ://drive.google.com/file/d/1r57yrPuvzYlXwg-0KPM9UQGhu8jgWcUs/view?usp=sharing (使用 Adob​​e Sign 签名) https://drive.google.com/file/ d/12NUyk7Jku4O1owBboyiCmk2ckpq8g26T/view?usp=sharing(无签名)

我也为另一个 Acroform 尝试了这个,但遇到了同样的问题。 https://www.pruadviser.co.uk/pdf/PIPF10000.pdf

标签: python-3.xpdfdata-extractionform-fields

解决方案


您将无法从 Adob​​e Signed PDF 中提取字段名称或值,因为该文档不再具有字段。这是一个“扁平化”的 PDF。文档中唯一的字段是持有证书的数字签名字段。您唯一的选择是使用 Adob​​e Sign API 将字段数据作为 CSV 文件在...

/agreements/{agreementId}/formData


推荐阅读