python-3.x - 使用 Python 从 Adobe Signed(电子签名)Acroforms 中提取表单字段数据
问题描述
我正在尝试从我上传到Adobe Sign并获得电子签名的电子签名 PDF 表单中提取字段名称和相应的字段值。请参阅链接:https ://documentcloud.adobe.com/us/en/ 。
在上传 PDF 表单之前,它是一个 Acroform,即包含表单域的可编辑 PDF。
从 Acroform PDF,我能够使用 PDFTK 提取字段名称和字段值。此外,在 Adobe Reader 上签署此表单后,虽然 PDF 不再可编辑(字段被锁定),但我仍然可以使用 PDFTK 从 PDF 文档中提取数据。
但是,在使用Adobe Sign请求和获取签名后,我很难使用 PDFTK 和 Python 提取字段名称和值。Adobe Sign 确实单独提供了表单字段,但我正在寻找一种使用 Python 的解决方案(它可以在 .py 脚本中包含诸如 PDFTK 之类的 shell 命令)从电子签名的 PDF 文档本身中提取字段名称和值。
任何人都可以使用Python提供解决方案来提取该文档的字段名称及其对应值(包括留空的字段)吗?
尝试使用以下 Adobe Signed PDF 表单: https ://drive.google.com/file/d/1r57yrPuvzYlXwg-0KPM9UQGhu8jgWcUs/view?usp=sharing (使用 Adobe Sign 签名) https://drive.google.com/file/ d/12NUyk7Jku4O1owBboyiCmk2ckpq8g26T/view?usp=sharing(无签名)
我也为另一个 Acroform 尝试了这个,但遇到了同样的问题。 https://www.pruadviser.co.uk/pdf/PIPF10000.pdf
解决方案
您将无法从 Adobe Signed PDF 中提取字段名称或值,因为该文档不再具有字段。这是一个“扁平化”的 PDF。文档中唯一的字段是持有证书的数字签名字段。您唯一的选择是使用 Adobe Sign API 将字段数据作为 CSV 文件在...
/agreements/{agreementId}/formData
推荐阅读
- visual-studio-2017 - 在 PackageReference 中使用通配符时,依赖项上的黄色三角形符号没有错误
- python - 熊猫选择要绘制的列
- .net - 等待一组任务的线程池线程最终能否为其他任务之一提供服务?
- c# - 需要 Smartsheet 回调控制器方法的 C# WebApi 示例
- sql-server - SQL Server 的 bcp 实用程序损坏 varbinary(max) 数据
- angularjs - 为什么从控制器更改值时指令模板中的 ng-model 不更新
- datetime - 如何获得当前年份?
- python - 如何为 pandas.DataFrame().index 添加后缀/前缀?
- reactjs - React native 无法读取属性“导航”是未定义的错误
- javascript - Flutter Openweather API 调用