marklogic - MarkLogic 中可填写的 PDF 到 XML 的转换
问题描述
我已经使用 MLCP 将一些 PDF 文件加载到 MarkLogic 中,然后通过 CPF 默认 PDF 转换将其转换为 XML。一些 PDF 是可填写的,但所填写的内容均未包含在转换中。有没有办法转换它?
解决方案
这些 PDF 表单是否已由用户填写?如果是这样,一些转换器不携带 PDF 表单数据。PDFTables 可以工作 - API 允许您将 PDF 转换为 XML,包括任何表单数据。
作为 Python 中的示例(可以使用任何语言):
import pdftables_api
c = pdftables_api.Client('my-api-key')
c.xml('input.pdf', 'output.xml')
推荐阅读
- javascript - 如何从类组件(父)更改功能组件(子)中的useState
- tomcat - TOMCAT - catalina.properties - 自定义变量
- javascript - 删除复杂对象中的元素
- java - 从另一个类创建对象的类调用方法时出现 NullPointerException
- python - 关于 Neo4j + Flask 登录项目的问题
- typescript - 无法将 isoWeekDay 与矩变量一起使用
- python - Pandas 通过检查列表元素是否包含值进行选择
- r - 防止 R 自动获取已安装软件包的最新版本?
- javascript - 是否可以查看 JSON 文件中的多个对象分组?
- python - 如何编写一个递归函数来计算几年后的硬币净值?