首页 > 解决方案 > MarkLogic 中可填写的 PDF 到 XML 的转换

问题描述

我已经使用 MLCP 将一些 PDF 文件加载到 MarkLogic 中,然后通过 CPF 默认 PDF 转换将其转换为 XML。一些 PDF 是可填写的,但所填写的内容均未包含在转换中。有没有办法转换它?

标签: marklogicmarklogic-9pdf-conversionmlcp

解决方案


这些 PDF 表单是否已由用户填写?如果是这样,一些转换器不携带 PDF 表单数据。PDFTables 可以工作 - API 允许您将 PDF 转换为 XML,包括任何表单数据。

作为 Python 中的示例(可以使用任何语言):

import pdftables_api

c = pdftables_api.Client('my-api-key')

c.xml('input.pdf', 'output.xml')

推荐阅读