首页 > 解决方案 > 获取 mutool 以输出“结构化文本(作为 xml)”

问题描述

按照 mutool 对draw命令
https://mupdf.com/docs/manual-mutool-draw.html的说明

当输出“矢量格式”之一是“调试跟踪(作为 xml)”并且“从输出文件名推断输出格式”时,如何输出“结构化文本(作为 xml)”?

如果我跑

mutool draw -o "testfile.xml" "testfile.pdf"

看来我得到了“调试跟踪(作为xml)”文件格式。

我应该使用什么文件扩展名来确保输出“结构化文本(作为 xml)”格式?

标签: pdfmupdfstructured-text

解决方案


如果您运行不带参数的“mutool draw”,使用消息会告诉您支持哪些格式,以及它们的文件扩展名是什么。

在您的情况下,您需要“stext”输出。

mutool draw -o out.stext input.pdf
mutool draw -F stext -o out.xml input.pdf

或者,如果您更喜欢“mutool convert”命令,该命令使用 -O 参数支持高级输出选项。

mutool convert -o out.stext input.pdf

推荐阅读