首页 > 解决方案 > 如何在 pandoc 中处理 mediawiki 模板

问题描述

我想使用 pandoc 将Arch Wiki中的页面转换为 PDF 文件。这些是mediawiki页面。例如,使用“创建包”页面的源代码(我将该源代码保存到文件中CreatingPackages.wiki)。其中许多页面使用模板,格式如下:

{{Template name|param1|param2|...}}

可以恢复这些模板的代码(即 HTML 代码)。例如,模板{{AUR|package}}具有以下定义:

<span class="plainlinks archwiki-template-pkg">[https://aur.archlinux.org/packages/{{urlencode:{{{1}}}}}/ {{{1}}}]</span><sup><small>AUR</small></sup>

(参见Template:AUR 的模板源代码,特别是includeonlyHTML 标签中的部分。)

在 Arch Wiki 页面之一上的原始运行会出现问题,因为pandoc看到模板并且不知道如何处理它们。例如,这是一个转换命令:

pandoc -f mediawiki -t pdf CreatingPackages.wiki > test.pdf

生成的 PDF 还不错,但显然pandoc不知道如何处理模板,这会导致文本丢失和意外格式不正确。

如何指导pandoc如何处理模板?

标签: pdf-generationmediawikipandocfile-conversionmediawiki-templates

解决方案


推荐阅读