pdf-generation - 如何在 pandoc 中处理 mediawiki 模板
问题描述
我想使用 pandoc 将Arch Wiki中的页面转换为 PDF 文件。这些是mediawiki
页面。例如,使用“创建包”页面的源代码(我将该源代码保存到文件中CreatingPackages.wiki
)。其中许多页面使用模板,格式如下:
{{Template name|param1|param2|...}}
可以恢复这些模板的代码(即 HTML 代码)。例如,模板{{AUR|package}}
具有以下定义:
<span class="plainlinks archwiki-template-pkg">[https://aur.archlinux.org/packages/{{urlencode:{{{1}}}}}/ {{{1}}}]</span><sup><small>AUR</small></sup>
(参见Template:AUR 的模板源代码,特别是includeonly
HTML 标签中的部分。)
在 Arch Wiki 页面之一上的原始运行会出现问题,因为pandoc看到模板并且不知道如何处理它们。例如,这是一个转换命令:
pandoc -f mediawiki -t pdf CreatingPackages.wiki > test.pdf
生成的 PDF 还不错,但显然pandoc不知道如何处理模板,这会导致文本丢失和意外格式不正确。
如何指导pandoc如何处理模板?
解决方案
推荐阅读
- python - 我是python新手,有人可以向我解释一下这种语法吗?
- java - 在 Spring JPA 中持久化键值对的有效数据结构是什么?
- html - 如何在容器流体(引导程序)中使用自定义 div 时修复 div 重叠
- amazon-web-services - elastic/elasticsearch:在 AWS 集群上使用 volumeClaimTemplate 卡在挂起状态的 Pod
- javascript - 我可以在 Jquery Ajax 成功功能中添加另一个按钮,以便更好地控制
- qt - Qt 3D 渲染很慢
- azure-cosmosdb - 在 Azure Cosmos SQL API 中查询大量数据
- python - Python 在 .txt 文件之间复制一行时添加空格 [3.9.4]
- macos - SwiftUI macOS 侧边栏基于列表的导航与弹出
- python - Keras LSTM 从 CSV 加载数据“预期 ndim=3,发现 ndim=2。收到完整形状:(无,150)”