首页 > 解决方案 > 从/到 docx 转换时换行的 pandoc 处理

问题描述

我正在使用 pandoc 在 .docx 和 .org 格式之间进行转换,以便我可以在像 emacs 这样的纯文本编辑器中编辑它们。
pandoc 对换行符/换行符有自己的想法。

从 .docx 转换为 .org:

  1. 当 .docx 文档有换行符时,pandoc 会放置一个双换行符。
  2. pandoc 删除了多个有意的换行符。

示例:
test-doc.docx:


一号


线二号
线三号线

命令:
> pandoc -s test-doc.docx -o test-doc.org

输出 test-doc.org:


一号

线二号

线三号线

从 .org 转换为 .docx:

  1. Pandoc 删除换行符。

示例:
test-doc2.org:


第一行,
然后第二行。
命令:
> pandoc -s test-doc2.org -o test-doc2.docx

输出 test-doc2.docx:


第一行,然后第二行。

使用 pandoc --wrap 标志不会更正此行为。
此行为与使用 MS Word 和 Google Docs 创建的 .docx 文件相同。
在 .docx 和 markdown (.md) 格式之间转换时,此行为是相同的。
这是 Windows 上的 pandoc 版本 2.10.1。
我想让换行符在 .docx 和 .org 格式之间忠实地转换。
感谢您的任何建议。

标签: newlinedocxorg-modepandocline-breaks

解决方案


推荐阅读