首页 > 解决方案 > 使用 HTMLDOC 将包含非英语字符(希腊语)的 HTML 转换为 pdf

问题描述

我使用 HTMLDOC (v.1.9.7) 将 html(我创建的)转换为 PDF。它很好用,但是当包含希腊字符时,我似乎无法创建正确的 PDF

这是我正在使用的最小 HTML 文件(test.html):

<!DOCTYPE html>
<html>
   <head>
      <meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
   </head>

   <body style="font-family: sans-serif">
      <font size="4" align="center"><strong>test τεστ</strong></font>
   </body>
</html>

这是 HTMLDOC 命令:

 htmldoc --webpage -t pdf -f test.pdf test.html 

结果是一个包含单词“test”和一些乱码的pdf文件。

我尝试了一些 HTMLDOC 参数,例如“--bodyfont Sans”、“--textfont Sans”* 和“--embedfonts”,但它们没有帮助。

我也尝试了这个(非常旧的)解决方案,但没有帮助。

* 文件指出:

添加了 DejaVu 字体集合,以更好地支持西里尔文和希腊文;新字体以通用名称“monospace”、“sans”和“serif”提供。

虽然我只能找到“sans”。

任何帮助都会很有价值...

标签: htmlpdffontscharsethtmldoc

解决方案


推荐阅读