首页 > 解决方案 > 将 Word 文档另存为 UTF-8 编码的 HTML

问题描述

我有一个将 Word 文档保存为 HTML 的 Perl 脚本。以下代码有效:

use strict;
use Win32::OLE::Const 'Microsoft Word';
[...]
$go_word_doc->SaveAs2({
    FileName => $gs_html_name,
    FileFormat => wdFormatFilteredHTML
    });

为了以 UTF-8 编码输出文件,我写了这个:

use strict;
use Win32::OLE::Const 'Microsoft Word';
use Win32::OLE::Const 'Microsoft Office [0-9.]+ Object Library';
[...]
$go_word_doc->SaveAs2({
    FileName => $gs_html_name,
    FileFormat => wdFormatFilteredHTML,
    Encoding => msoEncodingUTF8
    });

代码运行,但生成的文件未正确编码。

然后我想知道如何进行。我阅读了有关使用 WebOptions 的信息,但我找不到如何解决它们。

有人可以帮忙吗?提前致谢。

标签: perlutf-8win32ole

解决方案


推荐阅读