python - 使用 Python 将 DOC 转换为 DOCX,无需将中间输出文件写入磁盘
问题描述
问题:
使用Python 脚本转换
input_file.doc
为output_file.docx
我需要使用 python 脚本来做到这一点,因此我只能使用能够理解命令的软件。正如我的研究表明的那样,唯一的方法是使用Word
它自己(手动甚至自动),或者称为 的特殊 MS 实用程序wordconv.exe
,它可以通过 cmd 处理此任务,并且自 2007 年以来与任何 MS Office 捆绑在一起。
任何其他软件都不适合我,因为我的文件包含很少使用的文本格式。
所以,唯一的方法是wordconv.exe
,可以使用这样的命令运行:
wordconv.exe -oice -nme <input file> <output file>
对我来说,绊脚石是wordconv.exe
输出是写入硬盘的文件。所以,我需要处理所有的过程:
- 转换文件
- 从磁盘读取
- 读取后删除文件
由于许多不必要的操作,所有这些都使我的工作变得慢得多。
我想知道如何以其他方式捕获(可能像控制台中的输出)output_file.docx
?STDOUT
解决方案
推荐阅读
- makefile - 如何在使用并行执行时使用特定于目标的变量值并调用其他规则?
- affinity - 对大量进程设置进程亲和性
- mongodb - 在两个 MongoDb 索引中有相同的字段是多余的吗?
- aws-lambda - 如何从外部 SQS 队列活动触发 AWS Lambda 函数
- ios - 2个CGPoints之间的半圆
- css - 真的没有 CSS @keyframes 事件吗?那么我们必须将一个动画分解为几个动画并使用延迟将它们排列起来?
- angular - TranslateService.use() 工作一半的时间(ngx-translate)
- python - 动态添加内置方法以指向属性的内置方法
- javascript - 无法在 ngx-bootstrap 的 Carousel 组件上动态更改每张幻灯片的项目
- angular - 无法从 ag-grid-angular 隐藏默认文本行