首页 > 解决方案 > 批量转换PDF到txt Python

问题描述

我正在尝试转换一个名为“2017”的文件夹,其中包含 63 个 pdf 的最高法院成绩单。我需要它们是 txt 文件,以便我可以对它们进行文本分析。

我在这里看到了关于 R 中 pdf 到 txt 的问题,但不是针对 python 的。到目前为止,我已经尝试过:

像这样将pdf转换为txt

但是,它不会像我尝试的那样将转换后的文件保存到我计算机上名为 2017-txt 的新文件夹中。我已经在我的桌面上创建了这个名为 2017-txt 的文件夹。

有什么建议吗?它只是打印一个 pdf 名称列表。

标签: pythonpdf

解决方案


打印功能不输出文件。看起来您已注释掉的行应该正在执行文件写入。尝试删除这些行开头的 # 符号,看看你会得到什么。


推荐阅读