python - 批量转换PDF到txt Python
问题描述
我正在尝试转换一个名为“2017”的文件夹,其中包含 63 个 pdf 的最高法院成绩单。我需要它们是 txt 文件,以便我可以对它们进行文本分析。
我在这里看到了关于 R 中 pdf 到 txt 的问题,但不是针对 python 的。到目前为止,我已经尝试过:
但是,它不会像我尝试的那样将转换后的文件保存到我计算机上名为 2017-txt 的新文件夹中。我已经在我的桌面上创建了这个名为 2017-txt 的文件夹。
有什么建议吗?它只是打印一个 pdf 名称列表。
解决方案
打印功能不输出文件。看起来您已注释掉的行应该正在执行文件写入。尝试删除这些行开头的 # 符号,看看你会得到什么。
推荐阅读
- python - 散景:如何在回调期间手动更新图形?
- rest - Yammer 休息 api - 民意调查
- python - 使用 tabula-py 从 PDF 中读取表格和文本
- android - AWS 通知消息未在 android 操作系统中注册?
- node.js - Node 服务器如何使用 Laravel 8 正确订阅 Redis 频道?
- c# - RestSharp 使用异步抓取多个 url
- android - 迁移到 Flutter 2 后的深色状态栏图标
- javascript - 如何从另一个异步函数中的异步函数中检索承诺
- questdb - 如何从 QuestDB 中的表中获取最新值?
- parsing - 如何使用自然语言查询搜索我自己的文档