首页 > 解决方案 > 使用 Python 从 pdf 文件中提取文本

问题描述

我想提取文本,包括 pdf 文件中的表格。

我试过了camelot。它不仅可以获取表格数据,还不能获取文本。

我也试过PDF2。它不能读汉字。

这是要阅读的pdf样本。

接下来我应该尝试什么?

谢谢你。

标签: pythonpdf

解决方案


推荐阅读