python - pdfminer.high_level 没有出现
问题描述
我正在尝试使用pdfminer.high_level.extract_text()
. 我不断收到此错误消息:
File "/Users/ian/Documents/Resume Selector Project/resumeBackend.py", line 5, in digestResume
text = pdfminer.high_level.extract_text
AttributeError: module 'pdfminer' has no attribute 'high_level'
起初,我认为这可能是我的模块没有在系统范围内安装的问题,但我相信我已经通过在我的项目所在的同一目录中运行 pdf2txt.py 消除了这个可能的原因。
我将附上我的代码以简化此问题的解决。
import pdfminer
print(pdfminer.__version__)
res = '~/Documents/Personal/Employment/Resumes/Resume\ 11/03/2020'
def digestResume(resume): #resume is a pdf file (as str)
text = pdfminer.high_level.extract_text(resume)
print(text)
digestResume(res)
解决方案
为了使用pdfminer.high_level
,你需要运行pip3 install pdfminer.six
。然后为了在您的代码中使用该包,您需要import pdfminer.high_level
在您的行之后添加该import pdfminer
行。这是因为 Python 默认不会自动导入子包。
推荐阅读
- r - raster::extract:创建数据框并使用缓冲区连接属性信息,但包括 NA 的问题
- go - 从指向 C-Char 数组的指针中获取字符串数据
- c++ - 我当前对双向链表类的实现是否需要对迭代器 end() 功能进行重组?
- c++ - 给定邻接列表有向图,如何仅获得 2 个节点之间的最短路径?
- angular - Windows 滚动上的 Angular EventListener 是如何工作的?
- excel - For-loop 停止而不是跳过一行
- java - 如何优雅地处理错误输入(JAVA)
- spring-boot - 将 Redis 用于应用程序属性
- php - PHP 将访问者分成两个不同的 url
- webforms - 带有图像的 HTTP POST 数据从 WebForm 到 .NET Web API,JSON 太大