首页 > 解决方案 > pdfminer.high_level 没有出现

问题描述

我正在尝试使用pdfminer.high_level.extract_text(). 我不断收到此错误消息:

File "/Users/ian/Documents/Resume Selector Project/resumeBackend.py", line 5, in digestResume
    text = pdfminer.high_level.extract_text
AttributeError: module 'pdfminer' has no attribute 'high_level'

起初,我认为这可能是我的模块没有在系统范围内安装的问题,但我相信我已经通过在我的项目所在的同一目录中运行 pdf2txt.py 消除了这个可能的原因。

我将附上我的代码以简化此问题的解决。

import pdfminer
print(pdfminer.__version__)
res = '~/Documents/Personal/Employment/Resumes/Resume\ 11/03/2020'
def digestResume(resume): #resume is a pdf file (as str)
    text = pdfminer.high_level.extract_text(resume)
    print(text)
    
digestResume(res)

标签: pythonpython-3.xmodulepdfminer

解决方案


为了使用pdfminer.high_level,你需要运行pip3 install pdfminer.six。然后为了在您的代码中使用该包,您需要import pdfminer.high_level在您的行之后添加该import pdfminer行。这是因为 Python 默认不会自动导入子包。


推荐阅读