首页 > 解决方案 > 即使我将目录下载到 nltk.data.path 的路径列表中,NLTK 也找不到路径

问题描述

运行时,nltk.data.path我得到以下目录:

nltk.data.path

['/home/alex/nltk_data',
 '/home/alex/miniconda3/envs/machinelearning/nltk_data',
 '/home/alex/miniconda3/envs/machinelearning/share/nltk_data',
 '/home/alex/miniconda3/envs/machinelearning/lib/nltk_data',
 '/usr/share/nltk_data',
 '/usr/local/share/nltk_data',
 '/usr/lib/nltk_data',
 '/usr/local/lib/nltk_data']

好的,现在我想下载 NLTKstopwords数据。

nltk.download('stopwords',download_dir='/home/alex/miniconda3/envs/machinelearning/nltk_data')

一切正常,但是当我调用stopwords操作系统错误时:

stopwords.words('english')[0:15]

OSError: No such file or directory: '/home/alex/nltk_data/corpora/stopwords/english'

好吧,我认为 NLTK 会查看整个路径列表。但本质上,这个错误表明它只是在寻找'/home/alex/nltk_data'没有找到数据并抛出错误。

标签: pythoninstallationnltk

解决方案


NLTK_DATA您没有为存储 NLTK 数据的目录设置环境变量。默认情况下,安装目录nltk_data位于您的主目录中。

您可以通过以下方式设置它:

NLTK_DATA='/home/alex/miniconda3/envs/machinelearning/nltk_data'

或使用默认/home/alex/nltk_data目录(将数据移到那里/符号链接那里)。

download_dir参数仅指示临时存储数据的位置。


推荐阅读