首页 > 解决方案 > 使用本地 nltk_data 的 Python NLTK

问题描述

我最近一直在使用 NLTK 库进行语言处理。如果我可以访问互联网等,我通常可以使用 nltk.download('package') 安装包。

问题出现了,如果我尝试在集群上离线运行我的代码。这里,

from nltk.tag import PerceptronTagger
ImportError: cannot import name 'PerceptronTagger'

并且出现了类似的错误,因为 nltk 似乎无法找到 nltk_data 文件夹。我试过了:

  1. nltk.data.path.append("./nltk_data"),我复制了 nltk_data 和代码。

  2. nltk.download('punct') #,download_dir="./nltk_data"),但这不起作用,因为没有互联网访问。

那么问题是,我如何在本地使用 nltk_data ?

谢谢。

标签: python-3.xnltk

解决方案


看来我运行它的机器有 NLTK 3.0.2,因此更新 NLTK 一起解决了这个问题。


推荐阅读