python - 如何安装语言模型
问题描述
我正在探索将 NLP 用于一些机器学习项目。我通常使用 Jupyter notebooks 或 PyCharm 作为我的 IDE,通过 Anaconda 使用 python 对我的所有项目进行编码。
我想开始使用 spacy,并计划在不久的将来参加一个关于它的研讨会。有两个建议是我先做的。安装 spacy 并安装en_core_web_lg
语言模型。我完成了第一步,只需在 Anaconda 环境中搜索 spacy 包(常规方式)并安装即可。但是,就安装语言模型而言,我不太熟悉如何在我的计算机上执行此操作,因为它不是传统的软件包。
spacy 安装网站在此处引用:https ://spacy.io/models/en#en_core_web_lg可以使用以下方式安装此语言模型:
INSTALLATION
$ python -m spacy download en_core_web_lg
我假设这是通过终端的命令?我使用终端的经验不是很丰富,但尝试在其中一个命令行中输入上述命令并按下回车键,但什么也没发生。这是安装此模型的正确方法吗?我应该如何安装它?此外,出于教学目的,我们安装模型时究竟发生了什么?它存在于我们的计算机上,如果调用的话,可以在 Jupyter 笔记本中用于 NLP。
抱歉,如果这些问题看起来相当基本,我仍在努力学习这些新技术。任何帮助、参考或建议将不胜感激。
谢谢。
解决方案
确保使用 virtualenv 或 conda 激活您的环境,并按照@Aris 所述安装 spaCy。
安装 spaCy
pip install -U spacy
要安装特定模型,请使用模型名称(例如 en_core_web_lg)运行以下命令:
python -m spacy download [model]
要加载模型,请使用带有模型名称、快捷链接或模型数据目录路径的 spacy.load()。
import spacy
nlp = spacy.load("en_core_web_sm")
doc = nlp(u"This is a sentence.")
您也可以直接通过其全名导入模型,然后不带参数调用其 load() 方法。这也应该适用于以前版本的 spaCy 中的旧模型。
import spacy
import en_core_web_lg
nlp = en_core_web_lg.load()
doc = nlp(u"This is a sentence.")
推荐阅读
- c++ - SendInput() 与 GetAsyncKeyState() (WinAPI) 一起使用时会导致无限循环
- node.js - 如何自动重启nodejs cli脚本
- php - Eloquent 获取关系表点数最高的用户
- reactjs - 为什么'emailjs'没有被定义为no-undef?
- windows-10 - 如何使用注册表更改任务栏位置?
- javascript - 如何用返回媒体 url 的函数替换 HTMLMediaElement.prototype.play
- reactjs - 防止 msal-react 多次加载组件
- windows - 如何在下拉列表CComboBox中设置项目的高度
- excel - 使用 VBA for chrome 的超链接
- python - Python 和 MySQL 数据打印