spacy - spaCy 仅使用某些组件
问题描述
我正在为我的项目使用 spaCy。它工作得很好,只是有点费时。我正在寻找减少处理时间的方法。我已经意识到调用nlp
我text
将执行许多操作:标记化、ner、...(此处的文档:https ://spacy.io/usage/spacy-101#pipelines );而在我的代码的某些部分,我只需要执行例如矢量化。是否可以仅应用管道的某些组件来减少处理时间?
解决方案
可以禁用模块并在必要时重新启用它们。当加速确实是一个问题时,请尝试使用管道功能,这可以加快加载文档的速度。
nlp = spacy.load("en_core_web_sm")
for doc in nlp.pipe(texts, disable=["tagger", "parser"]):
print([(ent.text, ent.label_) for ent in doc.ents])
推荐阅读
- php - codeigniter中的多个更新数据
- java - Java:如何在反转拆分词后将分隔符读回字符串?
- php - 如何使用 laravel Nova 更新多个表?
- java - 循环中的 Switch 语句,重复次数未知
- javascript - 未捕获的 SyntaxError:百里香模板中的无效或意外标记
- python - 如何在小时内获取元素数
- python - 使用 tf 函数而不是 for 循环 tensorflow 来获取切片/掩码
- r - 为什么“逻辑”参数为向量和小标题返回不同的输出
- c++ - clang++:错误:链接器命令在 ffmpeg 的 cpp 中失败,退出代码为 1(使用 -v 查看调用)
- spring-boot - 将 Spring Boot API 连接到 JSP 接口