首页 > 解决方案 > spaCy 仅使用某些组件

问题描述

我正在为我的项目使用 spaCy。它工作得很好,只是有点费时。我正在寻找减少处理时间的方法。我已经意识到调用nlptext将执行许多操作:标记化、ner、...(此处的文档:https ://spacy.io/usage/spacy-101#pipelines );而在我的代码的某些部分,我只需要执行例如矢量化。是否可以仅应用管道的某些组件来减少处理时间?

标签: spacy

解决方案


可以禁用模块并在必要时重新启用它们。当加速确实是一个问题时,请尝试使用管道功能,这可以加快加载文档的速度。

    nlp = spacy.load("en_core_web_sm")
    for doc in nlp.pipe(texts, disable=["tagger", "parser"]):
        print([(ent.text, ent.label_) for ent in doc.ents])

资源


推荐阅读