首页 > 解决方案 > 空间 | 是否可以删除短语匹配器中对长度的硬编码限制?

问题描述

我在 python3.6 上使用 Spacy 库,我有一个包含 700 个术语的数组和一个可以使用它的 PharseMatcher。

当我有 10-12 个术语时效果很好,但是当我使用很多术语时它会抛出错误:

ValueError: [T001] Max length currently 10 for phrase matching

当我在网上查找时,我发现的只是 Github项目中的这个问题

但似乎它在项目中没有进行任何更改就关闭了,在我尝试自己编写分类而不使用 Spacy PhraseMatcher 之前,有谁知道如何解决这个错误并在构建一个巨大的术语列表时PharseMatcher,或者也许可以通过 Spacy 或任何其他 python nlp/非 nlp 库推荐一种更好的方法来做这样的事情(将文本分类为主题)?

谢谢!

标签: pythonpython-3.xnlpspacymatch-phrase

解决方案


推荐阅读