python - 空间 | 是否可以删除短语匹配器中对长度的硬编码限制?
问题描述
我在 python3.6 上使用 Spacy 库,我有一个包含 700 个术语的数组和一个可以使用它的 PharseMatcher。
当我有 10-12 个术语时效果很好,但是当我使用很多术语时它会抛出错误:
ValueError: [T001] Max length currently 10 for phrase matching
当我在网上查找时,我发现的只是 Github项目中的这个问题
但似乎它在项目中没有进行任何更改就关闭了,在我尝试自己编写分类而不使用 Spacy PhraseMatcher 之前,有谁知道如何解决这个错误并在构建一个巨大的术语列表时PharseMatcher,或者也许可以通过 Spacy 或任何其他 python nlp/非 nlp 库推荐一种更好的方法来做这样的事情(将文本分类为主题)?
谢谢!
解决方案
推荐阅读
- reactjs - 当我设置相同的状态值时,如何避免触发 useEffect?
- sql - MariaDB 如何处理已经系统版本化的表
- python - 能不能用pandas过滤亿万行数据
- javascript - 如何根据订单号通过文本删除特定的 Li 标签?
- html - 为什么这些框不能垂直对齐?
- javascript - for ... 在 if 语句之后的语句中
- swift - 关于 swift5 和 alamofire5,如何使用 AF.request 检查登录是否成功?
- java - Spring Batch 中 SimpleJobBuilder 和 FlowJobBuilder 的区别?
- c++ - 有没有办法让 CGAL 的折线简化适用于内部/共享边界?
- javascript - 如何在 sass 中访问环境变量?