python - 给定一个词,我们可以使用 Spacy 获得所有可能的引理吗?
问题描述
输入词是独立的,不是句子的一部分,但我想获得它所有可能的引理,就好像输入词在具有所有可能 POS 标签的不同句子中一样。我还想获得单词引理的查找版本。
我为什么要这样做?
我已经从所有文档中提取了引理,并且我还计算了引理之间的依赖链接的数量。我已经使用en_core_web_sm
. 现在,给定一个输入词,我想返回最常链接到输入词的所有可能词条的词条。
所以简而言之,我想token._lemma
用所有可能的词性标签复制输入词的行为,以保持与我计算的引理链接的一致性。
解决方案
我发现很难直接从 spaCy 中得到引理和变形,而不首先构造一个例句来给它上下文。这并不理想,所以我进一步观察,发现LemmaInflect做得很好。
> from lemminflect import getInflection, getAllInflections, getAllInflectionsOOV
> getAllLemmas('watches')
{'NOUN': ('watch',), 'VERB': ('watch',)}
> getAllInflections('watch')
{'NN': ('watch',), 'NNS': ('watches', 'watch'), 'VB': ('watch',), 'VBD': ('watched',), 'VBG': ('watching',), 'VBZ': ('watches',), 'VBP': ('watch',)}
推荐阅读
- app-store - 添加自定义 iOS App Store 开发者图标
- rust - 如何创建两个窗口,第一个显示 OrthographicCameraBundle,第二个显示 UICameraBundle?
- c# - 将文本(字符串值)附加到 txt 文件的每一行
- mongodb - MongoBD Compass querySrv ENODATA _mongodb._tcp.cluster0.yqxra.gcp.mongodb.net
- laravel - 如何在不使用 DB::raw 的情况下编写 Laravel 雄辩的查询,这样它就不必将 MySQL 严格模式设置为 false
- javascript - 使用 Google Apps 脚本问题将 Google 表单响应传输到 Google 表格
- php - 我无法创建登录名来登录帐户
- python - 如何捕获从 MYSQL 触发器(嵌入在另一个 py 脚本中)内部调用的 python 脚本的输出?
- python - Python asyncio 处理取消任务
- r - Stargazer 导出到 excel (xlsx)