首页 > 解决方案 > 使用 SpaCyr 进行文本挖掘,可以做什么?

问题描述

最近,我建立了一个模型,可以使用 SpaCy 依赖解析、基于规则的匹配器和 nlp.pipe() 来检测数据集记录中的被动语态。为了更清楚,这里是项目的代码。

现在,我的问题是,有什么方法可以使用 Spacy 匹配器在 R 中使用 SpaCyr 完成这项任务?我自己找不到任何具体的东西,但我认为可能有一些方法可以让我自己构建具有类似功能的东西。

我也可以在 python 的 nlp.pipe() 中使用n_processes参数,因为我正在使用的数据集非常大。因此,如果有人对此也有任何想法,我也很想听听!

提前致谢!

标签: pythonrnlpspacytext-mining

解决方案


您可以将您的“被动规则”转换为基于 R 包 rsyntax https://cran.r-project.org/web/packages/rsyntax/index.html ( https://github.com/vanatteveldt/rsyntax ) 的逻辑 -逻辑显示在https://github.com/vanatteveldt/rsyntax/blob/master/Querying_dependency_trees.pdf 它允许使用 udpipe 或 spacyr 解析器的输出来构造带注释文本的查询。


推荐阅读