首页 > 解决方案 > Spacy TextCategorizer 使用的 CNN 可以在哪里配置?

问题描述

根据 TextCategorizer 顶部的评论,

使用 TextCategorizer 组件在 IMDB 数据集上训练卷积神经网络文本分类器。数据集将通过 Thinc 的内置数据集加载器自动加载。该模型被添加到 spacy.pipeline,并且可以通过doc.cats. 有关更多详细信息,请参阅文档:* 培训:https ://spacy.io/usage/training

CNN 的代码在哪里?可以配置CNN吗?是否有实施所依据的研究论文?

标签: textconv-neural-networkspacycategorization

解决方案


网络架构在函数内的 _.ml 模块中定义 build_text_classifier

与培训相关的代码在管道模块中,特别是在TextCategorizer类中。

一些参数,如 drop_out、batch_size 和 epoch 的数量可以如示例中所示进行配置,您还可以修改网络的架构,但为此您必须了解 spaCy 背后的框架,称为 Thinc https://github .com/explosion/thinc和一些 Cython。

我不知道任何描述模型的论文,但这个视频提供了很好的描述https://www.youtube.com/watch?v=sqDHBH9IjRU


推荐阅读