text - Spacy TextCategorizer 使用的 CNN 可以在哪里配置?
问题描述
根据 TextCategorizer 顶部的评论,
使用 TextCategorizer 组件在 IMDB 数据集上训练卷积神经网络文本分类器。数据集将通过 Thinc 的内置数据集加载器自动加载。该模型被添加到 spacy.pipeline,并且可以通过
doc.cats
. 有关更多详细信息,请参阅文档:* 培训:https ://spacy.io/usage/training
CNN 的代码在哪里?可以配置CNN吗?是否有实施所依据的研究论文?
解决方案
网络架构在函数内的 _.ml 模块中定义 build_text_classifier
。
与培训相关的代码在管道模块中,特别是在TextCategorizer
类中。
一些参数,如 drop_out、batch_size 和 epoch 的数量可以如示例中所示进行配置,您还可以修改网络的架构,但为此您必须了解 spaCy 背后的框架,称为 Thinc https://github .com/explosion/thinc和一些 Cython。
我不知道任何描述模型的论文,但这个视频提供了很好的描述https://www.youtube.com/watch?v=sqDHBH9IjRU
推荐阅读
- azure - 澄清可用性集如何使单个 VM 更可用
- php - WooCommerce 产品属性分类法不再是普通分类法了吗?
- java - Android Studio ColorPicker 输出转换为字节数组
- sql - 全名验证
- r - 向数据框添加新列。创建正确功能的问题。第二个输入参数未被识别为变量
- python - 检索具有不同参数的 Python 函数的执行时间
- excel - 用所有其他单元格减去单元格值并找到最大值
- laravel - 如何在共享主机上设置 laravel 7?
- reactjs - 为什么我不能在反应中动态创建上下文提供程序?
- android - 使用 FilePicker 接收我智能手机的所有音频文件并在 CUSTOM recyclerview 上显示它们