machine-learning - 如何在 NLP 中实现增量学习
问题描述
我们正在构建一个系统,在该系统中,我们将从最初的非常少量的训练数据开始。工作是将传入的数据(文档,对于我们的例子)分为 2 类:A 类和 B 类。数据是文档,所以用户需要将文档分类为 A 类或 B 类。所以,数量有限数据,我们创建训练数据集,并开始使用训练数据集预测下一个文档的类别。
现在,如果预测正确,用户将移动到下一个文档。但是如果预测不正确,则用户输入正确的类别(假设类别 A 是系统预测的,其中对数据的正确分配应该是类别 B)。所以现在系统应该使用这种学习(B 类而不是 A 类)来近乎实时地丰富(学习)自己。
它应该只训练添加的数据,而不是已经训练的完整数据集。所以应该是增量学习。对于分类,我们将应用朴素贝叶斯分类。
现在的问题是:
- 我们如何实现增量训练,而不是每次都训练整个数据集?
- 我知道有像 Vowpal Wabbit & creme 这样的增量学习库。对于我的情况,使用这些库会是一个很好的解决方案吗?
解决方案
推荐阅读
- bash - 在 Bash 中多次渲染花括号
- node.js - 身份验证用户(NodeJs)时 ldap 无效凭证
- javascript - 如何使用 Phusion Passenger 更正此 ESM 错误?
- encryption - 对粉碎文件系统中的数据块进行签名意味着什么。我正在制作一个项目,以展示对共享数据的公开审计
- java - Java SimpleDateFormat 系统之间的不同行为
- sql - 用一个选择 sql 转置
- python - >= 在浮点数和字符串值之间的 TypeError
- flutter - 如何在返回特定屏幕之前调用方法
- reactjs - 如何在反应 dom 测试工具中等待一个元素?
- node.js - 预发布未在 npm install 中运行