gensim - fastText 或 Gensim 如何从预训练数据 (.bin) 中训练额外数据?
问题描述
我从这个链接得到了一个关于预训练数据的文件:(.bin 文件)https://fasttext.cc/docs/en/crawl-vectors.html
我想在神经网络的输入层上使用这个文件(也许是它的形式向量)
我希望预先训练的数据了解更多的训练数据。(让我们将训练数据称为 data.txt。)
我已经使用 fasttext 和 genism 库加载了预训练模型,但是我不知道如何训练它们。
import fasttext
model = fasttext.load_model('model.bin')
#whatever using data.txt
或者
from gensim.models import FastText
model = FastText.load_fasttext_format('model.bin')
#whatever using data.txt
请指教。
解决方案
推荐阅读
- java - 保存为对象还是数据库中的一行?
- java - Android 设置辅助功能焦点监听器
- javascript - 在 php 中出现错误,无法以字母形式获取值
- angular - 显示标题字符串/templateRef Angular
- r - R 正则表达式捕获组并引用捕获的模式
- python - 有没有比这更好的方法来混合 websocket recv 和发送调用?
- javascript - 弃用警告:不推荐使用当前的服务器发现和监控引擎
- r - r中矩阵格式数据的相关性
- move - 如何在 Libra 测试网中创建自定义代币?
- javascript - 使用javascript的页脚asp.net core 2.2标签中的数据表页脚摘要