python - GenSim:我能找到一个更“传统”的模型吗?
问题描述
我正在试验漂亮的 GenSim 包并下载了 glove_42B_300D 数据集。
我有点惊讶地看到结果
model.most_similar('apple')
给
iphone
ipad
apples
blackberry
ipod
macbook
mac
android
google
microsoft
我的意思是,“苹果”这个水果怎么样?
出于我的目的,我需要这个含义,而不是苹果公司。
你能想到任何解决方案吗?谢谢。
解决方案
这很令人惊讶,但您可以尝试一些除glove_42B_300D
.
也许是一组——根据GloVe 页面glove.6B
,它似乎是从不同的数据中训练出来的?
或者,GoogleNews
谷歌在 2013 年与原始word2vec.c
代码一起发布的向量。参见:https ://code.google.com/archive/p/word2vec/
如果一切都失败了,您可以从更好地反映您想要表示的含义的训练文本中训练自己的向量。
推荐阅读
- php - PHP中的多维JSON数组?
- model-view-controller - 在 godaddy plesk 文件 io 错误上运行 MVC 项目
- python - 服务器在 python django 中的 http://127.0.0.1:8000/admin/ 停止
- anylogic - 获取系统时间并转换为字符串
- java - 如何在此 JSONArray 的“语言”属性下获取“名称”?
- python - document 必须是 dict、bson.son.SON、bson.raw_bson.RawBSONDocument 或继承自 collections.MutableMapping 的类型的实例
- css - CSS 和 JS 在 cakephp 2.2.6 中无法通过 HTTPS 工作
- ruby-on-rails - 为什么 rails html_safe 方法会改变我的 html 结构?
- javascript - 虚拟主机:SSD 与 HDD 动画速度
- mysql - 如何找到每个部门的第 5 高薪水?