首页 > 解决方案 > GenSim:我能找到一个更“传统”的模型吗?

问题描述

我正在试验漂亮的 GenSim 包并下载了 glove_42B_300D 数据集。

我有点惊讶地看到结果

model.most_similar('apple')

iphone
ipad
apples
blackberry
ipod
macbook
mac
android
google
microsoft

我的意思是,“苹果”这个水果怎么样?

出于我的目的,我需要这个含义,而不是苹果公司。

你能想到任何解决方案吗?谢谢。

标签: pythonmodelnlpdatasetgensim

解决方案


这很令人惊讶,但您可以尝试一些除glove_42B_300D.

也许是一组——根据GloVe 页面glove.6B,它似乎是从不同的数据中训练出来的?

或者,GoogleNews谷歌在 2013 年与原始word2vec.c代码一起发布的向量。参见:https ://code.google.com/archive/p/word2vec/

如果一切都失败了,您可以从更好地反映您想要表示的含义的训练文本中训练自己的向量。


推荐阅读