word2vec - word2vec评估结果解读
问题描述
我使用自己的数据集创建了词嵌入(Word2vec)。我使用 Gensim 模块来创建词嵌入。我想评估我的词嵌入。
我使用 Wordsim353 数据集来评估词嵌入。以下代码显示了评估的结果。
代码:
from gensim.test.utils import datapath
similarities = model.wv.evaluate_word_pairs(datapath('wordsim353.tsv'))
print(similarities)
结果:
((0.09410256722489568, 0.3086953732794174), SpearmanrResult(correlation=0.06101508426787973, pvalue=0.5097769955392246), 66.28895184135978)
我如何解释结果?
请帮我解释结果。
解决方案
我们评估词嵌入质量的方法是查看嵌入计算的相似度与人类判断分配的实际相似度的匹配程度。
您的 Pearson 和 Spearmanr 的 pValue 过高,大约为 0.3 (70%) 和 0.5 (50%)。我建议您应该使用预训练的词嵌入或收集更多数据集。
我努力用 glove-twitter-25 进行评估,并获得了非常好的 pvalue。
import gensim.downloader as api
from gensim.test.utils import datapath
m = api.load("glove-twitter-25")
m.evaluate_word_pairs(datapath("wordsim353.tsv"))
输出:
((0.36409317297819943, pvalue=2.969053896450154e-12), SpearmanrResult(correlation=0.36452011505868487, pvalue=2.788781738485533e-12), 2.26628895184136)
推荐阅读
- node.js - 在 node.js & Bot 框架 V4.4 中调试脚本日志中间件
- ruby - 为什么 Kernel#require 在 Ruby 中引发 LoadError?
- ios - 如何:删除单元格后将集合视图内容居中
- javascript - 将页面状态保存为链接
- c# - 如何编写一个可以在存在时调用的函数,但如果它不存在则不会引发错误(并被忽略)?
- javascript - 对象[key]满足前提条件的foreach键
- django-2.2 - 如何解决在 django 中播放视频的问题?
- node.js - 数组未在后端初始化
- c# - 将 JSON 反序列化为 .NET 多态对象集合,这些对象包含格式化为字符串的 Point 值
- sql - 如何在不使用视图的情况下在 Postgres 中制定此查询