python - 为什么来自 Gensim 的 Lsimodel 在采用相同输入时显示不同的输出?
问题描述
我正在做一个自然语言处理项目,当我尝试使用 gensim'API 获取 LSI 相似度矩阵时,每次运行我的代码时,LSImodel 都会给我一个不同的相似度矩阵。它们并不完全不同,但略有不同,就像上次数字之一是 -0.42562,但下次我运行我的代码时它会变为 -0.42116。它使我的休息分析完全改变。
Lsi = gensim.models.LsiModel
lsimodel = Lsi(corpus_tfidf, id2word=dictionary, num_topics=20)
lsi_similarity = similarities.MatrixSimilarity(lsimodel[corpus_tfidf])
我检查了我的输入 corpus_tfidf 和字典每次都是一样的。为什么会这样?有什么解决办法吗?
解决方案
推荐阅读
- amazon-web-services - 如果我知道 url,如何在 AWS 管理控制台的 S3 中找到该文件?
- php - 按顺序合并数组
- sql-server - 用于将数据表复制到另一个表表单 ListView VB.net 的 SQL Server 查询参数
- java - keyHolder.getKey() 返回 null
- python - 如何冻结所有 PyQt4 用户输入,直到后端进程完成?
- spring-boot - 如果由于消费者处理消息时出错而未发送手动确认,如何以及何时重新传递 Kafka 消息?
- c++ - 两个大型数组之间的 C++ 标准化互相关
- bash - 管道 | 在bash用法中?
- fabricjs - fabricJS - 带有 toSVG 的 SVG 参数
- r - 使用整个数据的 tidyverse 中的逐行操作