首页 > 解决方案 > 如何解释 LSA 模型的输出?

问题描述

我如何解释 LSA 模型的分数结果?我正在尝试映射模型生成的 20 个主题,以便为原始数据中的每个文档分配最佳主题。当我为我的词袋中的每个项目运行模型时,我得到(主题号,分数),如下面的结果所示:

lsamodel = LsiModel(doc_term_matrix, num_topics=number_of_topics, id2word = dictionary)
lsa_model[bow_corpus[4]]:

[(0, 0.47960019698800205),
**(1, 1.87627010110798),**
(2, -0.4148041538180048),
(3, -0.14321296502219583),
(4, -0.004929714143217327),
(5, 0.011034862817127776),
(6, 0.05731564273326846),
(7, 0.034381993016335224),
(8, -0.016394012325667732),
(9, -0.023030804467549456),
(10, -0.04199188057124101),
(11, -0.0199380589966581),
(12, 0.0840570000608748),
(13, 0.05658559965999413),
(14, -0.02755788798434797),
(15, -0.01360544056010624),
(16, 0.016274804083342316),
(17, 0.08380964130410912),
(18, 0.030767812155245045),
(19, -0.015090504866042933)]

主题 1 得分最高,这是否意味着它是词袋输入的最佳主题?这里的分数是什么意思?

标签: pythontopic-modelinglatent-semantic-analysis

解决方案


推荐阅读