python - 分数在主题建模中表示什么
问题描述
根据本教程 https://www.datacamp.com/community/tutorials/discovering-hidden-topics-python ,我将 gimsm 用于 LSA
我在运行它以获取文本列表后得到以下输出
[(1, '-0.708*"London" + 0.296*"like" + 0.294*"go" + 0.287*"dislike" + 0.268*"great" + 0.200*"romantic" + 0.174*"stress" + 0.099*"lovely" + 0.082*"good" + -0.075*"Tower" + 0.072*"see" + 0.063*"nice" + 0.061*"amazing" + -0.053*"Palace" + 0.053*"walk" + -0.050*"Eye" + 0.046*"eat" + -0.042*"Bridge" + 0.041*"Garden" + 0.040*"Covent" + -0.040*"old" + -0.039*"visit" + 0.039*"really" + 0.035*"spend" + 0.034*"watch" + 0.034*"get" + -0.032*"Buckingham" + 0.032*"Weather" + -0.032*"Museum" + -0.032*"Westminster"')]
-0.708 伦敦表示什么?
解决方案
这些是对你的主题最有贡献的词,无论是积极的还是消极的。您的主题的特征之一似乎是,它与伦敦没有任何关系。您可以看到其他“与伦敦相关的”词也对您的主题产生负面影响:威斯敏斯特、塔和眼睛对该主题也有负面影响。
因此,根据您的模型,如果文本缺少“伦敦”一词,则该文本与该主题有关是非常合理的。
推荐阅读
- c++ - 类静态变量初始化顺序
- java - 为 Websphere 中的 jar 文件提供属性文件
- angular - 如何在 Angular dart 中的兄弟组件之间共享数据
- html - 扩展不受 div 布局影响的线性渐变背景
- javascript - 根据第一个下拉列表的另一个选定复选框禁用下拉列表中的多个复选框
- excel - 如何计算excel同一列中两个单元格之间的差异?
- java - 面试问题Selenium Web Driver中页面可见元素后无法执行操作
- windows - 打开浏览器时的 Windows 身份验证
- sharepoint - 如何使用 PnP-PowerShell 获取 SharePoint 网站集和子网站的创建日期
- python - PyCharm中带有张量流的退出代码-1073741571(0xC0000FD)