python - 为什么在 NMF 和 LDA 算法中使用 random_state 参数?使用每次生成的随机主题有什么好处?
问题描述
对于主题建模,
为什么在 NMF 和 LDA 算法中使用 random_state 参数?
使用每次生成的随机主题有什么好处?
解决方案
两者的算法都是随机的——这意味着它们使用随机性作为估计好的答案的一部分。这样做是为了使其易于处理,在 LDA 的情况下,整个模型是随机的,理想情况下为您提供答案的概率分布(称为“后验分布”),而是提供一个单一的、可能的答案作为估计。
所以答案是,在算法中使用随机性使得一个极其困难的问题在不到一百年的时间内计算起来变得更加简单和可行。
如果你要使用它们,我认为你最好研究一下它们,了解它们的工作原理和工作原理。使用您不了解的工具是有风险的,因为您并不真正知道该工具提供的结果实际上意味着什么。一个例子是所有“主题”中的数字词,概率非常低。这些概率的差异实际上是没有意义的——给定一个与后验不同的样本,你会得到不同的概率,在单词之间排名不同。
推荐阅读
- r - 仅使用系数矩阵预测 glm 回归,没有 glm 对象
- javascript - 如何在 Jquery 中为动态下拉列表创建循环?
- node.js - 如何向传入的响应数据添加属性?
- ios - 如何在iOS应用上的同一wifi网络中录制屏幕并广播到智能电视?
- c++ - 关于“::operator new”的问题
- sql - 如何使用两个单独的带有 SQL 的数组访问特定值(一个带有名称,另一个带有值)
- spark-streaming - 火花流不读取新的本地文件
- java - 在现代应用程序设计中,如何在 TransferOject 和 BusinessObject 之间实现 /
- python - Yolo v5 将所有 nginx 核心用于单个请求
- php - 为什么我在 PHP 中收到“通知:未定义的索引”错误