首页 > 解决方案 > 为什么在 NMF 和 LDA 算法中使用 random_state 参数?使用每次生成的随机主题有什么好处?

问题描述

对于主题建模,
为什么在 NMF 和 LDA 算法中使用 random_state 参数?
使用每次生成的随机主题有什么好处?

标签: pythonldatopic-modelingnmf

解决方案


两者的算法都是随机的——这意味着它们使用随机性作为估计好的答案的一部分。这样做是为了使其易于处理,在 LDA 的情况下,整个模型是随机的,理想情况下为您提供答案的概率分布(称为“后验分布”),而是提供一个单一的、可能的答案作为估计。

所以答案是,在算法中使用随机性使得一个极其困难的问题在不到一百年的时间内计算起来变得更加简单和可行。

如果你要使用它们,我认为你最好研究一下它们,了解它们的工作原理和工作原理。使用您不了解的工具是有风险的,因为您并不真正知道该工具提供的结果实际上意味着什么。一个例子是所有“主题”中的数字词,概率非常低。这些概率的差异实际上是没有意义的——给定一个与后验不同的样本,你会得到不同的概率,在单词之间排名不同。


推荐阅读