首页 > 解决方案 > 如何在 Python 中使用 LDA 构建数据框

问题描述

基于 37,000 篇文章文本,我实现了LDA mallet主题建模。每篇文章都进行了适当的分类,并确定了每篇文章的主要主题。

现在我想创建一个数据框,用 Python显示每篇文章的每个主题的百分比。

我希望数据框看起来像这样:


no |      Text     | Topic_Num_1 | Topic_Num_2 | .... | Topic_Num_25
01 | article text1 |   0.7529    |   0.0034    | .... | 0.0011
02 | article text2 |   0.3529    |   0.0124    | .... | 0.0001

....(37000 x 27 行)

我该怎么做?

+

我一直在做的所有代码都基于以下站点。

http://machinelearningplus.com/nlp/topic-modeling-gensim-python

如何查看每篇文章主题的所有概率列表?

标签: pythondataframelda

解决方案


推荐阅读