首页 > 技术文章 > LDA工具的来源

lovely7 2017-04-10 15:01 原文

1.一篇关于LDA原理的文章

http://blog.csdn.net/v_july_v/article/details/41209515?utm_source=tuicool&utm_medium=referral

 

2.一堆工具包

http://mengjunxie.github.io/ae-lda/topic-modeling.html

 

3.其中c++工具包 http://gibbslda.sourceforge.net/

使用教程 http://weblab.com.cityu.edu.hk/blog/luheng/2011/06/24/%E7%94%A8gibbslda%E5%81%9Atopic-modeling/#comment-87

需要在linux系统上运行

GibbsLDA ++,

 

4.其中python的使用教程 

gensim http://radimrehurek.com/gensim/index.html

中文版使用教程 http://blog.csdn.net/a1368783069/article/details/52088302

 

目前,暂时选择使用gensim

 

 


使用gensim

1.下载gensim,安装,https://pypi.python.org/pypi/gensim,选择的是gensim-1.0.1.win32-py2.7.exe (md5)版本

2.import gensim出现错误 No module named smart_open

解决办法:安装smart_open,https://pypi.python.org/pypi/smart_open,

使用命令 pip install smart_open-1.5.1.tar.gz

3.出现warning,855

UserWarning: detected Windows; aliasing chunkize to chunkize_serial
warnings.warn("detected Windows; aliasing chunkize to chunkize_serial")

解决办法:

导入gensim 之前,可以使用此代码抑制消息

import warnings
warnings.filterwarnings(action='ignore', category=UserWarning, module='gensim')

import gensim

 

推荐阅读