topic-modeling - 主题建模:LDA 和 BTM
问题描述
有人知道这里的主题建模吗?我非常需要帮助。
1) 什么是主题建模 2) 什么是潜在狄利克雷分配和双项主题建模?3)LDA和BTM有什么区别?4) 它们是如何工作的?
我找到了研究,但我无法理解其中的一些,尤其是 BTM,它很难找到(即使在 YouTube 中,也找不到教程)。
太感谢了。
解决方案
BTM 用于聚类短文本(例如调查答案、推特数据、短句),LDA 用于聚类长文本(例如新闻文章、整篇论文)。BTM 对单词-单词共现进行聚类,LDA 对单词-文档出现进行聚类。如果你喜欢 R,
- BTM 可以适合 R 包 BTM:https ://cran.r-project.org/web//packages/BTM/index.html
- LDA 可以适合 R 包主题模型: https ://cran.r-project.org/web//packages/topicmodels/index.html
显示的两个链接都包含论文中数学的链接
推荐阅读
- arrays - 命令在终端中工作,但不在 Bash 脚本中
- python - 如何将多个元素附加/扩展到一个数组中?
- jquery - 当用户单击表单按钮时显示模式并在用户单击 codeigniter 中的模式按钮时提交表单
- python - 在 otree 游戏设计中使用 Django 将数据从表单保存到数据库
- ios - IOS天气应用
- node.js - node.js then() 不工作
- python - xgboost回归预测相同的值
- java - 使用 new File(directory).mkdir() 创建文件时出错
- java - Java Compute C(n,k) 和使用 biginteger 的阶乘
- javascript - 只获取 load() jquery 的文本内部值,没有标签没有类没有 ids 没有样式