dataset - 拆分数据集以训练和测试 LDA 模型
问题描述
我有一个数据集,其中包含从 twitter 上抓取的大约 17000 个用户数据,我正在使用潜在的狄利克雷分配算法。我想拆分我的数据集,但我不确定什么是最好的方法。在训练 LDA 模型时拆分数据集的标准是什么。我正在使用 gensim 来训练 LDA 模型。谢谢
解决方案
推荐阅读
- php - Display images from outside of web directory
- c# - Discord 机器人反应数组
- go - Goroutine 阻止程序结束
- javascript - 从注入的代码发送消息到后台脚本
- vb.net - 标签中的文本显示为奇数符号 - VB.NET
- python - 在窗格窗口中使用滚动条调整 Treeview 的大小不起作用
- java - Netbeans 8.2 卡在加载屏幕消息日志
- r - 如何在 R 中对 table1 函数中的行进行子集化?
- javascript - 如何使用 react-phone-input-2 包中的 PhoneInput 显示错误消息?
- image-processing - 多类分类之前的图像背景去除/掩蔽 - 想法?