python - 为什么 TFIDF 被视为 gensim 中的模型?
问题描述
我熟悉 tfidf 矢量化器。
但是,在 gensim 中,tfidf 似乎被视为自身的模型,就像 LDA、LSI 等一样。
为什么会这样?例如,tfidf 不能不仅用于矢量化然后输入 LDA 模型吗?
解决方案
TFIDF 不是静态转换。
术语频率需要学习和存储(即它是一个模型)。
这意味着您可以使用一个语料库学习术语频率并用它转换另一个语料库,因此通过在 Gensim 中将其作为模型,它可以重复用于多个用例。
推荐阅读
- swift - SWIFT:WKWebView:填写登录数据
- sprite - Godot - 我可以像素化一个节点(Sprite)吗?
- c# - 使用 vb.net,挂钩指定的 USB 键盘,接收所需控制的字符并将接收到的字符阻止到其余窗口
- python - 如何使用 request 和 bs4 发出多个请求
- r - 并行化函数 poly2nb {spdep}
- python - 安装新窗口后运行现有 python 程序时出现文件和目录错误
- python - 使用过滤器内核进行斑点检测
- html - 如何在 React 中部分应用链接或标签?
- r - 为什么 R 不显示双向方差分析的 f 值?
- android - Android Studio Emulator 大边框