首页 > 解决方案 > 为什么 TFIDF 被视为 gensim 中的模型?

问题描述

我熟悉 tfidf 矢量化器。

但是,在 gensim 中,tfidf 似乎被视为自身的模型,就像 LDA、LSI 等一样。

为什么会这样?例如,tfidf 不能不仅用于矢量化然后输入 LDA 模型吗?

文档链接:https ://radimrehurek.com/gensim/tut2.html

标签: pythongensim

解决方案


TFIDF 不是静态转换。

术语频率需要学习和存储(即它是一个模型)。

这意味着您可以使用一个语料库学习术语频率并用它转换另一个语料库,因此通过在 Gensim 中将其作为模型,它可以重复用于多个用例。

Gensim TFIDF

TFIDF 示例


推荐阅读