首页 > 解决方案 > 使用 Doc2Vec 进行情感分类

问题描述

我对如何将Doc2Vec(使用 Gensim)用于 IMDB 情感分类数据集感到困惑。在对我的语料库进行训练后,我得到了 Doc2Vec 嵌入,并使用它构建了我的逻辑回归模型。如何使用它来预测新评论?sklearn TF-IDF 有一种变换方法,可以在对训练数据进行训练后用于测试数据,它在 Gensim Doc2Vec 中的等价物是什么?

标签: pythonnlpgensimdoc2vec

解决方案


要获取未见过文档的向量,请使用vector = model.infer_vector(["new", "document"]) Then feed vectorinto your classifier: preds = clf.predict([vector])


推荐阅读