python - 使用 Doc2Vec 进行情感分类
问题描述
我对如何将Doc2Vec(使用 Gensim)用于 IMDB 情感分类数据集感到困惑。在对我的语料库进行训练后,我得到了 Doc2Vec 嵌入,并使用它构建了我的逻辑回归模型。如何使用它来预测新评论?sklearn TF-IDF 有一种变换方法,可以在对训练数据进行训练后用于测试数据,它在 Gensim Doc2Vec 中的等价物是什么?
解决方案
要获取未见过文档的向量,请使用vector = model.infer_vector(["new", "document"])
Then feed vector
into your classifier: preds = clf.predict([vector])
。
推荐阅读
- python - 我正在尝试在 Python 中使用 OpenCV 测量地块面积
- spring - FindByIndexNameSessionRepository “RedisConnectionFactory is required”配置错误
- c++ - 如何在 C++ 中使用带有提交字段的 CURL formadd 上传文件?
- c++ - std::string 改变大小但不满足
- python - 列匹配但在python中打印其他列的值
- r - R:如何总结类别?
- linq - 如何在 LINQ 中写入 count(ColumnName)?
- java - Eclipse Maven 项目点抛出 File.not.Found 错误
- authentication - 如何使用 istio ingress 启用基于 cookie 的身份验证
- python - 查询从 Logistic 回归得到的概率