首页 > 解决方案 > 从单独的 data.frame r 将 docvars 添加到 dfm

问题描述

在花了很多时间开发正确的语料库(例如停用词、tf-idf)之后,我dtmtm包中创建了一个并运行了我的主题模型。

然后,我继续将主题与一些感兴趣的文档级协变量进行比较,只是为了了解这stm允许您使用感兴趣的文档级协变量来估计模型。

我已成功将 my 转换dtmdfminquanteda并希望dfm在转换为 a 之前将我的协变量添加到stm.

我有一个data.frame与我感兴趣的协变量,它们row.iddfm.

我正在寻找一种解决方案,将 的协变量data.framedfm.

我努力了:

docvars并无济于事metadocquanteda

例如,

docvars(dfm, docnames(dfm)) <- df$covariate

任何帮助将不胜感激!

标签: rtopic-modelingquantedadfm

解决方案


好的,我能够弄清楚。最后它非常简单。我只需要指定data.frame一个整体,而不仅仅是我感兴趣的列。这是代码:

dfm.w.metadata <- convert(dfm, to = "stm", docvars = df)


推荐阅读