首页 > 解决方案 > Quanteda 合并一元和二元

问题描述

我想试验一下,如果在一个 DFM 中同时包含一元组和二元组可以改善我的文档分类。我想在一个 DFM 中同时创建一元和二元。从那里,我可以得到我的 TF-IDF 加权 DFM,同时考虑一元和二元。可能,我可以分别创建 unigram 和 bigram dfms,然后我可以合并它们。但是,我想知道 quanteda 是否有更有效的方法来做到这一点。我很欣赏你的回应。

标签: text-miningquanteda

解决方案


从 quanteda 页面得到它。它适用于这样的东西。

toks_skip <- tokens_ngrams(toks, n = 1:2)

推荐阅读