text-mining - Quanteda 合并一元和二元
问题描述
我想试验一下,如果在一个 DFM 中同时包含一元组和二元组可以改善我的文档分类。我想在一个 DFM 中同时创建一元和二元。从那里,我可以得到我的 TF-IDF 加权 DFM,同时考虑一元和二元。可能,我可以分别创建 unigram 和 bigram dfms,然后我可以合并它们。但是,我想知道 quanteda 是否有更有效的方法来做到这一点。我很欣赏你的回应。
解决方案
从 quanteda 页面得到它。它适用于这样的东西。
toks_skip <- tokens_ngrams(toks, n = 1:2)
推荐阅读
- angular - 如何让不同的 pages/views.cshtml 呈现独特的组件/指令?
- javascript - 使用图表js时如何更改图表中的颜色文本
- python - 在 QPlainTextEdit() 中禁用回车(按 Enter 键)
- c# - 禁用 HttpTrigger Azure 函数上的属性或应用程序设置不起作用
- android - 使用 SpannedgridLayoutManager 后,recyclerView 从顶部占用大量空间
- java - 对于 Git 文件系统层来说,具有根每次提交的单个 JSR203 存储是否是合理的设计?
- java - Hive:无法为 HDFS 中的现有数据创建外部表
- javascript - Eclipse在 html 文件中注释 javascript 代码时应用不正确
- python - 如何用 pytest 编写正确的测试?
- javascript - 是否可以在 javascript 中使用 NPM(由 angular 8 制作并转换为 NPM 的模块)甚至是原生反应?