r - 应用字典后如何在 quanteda 中查看标记
问题描述
这是我第一次在这里提问,如果我处理不当,请原谅。我使用 R 包 quanteda 来分析文本文档。
我现在的问题是,我想在应用我开发的字典后查看文本。为了应用字典,我对语料库进行了标记,但后来我找不到允许我查看标记化文本的函数或方法。我查看了 quanteda 网站和备忘单,但找不到任何解决方案。这基本上是我的代码的重要部分:
tokens_text_dict <- tokens_text %>%
tokens_lookup(dict_Info_priv, exclusive = FALSE)
编辑:将代码从评论移到问题:
text1 <- "a b c"
corpus1 <- corpus(text1)
tokens <- tokens(corpus1)
dict1 <- dictionary(list(A = "a")
tokens1_dict <- tokens_text %>%
tokens_lookup(dict1, exclusive = FALSE)
我正在寻找可以给出“A b c”的命令,它现在应该在 tokens1_dict 中。
我会很感激一些帮助!
最好的祝愿
雅尼克
解决方案
推荐阅读
- javascript - 我怎样才能让组件在反应中重新渲染
- sql - Oracle11G 中的查询语法
- algorithm - 假设所有元素都是不同的,那么最小元素可能位于最大堆中的哪个位置?
- javascript - Pass variable into page.evaluate
- d3.js - 如何在 D3 中将 unix 时间戳转换为日期对象?
- javascript - 为什么这个while循环永远循环?
- javascript - 使用正则表达式 javascript 基于字符串集的逗号分隔值分组
- javascript - Discord.js message.react 不是函数
- java - 在 Java 中创建具有多种数据类型的列表的最简单方法是什么?
- node.js - 使用 N-API 进行资源共享?