r - 如何为 ngram 列表创建频率表
问题描述
我有一个如下指定的二元组列表:
test_test_bigram
1: I would
2: would like
3: like to
4: to thank
5: thank the
---
4792: design features
4793: features .
4794: . Return
4795: Return to
4796: to text
我已将其转换为数据表,我想为每个 ngram(每一行)的频率创建一列。有人可以建议吗
另外,您能否介绍一下如何在 Ngrams 的情况下在 R 中进行情绪分析,我使用感测器进行逐行情绪分析,使用感测器进行“词袋”方法(单个词)
解决方案
您可以使用 tidyverse:
library tidyverse
test_test_bigram %>% distinct() %>% add_count()
如果您的二元数据集已经具有唯一值,您可以跳过distinct()
推荐阅读
- flutter - 如何使曲线角像使用剪辑路径或任何其他小部件附加的文件一样颤动?
- laravel - findWhere() 函数在 laravel 查询中的作用
- lua - ROBLOX 战斗系统脚本 - 语法错误:预期 ')' 在第 7 行关闭 '('),得到 ','
- php - Homestead 没有按预期工作,忽略配置文件
- gps - 更新——传感器通过 Atlas Scientific 硬件串行端口扩展器 8:1 连接到 Arduino Uno 的问题
- c++ - 指向存储整数的堆内存位置的指针
- sql - 插入分组数据
- javascript - 使用 jquery 和 javascript 进行地理定位
- php - 如何加密 .env 文件
- python - 如何用 python 的 pip 纠正这个问题