python-3.x - NLTK - 如何获取频率分布大于特定数字的项目
问题描述
如果列表超过一定数量,我正在尝试获取列表的频率分布。
例子:
import nltk
test_list=['aa', 'aa', 'bb', 'cc', 'dd', 'dd']
test_fd = nltk.FreqDist(test_list)
回报:
FreqDist({'aa': 2, 'dd': 2, 'bb': 1, 'cc': 1})
没有循环,我正在寻找所有大于 1 的项目。
使用 Python 3.8 和 NLTK 3.5
解决方案
它可以完成,filter
您可以决定将 adict
或 a list
(元组)作为输出:
test_fd = dict(filter(lambda x: x[1] > 1, nltk.FreqDist(test_list).items()))
推荐阅读
- javascript - 从二维数组中检索元素
- c# - FloodFill 函数产生奇怪的结果
- sql - SQL 获取时间范围内的所有值 - 以及之前的值
- jmeter - JMeter:在 beanshell 后处理器中使用正则表达式提取器值来提取在另一个线程中使用它的值
- java - 在调试构建的每种方法中添加日志的优缺点是什么?
- java - 如果查询中存在不等式过滤器,则使用 FieldPath.documentId() (equals) 会引发“不能在多个属性上使用不等式过滤器”
- ios - 在 App Relaunch 如何调用 google 登录 iOS 的函数 sign(didSignInFor)
- automationanywhere - 如何在任何地方自动反转字符串中的单词
- python - 如何使用 matplotlib 显示两个动画图
- java - Java Robot 单击侧边按钮